Análisis predictivo para clasificar dígitos escritos a mano utilizando la base de datos MNIST
Ikusi/ Ireki
Data
2016-10-03Egilea
Ruiz Vivanco, Omar Alexander
Laburpena
En el presente trabajo de fin de máster se realiza una investigación sobre las
técnicas de preproceso del dataset de entrenamiento y la aplicación de un modelo
de predicción que realice una clasificación de dı́gitos escritos a mano. El conjunto
de dataset de train y test son proporcionado en la competencia de Kaggle: Digit
Recognizer y provienen de la base de datos de dı́gitos manuscritos MNIST.
Por tratarse de imágenes las técnicas de preproceso se concentran en obtener
una imagen lo más nı́tida posible y la reducción de tamaño de la misma, objetivos
que se logran con técnicas de umbralización por el método de Otsu, transformada
de Wavelet de Haar y el análisis de sus componentes principales. Se utiliza Deep
Learning como modelo predictivo por ajustarse a este tipo de datos, se emplean
además librerı́as de código abierto implementadas en el lenguaje estádisto R.
Por último se obtiene una predicción con las técnicas y herramientas mencio-
nadas para ser evaluada en la competencia de Kaggle, midiendo y comparando los
resultados obtenidos con el resto de participantes.