Extracción de conocimiento operativo a partir de descripciones en lenguaje natural
Laburpena
Este proyecto fin de grado se enmarca en un proyecto de investigación que trata de obtener conocimiento sobre procesos de fabricación realizados por personas, a partir de las descripciones en lenguaje natural que estas personas hacen de los procesos. Debido a la finalización efectiva del proyecto Elkartek en el que se enmarca este proyecto y a la situación creada por la pandemia, se ha tenido que restringir el dominio de aplicación para que fuera abordable en estas condiciones. Los procesos de fabricación se han convertido en recetas de cocina descritas oralmente.
Por un lado, se capturan estas descripciones orales de los procesos creando una base de datos de audio. Después, se realizan las transcripciones de los registros a documentos de texto. Por último, se hace el análisis del texto, para extraer el conocimiento sobre el proceso a partir de la codificación del discurso. Este conocimiento se hace accesible al usuario, mediante un mecanismo de consultas interactivas, para que se consiga extraer información de interés.
La alumna partía sin tener conocimientos previos sobre el procesamiento del lenguaje natural. Para la realización del proyecto, se ha tenido que investigar sobre las diferentes capacidades que ofrece la plataforma de Google Cloud, y se ha centrado en los servicios de transcripción, análisis de voz y lenguaje natural que proporciona. Además, se ha buscadoinformación dediferentestécnicasy aplicaciones quepuedatener.Asimismo, se han analizado varias herramientas abiertas para el lenguaje de programación Python, que soportan el desarrollo de proyectos de procesamiento del lenguaje natural.
En el aspecto formativo y personal, gracias a este proyecto se ha aprendido a trabajar de forma más autónoma, solucionando diferentes dudas y resolviendo problemas que han ocurrido durante su desarrollo. También se ha aprendido a gestionar mejor el trabajo, ya sea para investigar diferentes posibilidades o herramientas nuevas, como para la implementación y documentación del proyecto.