Identificador automático de relaciones temporales en textos clínicos basado en redes neuronales
Fecha
2019-12-19Autor
Andrés Santamaría, Edgar
Metadatos
Mostrar el registro completo del ítemResumen
Resumen: el proyecto constituye una aproximación de un identificador automático de relaciones temporales en textos clínicos basado en redes neuronales, el sistema es funcional y cuenta con la evidencia de un prototipo de alta fidelidad capaz de concretar la aplicación de técnicas ‘natural language processing’ NLP, ‘machine learning’ ML y ‘deep learning’ DL.
En cuanto a la estructura del proyecto, cuenta con una introducción, que busca nutrir al lector de información suficiente para apoyar la lectura técnica, además se expone el Documento de Objetivos del Proyecto, donde se puede encontrar toda la información relativa a la gestión del proyecto, por otro lado se expone un compendio del estado del arte, en que nos hemos inspirado para las aproximaciones realizadas hasta el prototipo de alta fidelidad, después se detalla el: análisis, diseño e implementación realizados para el desarrollo del prototipo de alta fidelidad del sistema basado en BiLSTM + CRF, así como otros experimentos realizados, este desarrollo cuenta con resultados parciales que se exponen en las pruebas y de paso se contrastan con la competición internacional ‘i2b2’, actualizando el estado del arte en extracción de conceptos clínicos y expresiones temporales, por último se tratan los prototipos generados durante el proyecto, y se concluye con una crítica del proyecto, así como los trabajos futuros a realizar sobre el mismo.
Por último, consideramos que sería buena idea la utilización del presente proyecto para futuras aproximaciones a nuevas áreas de aplicación, ya que el sistema descrito se considera genérico, y la dificultad en dichos acercamientos residiría en la generación del conjunto de entrenamiento pudiendo aprovecharse el formato IOB de dicha tarea, y unos ‘word embeddings’ pre entrenados concretamente para el acercamiento que se realice. Abstract: the project is an approximation to an automatic temporal relation identifier for clinical texts based on neural networks, the system is functional an has an evident high fidelity prototype that could accurate how to apply techniques as: natural language processing NLP, machine learning ML and deep learning DL.
The project structure has an introduction to immerse lecturer into technical signature, moreover it has a project objectives document where it could be found all management information used to manage the project, in addition it has a state of the art summary into which we inspired our experiments trough the final prototype, later we detail the process of: analysis, design and implementation, based on BiLSTM + CRF to achieve high fidelity prototype, and other experiments made, we also have partial results summarized in testing section and we contrast the system with ‘i2b2’ international challenge, in this case we update the current state of the art in clinical concept extraction and time expression extraction tasks, finally we show the prototypes made for the system, and we review the work made, and besides we expose the future works on system.
We finally suggest the use of the present work in future approximations into new application areas, because of the system is generic and the difficult would be in the data generation, it could be used the IOB format and pre trained word embedding s relative to the task studied. Laburpena: proiektua da sare neuronaletan oinarritutako testu klinikoetako denborazko erlazioko identifikatzaile automatikoko hurbilketa, sistema funtzionala da eta du ‘processing-a language naturala’ teknika aplikazioa NLP-a, ‘learning-a’ ML ‘machine-a’ eta ‘learning-a’ DL ‘deep-a’ zehazteko goi-fidelitate gaiko prototipo baten ziurtasuna.
Proiektuaren, sarrerarekiko kontuaren irakurketa teknikoaren alde agertzeko informazio nahikoko elikatzea irakurleari| bilatzen duenaren, egiturari dagokionez gainera Proiektuaren Helburuetako Dokumentua erakusten da, proiektuaren kudeaketari buruzko informazio guztia aurki dezakeen tokian, bestalde erakusten da artearen egoeraren| laburpen bat, egindako goi-fidelitate-prototiporainoko hurbilketetarako inspirazioa hartu dugunaren, gero zehazten du: analisiak, diseinua eta inplementazioa BiLSTM-etan oinarritutako sistemaren goi-fidelitateko prototipoaren garapenerako egindakoak + CRF-a, egindako beste esperimentu batzuk bezala horrela, garapen honek ditu probetan eta iragaitzaz erakusten diren emaitza partzialak egiaztatzen dute ‘i2b2' nazioarteko lehiaketarekin, artearen egoera kontzeptu klinikoko erauzketan etadenborazko adierazpenetan eguneratuz, azkenik proiektuan zehar sortutako prototipoak tratatzen dira, eta amaitzen du proiektuaren kritikarekin, baita ere beraren gainean egiteko etorkizuneko lanekin.
Azkenik, pentsatzen dugu ideia ona izango litzatekeela aplikazio-area berrietara etorkizuneko hurbiltzeetarako oraingo| proiektuaren erabilera, deskribatutako sistema generikotzat hartzen denez gero, eta aipaturiko hurbiltzeetako zailtasuna entrenamendu-tmultzoan etzango litzatekeela IOB-a aipaturiko zereginaren formatua, eta ‘embeddings-a’ zehazki egiten den hurbiltzerako aurre entrenatutako ‘word’ batzuk aprobetxatu ahal izanez.