Show simple item record

dc.contributor.advisorPérez de la Fuente, Jesús María ORCID
dc.contributor.authorArostegui Carrasco, Asier
dc.contributor.otherMáster Universitario en Ingeniería Computacional y Sistemas Inteligentes
dc.contributor.otherKonputazio Ingeniaritza eta Sistema Adimentsuak Unibertsitate Masterra
dc.date.accessioned2022-12-23T10:11:47Z
dc.date.available2022-12-23T10:11:47Z
dc.date.issued2022-12-23
dc.identifier.urihttp://hdl.handle.net/10810/58983
dc.description.abstractLos problemas de clasificación de bases de datos desbalanceadas constituyen un paradigma específico dentro del Machine Learning que ha sido ampliamente estudiado en los últimos años y que puede ser abordado desde distintos puntos de vista. Hay distintos tipos de aproximaciones a este problema: las más comúnmente encontradas en literatura son aquellas de tipo algorítmico, las de selección de atributos (features) y las de tratamiento de datos o remuestreo. La ventaja de las aproximaciones de tratamiento de datos es que son versátiles y pueden aplicarse a cualquier tipo de algoritmo y se basan en la aplicación de un remuestreo de las instancias disponibles para tratar de balancear la clase minoritaria, con una aproximación clásica de rebalanceo al 50%. Este trabajo plantea un doble objetivo: por un lado, extender análisis empíricos previos que muestran que la distribución óptima no tiene por qué ser la del 50% que plantearon las primeras hipótesis y que dependerá del tipo de problema o conjunto de datos a estudiar, del tipo de clasificador elegido, del tipo de algoritmo de remuestreo aplicado y de la métrica que se defina para la evaluación del clasificador, lo que se refiere típicamente como dependencia del contexto. Del análisis de resultados, se comprobará si alguna de las variables de contexto obtiene un mejor desempeño que otra sobre el universo de análisis considerado. Por otro lado, se pretende poner a disposición de la comunidad un módulo sobre la plataforma WEKA que permita, no sólo automatizar el procedimiento para replicar el estudio, sino poder aplicar esta implementación de manera general para encontrar una distribución óptima para un contexto determinado, es decir, para un problema de clasificación, un método de remuestreo, un algoritmo de clasificación y una métrica de evaluación concreta que pueda definir el usuario.es_ES
dc.language.isospaes_ES
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectclasificadoreses_ES
dc.subjectWEKA
dc.subjectdistribución óptima
dc.subjectproblemas de clase desbalanceada
dc.subjectmétodos de remuestreo
dc.subjectdependencia de contexto
dc.titleMejora de la efectividad de la clasificación en la plataforma WEKA en base al uso de métodos de remuestreo sobre la distribución de clases óptimaes_ES
dc.typeinfo:eu-repo/semantics/masterThesis
dc.date.updated2021-09-17T08:49:28Z
dc.language.rfc3066es
dc.rights.holder© 2022, el autor
dc.contributor.degreeMáster Universitario en Ingeniería Computacional y Sistemas Inteligentes
dc.contributor.degreeKonputazio Ingeniaritza eta Sistema Adimentsuak Unibertsitate Masterra
dc.identifier.gaurregister118824-188005-09es_ES
dc.identifier.gaurassign110004-188005es_ES


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record