J48Consolidated WEKA paketea, adibide ezohikoen patroiak identifikatzeko tresna
Ekaia 29 : 155-178 (2016)
Abstract
Artikulu honetan WEKA ikasketa automatikorako tresnarako CTC algoritmoaren inplementazioa, J48Consolidated paketea, aurkezten da. CTC algoritmoak lagin multzo bat sortzen du eta lagin guztietan dagoen ezagutza kontuan hartuta sailkapen zuhaitz bakarra eraikitzeko gai da, kasu berrien sailkapenaren azalpena galdu gabe. Gainera, lan honetan J48Consolidated-ek sortutako zuhaitzen emaitzak aztertuko dira errealitateko 36 sailkapen problematarako, laginketa mota desberdinetan oinarrituta, eta jatorrizko laginaren estaldura-maila desberdinekin. Emaitzek erakusten dute estaldura maila altuek orokorrean sailkatzeko gaitasuna handitzen dutela eta %75-eko lagin estratifikatuak erabiltzea aukerarik lehiakorrena dela problema hauetan.; This article presents the implementation of the CTC algorithm for the WEKA machine learning tool, the J48Consolidated package. The CTC algorithm creates a set of samples and taking the knowledge of all samples into account, is able to build a single classification tree, keeping the explanation of how new examples are classified. In addition, this work analyzes the results achieved by trees built by J48Con- solidated on 36 real world problems, using multiple sampling strategies and with dif- ferent coverage values of the original sample. Results show that higher coverage values increase discriminating capacity and using stratified subsamples reduced to a 75% of the size give the most competitive results on these datasets.