Digitalizazio Automatikoa: Iruditik Testura
Abstract
Hurrengo orrietan, paperean inprimaturik dauden testuen digitalizazio automatikoa hobetzen saiatuko da. Hobekuntza hori hiru modutara egin daiteke: Irudiak aurreprozesatuta,OCR1[OCR, 2017] algoritmoak hobetuta edo behin digitalizatuta dagoen testua hiztegien
bidez zuzenduta. Proiektuan zehar, irudien aurreprozesatzean sakonduko da gehien.
Hasteko, hobekuntza hauek burutzeko beharrezkoak diren aurrekari eta teknologiak azalduko dira. Ondoren, itxura eta hizkuntza desberdineko testu-irudiekin esperimentazioa
burutuko da. Segidan, proiektuan egin den aplikazioaren garapenaren azalpenak.
Bukatzeko, proiektuan zehar lortutako ondorioak azalduko dira, baita, proiektuari etorkizunean egin ahal zaizkion hobekuntzak ere.