Anonimizazio automatikoa Big Data ingurunean
Laburpena
[EU]Proiektu honen helburua gaur-egun anonimizaziorako existitzen diren teknikei bu-ruzko ikasketa bat egitea da, Big Data ingurunean duten aplikazioa ikusteko. Publikatzen diren datu-baseen konfidentzialtasuna babesteko helburua dute teknika horiek, ezauga-rri nabarmenak orokortuz edo ezabatuz. Aldi berean Machine Learning algoritmoei bu-ruzko ikasketa bat egingo da, anonimizazio teknika horiek automatizatzeko eta horien eraginkortasuna handitzeko. Gaur egungo gizarteak sortzen dituen datu kantitate izuga-rriak babestea oso garrantzitsua da. Era berean, anonimizazio lana era automatikoan egingo duen tresna bat kodetuko da, aurreko teknikak erabiliz. Azkenik, tresna horren funtzionamendua eta abiadura probatuz. [EN]The aim of this project is the study of the existing anonymization techniques for in-formation data bases and their application to Big Data scenarios and the study of Ma-chine Learning algorithms to automate those and optimize those techniques. The tech-niques try to protect the confidentiality of the published data bases, through the suppre-ssion or generalization of sensible attributes. It is of great concern the protection of the vast information generated nowadays. During the project it will also be codified a tool for making possible an automatic easy anonymization of data bases, using Big Data tech-niques. Finally, is intended to test the tool. [ES]El objetivo de este proyecto es el estudio de las técnicas existentes para la anonimi-zación de bases de datos y su aplicación en escenarios Big Data. Estas técnicas intentan proteger la confidencialidad de las bases de datos publicadas, mediante la supresión o generalización delos atributos sensibles. Al mismo tiempo se estudian algoritmos de Ma-chine Learning, para automatizar y optimizar dichas técnicas.Es importante proteger la gran cantidad de datos que diariamente se genera la sociedad. También se codifica una herramienta que permite anonimizar de forma fácil y automática bases de datos, utili-zando técnicas propias de los escenarios BigData. Finalmente, dicha herramienta se so-mete a pruebas.