Anonimización en escenarios big data
Fecha
2016-11-24Autor
Zuazo Sagredo, Endika
Metadatos
Mostrar el registro completo del ítemResumen
[ES]El objetivo de este proyecto es el estudio de las técnicas existentes para la anonimización
de bases de datos y su aplicación en escenarios Big Data. Estas técnicas intentan proteger la
con dencialidad de las bases de datos publicadas, mediante la supresión o generalización de
los atributos sensibles. Esto es importante dado que vivimos en una sociedad que diariamente
genera grandes cantidades de datos, muchos de los cuales terminan siendo publicados en diferentes
medios de comunicación. También se codi ca una herramienta que permite anonimizar
de forma fácil bases de datos, utilizando técnicas propias de los escenarios Big Data. Finalmente
se prueba dicha herramienta para garantizar su funcionalidad y probar su rendimiento. [EN]The aim of this proyect is the study of the existing anonymization techniques for information
data bases and their application to Big Data scenarios. These techniques try to protect the
con dentiality of the published data bases, through the suppression or generalization of sensible
attributes. This is important nowadays, because of the information generation rate of our society.
Lots of those data bases end up being published in di erent media. During the proyect it will also
be codi ed a tool for makeing possible an easy anonymization of data bases, using Big Data
techniques. Finally is intended to test the tool to guarantee its functionality and performance. [EU]Proiektu honen helburua gaur egun anonimizatzeko existitzen diren teknikei buruzko ikasketa
bat egitea da, Big Data ingurunetan duten aplikazioa ikusteko. Teknika hauek publikatutako
data baseen kon dentzialtasuna babestea dute helburu, ezaugarri nabarmenak orokortuz edo
ezabatuz. Gaur egungo gizarteak izugarrizko datu kantitateak sortzen ditu egunero, eta beraz
informazio hori babestea oso garrantzitsua da. Era berean, proiektu honetan anonimizazio lana
egingo duen tresna bat kodetuko da, Big Data ingurunetako teknikak erabiliz. Azkenik tresna
horren funtzionamendua eta abiadura neurtuko dira hainbat frogaren bitartez.