Contribucions al control de la revelació estadística per a macrodades i per a microdades
- Mateo Sanz, Josep Maria
- Josep Domingo Ferrer Zuzendaria
Defentsa unibertsitatea: Universitat de Barcelona
Defentsa urtea: 1998
- Jordi Ocaña Rebull Presidentea
- Jordi Castro Pérez Idazkaria
- Enric Ripoll Font Kidea
- Juan José Salazar González Kidea
- Michael Greenacre Kidea
Mota: Tesia
Laburpena
La tarea principal de los institutos de estadística es recoger, procesar y publicar información sobre grupos de entidades individuales, Antes de publicar resultados que han sido obtenidos a partir de datos confidenciales, el instituto de estadística debe asegurar que no es posible la identificación de los individuos que aportan estos datos (revelación de información confidencial). Sin embargo, no es posible evitar completamente la revelación y tenemos que aceptar cierto riesgo de revelación que es el precio que tenemos que pagar para publicar información estadística. Por este motivo se utiliza la expresión "controlar la revelación" en lugar de "evitar la revelación". El objetivo de esta tesis es diseñar nuevos métodos para el control de la revelación estadística que mejoren los existentes en alguno de los siguientes criterios: eficiencia computacional, pérdida de información, nivel de confidencialidad. Para alcanzar el objetivo propuesto, se ha desarrollado una técnica de control de la revelación para microdatos y una para macrodatos. Para microdatos, se ha mejorado la técnica de la microagregación propuesta por Eurostat; la microagregación se basa en el reemplazamiento de valores individuales por valores medios calculados sobre pequeños grupos. La mejora se ha encaminado hacia la reducción de la pérdida de información causada por esta técnica (esto se ha conseguido tomando en cuenta la estructura de los datos cuando se crean grupos de individuos). Para macrodatos, se ha desarrollado una nueva técnica de remuestreo que reduce de manera significativa el tiempo requerido por las técnicas de remuestreo existentes mientras se mantiene la pérdida de información y el nivel de confidencialidad.