Contribucions al control de la revelació estadística per a macrodades i per a microdades

  1. Mateo Sanz, Josep Maria
Dirigida por:
  1. Josep Domingo Ferrer Director/a

Universidad de defensa: Universitat de Barcelona

Año de defensa: 1998

Tribunal:
  1. Jordi Ocaña Rebull Presidente/a
  2. Jordi Castro Pérez Secretario/a
  3. Enric Ripoll Font Vocal
  4. Juan José Salazar González Vocal
  5. Michael Greenacre Vocal

Tipo: Tesis

Teseo: 57954 DIALNET

Resumen

La tarea principal de los institutos de estadística es recoger, procesar y publicar información sobre grupos de entidades individuales, Antes de publicar resultados que han sido obtenidos a partir de datos confidenciales, el instituto de estadística debe asegurar que no es posible la identificación de los individuos que aportan estos datos (revelación de información confidencial). Sin embargo, no es posible evitar completamente la revelación y tenemos que aceptar cierto riesgo de revelación que es el precio que tenemos que pagar para publicar información estadística. Por este motivo se utiliza la expresión "controlar la revelación" en lugar de "evitar la revelación". El objetivo de esta tesis es diseñar nuevos métodos para el control de la revelación estadística que mejoren los existentes en alguno de los siguientes criterios: eficiencia computacional, pérdida de información, nivel de confidencialidad. Para alcanzar el objetivo propuesto, se ha desarrollado una técnica de control de la revelación para microdatos y una para macrodatos. Para microdatos, se ha mejorado la técnica de la microagregación propuesta por Eurostat; la microagregación se basa en el reemplazamiento de valores individuales por valores medios calculados sobre pequeños grupos. La mejora se ha encaminado hacia la reducción de la pérdida de información causada por esta técnica (esto se ha conseguido tomando en cuenta la estructura de los datos cuando se crean grupos de individuos). Para macrodatos, se ha desarrollado una nueva técnica de remuestreo que reduce de manera significativa el tiempo requerido por las técnicas de remuestreo existentes mientras se mantiene la pérdida de información y el nivel de confidencialidad.