Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29393
Title: Towards auditable and intelligent privacy-preserving Record linkage.
Other Titles: Rumo à vinculação de registros auditável e inteligente que preserva a privacidade.
Hacia una vinculación de registros auditable e inteligente que preserve la privacidad.
???metadata.dc.creator???: NÓBREGA, Thiago Pereira da.
???metadata.dc.contributor.advisor1???: PIRES, Carlos Eduardo Santos.
???metadata.dc.contributor.advisor2???: NASCIMENTO FILHO, Dimas Cassimiro do.
???metadata.dc.contributor.referee1???: CAMPELO, Cláudio Elízio Calazans.
???metadata.dc.contributor.referee2???: MARINHO, Leandro Balby.
???metadata.dc.contributor.referee3???: MACHADO, Javam de Castro.
???metadata.dc.contributor.referee4???: PITA, Robespierre Dantas da Rocha.
Keywords: Machine Learning;Privacidade;Blockchain;Segurança e privacidade;Resolução de entidades;Integração de dados;Aprendizado de máquina;Privacy;Security and privacy;Entity resolution;Data integration;Seguridad y privacidad;Resolución de la entidad;Integración de datos;Privacidad
Issue Date: 12-Dec-2022
Publisher: Universidade Federal de Campina Grande
Citation: NÓBREGA, Thiago Pereira da. Towards auditable and intelligent privacy-preserving Record linkage. 2022. 237 fl. Tese (Doutorado em Ciência da Computação), Programa de Pós-Graduação em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Campina Grande, Paraíba, Brasil, 2022. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29393
???metadata.dc.description.resumo???: A Resolução de Entidade com Garantias de Privacidade (REGP) pretende integrar dados privados/sens ́ıveis de varias fontes de dados mantidas por diferentes partes. A REGP tem por objetivo identificar registros (por exemplo, pessoas ou objetos) que representam a mesma entidade do mundo real em fontes de dados privados mantidas por diferentes custodiantes. Devido a leis e regulamentos recentes (por exemplo, Regulamento Geral de Proteção de Dados), as abordagens PPRL são cada vez mais exigidas em áreas de aplicação do mundo real, como saude, análise de crédito, avaliação de políticas publicas e segurança nacional.Em cenarios prá ticos, o processo PPRL precisa lidar com problemas de eficiência, eficacia (qualidade de ligação) e privacidade. Por exemplo, o processo de PPRL precisa ser executado sobre grandes fontes de dados (por exemplo, um banco de dados contendo informações pessoais de programas governamentais de distribuição de renda e assistência), com uma classificação precisa das entidades e, ao mesmo tempo, proteger a privacidade de a informação. Nesse contexto, este trabalho propõe melhorias no processo PPRL com o intuito de mitigar alguns dos gargalos do REGP. Particularmente, este trabalho apresenta três grandes contribuições para o processo REGP: i) um protocolo que permite a auditabilidade da computação realizada durante o REGP, ii) uma metodologia não supervisionada que aproveita o conhecimento de conjuntos de dados publicos para treinar classificador baseado em Machine Learning para o REGP, e iii) uma nova representação, ̧para os dados PPRL codificados/anonimizados que permitem o uso de novas redes neuro e classificadores de aprendizado profundo no contexto do PPRL. As presentes contribuições aprimoram várias partes do processo PPRL, visando torna-lo mais facilmente utilizado em aplicações do mundo real. Com a contribuição apresentada na tese, esperamos facilitar diversas aplicações ̃ do mundo real (por exemplo, estudos médicos, epidemiol ogicos e populacionais) e reduzir os esforços legais/burocraticos para acessar e processar os dados, tornando a execução dessas aplicações mais simples para empresas e governos.
Abstract: The Entity Resolution with Privacy Guarantees (REGP) intends to integrate data private/sensitive files from various data sources maintained by different parties. The REGP aims to identify records (for example, people or objects) that represent the same real-world entity in private data sources maintained by different custodians. Due to recent laws and regulations (e.g. General Regulation of Data Protection), PPRL approaches are increasingly required in application areas from the real world, such as health, credit analysis, public policy evaluation and security national. In practical scenarios, the PPRL process needs to deal with efficiency problems, efficiency (call quality) and privacy. For example, the PPRL process needs to run on large data sources (for example, a database containing personal information from government cash distribution and assistance programs), with an accurate classification of entities while protecting the privacy of the information. In this context, this work proposes improvements in the PPRL process with the in order to mitigate some of the bottlenecks of REGP. In particular, this work presents three major contributions to the REGP process: i) a protocol that enables auditability computation performed during REGP, ii) an unsupervised methodology that leverages knowledge of public datasets to train classifier based on in Machine Learning for the REGP, and iii) a new representation, ̧for the PPRL data encoded/anonymized that allow the use of new neuro networks and classifiers of deep learning in the context of PPRL. The present contributions improve several parts of the PPRL process, aiming to make it more easily used in applications of the real world. With the contribution presented in the thesis, we hope to facilitate several applications ̃ from the real world (e.g., medical, epidemiological, and population studies) and reduce legal/bureaucratic efforts to access and process the data, making enforcement of these simpler applications for businesses and governments.
???metadata.dc.description.resumen???: La Resolución de la Entidad con Garantías de Privacidad (REGP) pretende integrar datos archivos privados/confidenciales de varias fuentes de datos en poder de diferentes partes. El REGP tiene como objetivo identificar registros (por ejemplo, personas u objetos) que representan la misma entidad del mundo real en fuentes de datos privadas mantenidas por diferentes custodios Debido a leyes y reglamentos recientes (por ejemplo, Reglamento General de Protección de datos), los enfoques PPRL son cada vez más necesarios en las áreas de aplicación del mundo real, como salud, análisis de crédito, evaluación de políticas públicas y seguridad nacional En escenarios prácticos, el proceso PPRL necesita hacer frente a problemas de eficiencia, eficiencia (calidad de la llamada) y privacidad. Por ejemplo, el proceso PPRL necesita se ejecuta en grandes fuentes de datos (por ejemplo, una base de datos que contiene información personal de los programas gubernamentales de asistencia y distribución de efectivo), con una clasificación precisa de entidades mientras se protege la privacidad de la información. En este contexto, este trabajo propone mejoras en el proceso PPRL con la para mitigar algunos de los cuellos de botella de REGP. En particular, este trabajo presenta tres principales contribuciones al proceso REGP: i) un protocolo que permite la auditabilidad cálculo realizado durante REGP, ii) una metodología no supervisada que aprovecha el conocimiento de conjuntos de datos públicos para entrenar clasificador basado en en Machine Learning para el REGP, y iii) una nueva representación, ̧para los datos PPRL codificados/anonimizados que permiten el uso de nuevas redes neuronales y clasificadores de aprendizaje profundo en el contexto de PPRL. Las presentes contribuciones mejoran varias partes del proceso PPRL, con el objetivo de hacerlo más fácil de usar en aplicaciones de la mundo real. Con el aporte presentado en la tesis, esperamos facilitar varias aplicaciones ̃ del mundo real (por ejemplo, estudios médicos, epidemiológicos y de población) y reducir esfuerzos legales/burocráticos para acceder y procesar los datos, haciendo que la aplicación de estas aplicaciones más simples para empresas y gobiernos.
Keywords: Machine Learning
Privacidade
Blockchain
Segurança e privacidade
Resolução de entidades
Integração de dados
Aprendizado de máquina
Privacy
Security and privacy
Entity resolution
Data integration
Seguridad y privacidad
Resolución de la entidad
Integración de datos
Privacidad
???metadata.dc.subject.cnpq???: Teoria da Computação
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/29393
Appears in Collections:Doutorado em Ciência da Computação.

Files in This Item:
File Description SizeFormat 
THIAGO PEREIRA DA NÓBREGA - TESE PPGCC 2022.pdfThiago Pereira da Nóbrega - Tese PPGCC 20224.32 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.