Cristin-resultat-ID: 1924390
Sist endret: 15. februar 2022, 17:14
NVI-rapporteringsår: 2021
Resultat
Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
2021

Anonymisation Models for Text Data: State of the art, Challenges and Future Directions

Bidragsytere:
  • Pierre Lison
  • Ildikó Pilán
  • David Sánchez
  • Montserrat Batet og
  • Lilja Øvrelid

Bok

Om resultatet

Vitenskapelig Kapittel/Artikkel/Konferanseartikkel
Publiseringsår: 2021
Sider: 4188 - 4203
ISBN:
  • 978-1-954085-52-7

Klassifisering

Fagfelt (NPI)

Fagfelt: IKT
- Fagområde: Realfag og teknologi

Beskrivelse Beskrivelse

Tittel

Anonymisation Models for Text Data: State of the art, Challenges and Future Directions

Sammendrag

This position paper investigates the problem of automated text anonymisation, which is a prerequisite for secure sharing of documents containing sensitive information about individuals. We summarise the key concepts behind text anonymisation and provide a review of current approaches. Anonymisation methods have so far been developed in two fields with little mutual interaction, namely natural language processing and privacy-preserving data publishing. Based on a case study, we outline the benefits and limitations of these approaches and discuss a number of open challenges, such as (1) how to account for multiple types of semantic inferences, (2) how to strike a balance between disclosure risk and data utility and (3) how to evaluate the quality of the resulting anonymisation. We lay out a case for moving beyond sequence labelling models and incorporate explicit measures of disclosure risk into the text anonymisation process.

Bidragsytere

Aktiv cristin-person

Pierre Lison

  • Tilknyttet:
    Forfatter
    ved Avdeling for statistisk analyse og maskinlæring for brukermotiverte anvendelser SAMBA ved Norsk Regnesentral

Ildikó Pilán

  • Tilknyttet:
    Forfatter
    ved Avdeling for statistisk analyse og maskinlæring for brukermotiverte anvendelser SAMBA ved Norsk Regnesentral

David Sánchez

  • Tilknyttet:
    Forfatter
    ved Universitat Rovira i Virgili

Montserrat Batet

  • Tilknyttet:
    Forfatter
    ved Universitat Rovira i Virgili

Lilja Øvrelid

  • Tilknyttet:
    Forfatter
    ved Forskningsgruppen for språkteknologi ved Universitetet i Oslo
1 - 5 av 5

Resultatet er en del av Resultatet er en del av

Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers).

Zong, Chengqing; Xia, Fei; Li, Wenjie; Navigli, Roberto. 2021, Association for Computational Linguistics. Vitenskapelig antologi/Konferanseserie
1 - 1 av 1