Mulce.org Documentation

Une nouvelle méthode systématique d’anonymisation

lundi 16 juillet 2012 par Christophe Reffay

Dans notre article de 21 pages en français (dont 3 pages d’annexes et 2 de bibliographie), Christophe Reffay, François-Marie Blondel et Emmanuel Giguet présentons une nouvelle méthode (automatisable) pour anonymiser un corpus éventuellement multilingue.

Résumé :

Dans le champ de l’analyse des interactions textuelles, les chercheurs désirant partager leurs corpus font face à de grandes difficultés pour en éliminer les marques d’identification des personnes physiques. La loi européenne suggère pourtant que ces marques soient soigneusement retirées avant toute publication. Dans la suite des outils de la plateforme Calico dédiée à l’analyse des interactions en ligne, nous proposons ici un procédé interactif d’anonymisation systématique, fonctionnant sans dictionnaire a priori et donc applicable à toute langue. Ce procédé a été appliqué à un premier corpus plurilingue issu de Galanet. Cet article souligne les difficultés de l’anonymisation et présente les premiers résultats de cette expérience. Au-delà de la transformation elle-même, nous proposons deux stratégies de fouille afin de détecter de nouvelles graphies pouvant révéler des données personnelles.


Accueil | Contact | Plan du site | | icone statistiques visites | info visites 29976

Suivre la vie du site fr  Suivre la vie du site Publications   ?

Site réalisé avec SPIP 3.1.3 + AHUNTSIC

Creative Commons License