Dans le cadre de la protection des données personnelles au sein de la plateforme Arkhn plusieurs stratégies existent pour chiffrer ou pseudonymiser les données.
Un identifiant patient est calculé en suivant un algorithme combinant :
lower(hex(MD5(toString(coalesce(cast(ipp as String), '_dbt_utils_surrogate_key_null_') ))))::UUID as person_id,
Générant ainsi un UUID v4 pour chaque patient. Cet algorithme non-reversible permet de rapprocher les patients venant de sources différentes car déterministe en fonction de l'ipp.
Le reste des données personnelles étant après chiffré symétriquement selon la procédure détaillé dans :
Lors de l'ingestion de documents non-structurée (texte, pdf, word, etc…) les données passent à travers des pipelines de machine learning conçus pour protéger les données personnelles, lieux, noms de patients, en préservant les données médicales importantes pouvant être extraites ensuite par d'autres algorithmes ou utilisé dans le cadre de la recherche
Ce processus est décrit dans le cadre de la procédure :
Dans le cadre de l'utilisation d'Arkhn Explore, lors de l'export d'une population donnée lors du pre-screening, un pseudonyme non-reversible dont la correspondance avec l'identifiant du patient au sein de l'EDS est stockée dans une table de correspondance est créé, cet identifiant est ainsi protégé de toute possibilité de réversibilité sans accès à cette table de correspondance.
La procédure de ré-identification au sein d'Arkhn Admin permet néanmoins de ré-identifier ce pseudonyme dans les cas prévu par la législation :
https://www.notion.so/2e6403a7adf380549315d9a4597febc7