💡 Vous pouvez consulter la page ci-dessous pour avoir le détail de l'architecture de l'application :
https://www.notion.so/225403a7adf380cf92c4d40382383f1e
Admin est le centre de contrĂ´le de la plateforme.
Il englobe de nombreux aspects de la gestion de l'EDS :

Explore permet aux investigateurs médicaux de créer des cohortes. Les équipes médicales peuvent interroger la base de données Arkhn pour identifier les patients correspondant à un ensemble de critères (démographiques, cliniques, biologiques) et exporter la cohorte.


Le Datalake fait référence à l'ensemble des composants responsables du stockage des données au sein de la plateforme Arkhn.
Les données structurées sont stockées dans ClickHouse, une base de données orientée colonnes, tandis que les données non structurées sont stockées dans MinIO, une solution de stockage d'objets. En outre, Elasticsearch peut être utilisé pour stocker des données et fournit un moteur de recherche pour les explorer.
Le Datalake centralise des données hétérogènes provenant de diverses bases de données clients et fournit une structure unifiée, conçue pour servir de datamart destiné à la recherche scientifique des équipes médicales.
Le traitement des données au sein de la plateforme suit le cadre ELT (Extract, Load, Transform). Les principales étapes sont les suivantes :

Les Data Cleanrooms (aussi appelées bulles sécurisées) sont des environnements sécurisés où les utilisateurs de l'hôpital peuvent traiter et analyser des données de santé (provenant de l'EDS ou d'autres sources) en totale conformité avec les directives EDS de la CNIL. Ces exigences sont définies dans les lignes directrices suivantes :
Les utilisateurs de Data Clean Room ont souvent besoin d'installer des bibliothèques supplémentaires pour effectuer leurs tâches d'analyse de données. L'environnement DCR fournit un moyen sécurisé et contrôlé d'installer ces dépendances tout en maintenant la conformité aux exigences de sécurité.
Comment Fonctionne l'Installation de Bibliothèques
Quand un utilisateur a besoin d'installer une bibliothèque, le système suit un workflow sécurisé à travers notre système de gestion de dépôts Nexus. L'environnement DCR utilise une instance Nexus locale qui s'exécute dans le cluster Kubernetes du client, qui agit comme un proxy sécurisé vers notre infrastructure Nexus Arkhn centralisée.
Architecture Nexus
L'environnement DCR opère avec une configuration Nexus hybride :

La surveillance et l'observabilité nous permettent de suivre l'état et les performances de notre infrastructure et de nos applications.
Dans chaque environnement, nous collectons des métriques et des journaux pour une surveillance locale. De plus, nous centralisons les métriques au sein de notre infrastructure pour l'analyse et l'alerte à distance.
Le système d'observabilité de la plateforme Arkhn comprend :
Dans la plateforme Arkhn, HashiCorp Vault sécurise le stockage et le cycle de vie des secrets. Il sert de stockage de secrets pour les informations statiques d'identification et agit comme une PKI (Public Key Infrastructure) pour l'émission de certificats TLS internes. Ses contrôles d'accès très fins permettent de mettre en œuvre le principe du moindre privilège. En outre, le Vault Secret Operator distribue automatiquement et en toute sécurité les secrets aux applications au sein du cluster k3s.
Le Single Sign-On (SSO) est un mécanisme d'authentification qui permet aux utilisateurs d'accéder à plusieurs applications avec un seul jeu d'identifiants. Sur la plateforme Arkhn, le SSO est géré par Keycloak. Les identités des utilisateurs dans Keycloak peuvent être fédérées avec les systèmes LDAP ou Active Directory du client.