Permettre le partage de données avec des espaces de données

Permettre le partage de données avec des espaces de données

mise en place d’un ’data space’ de démonstration

Pourquoi lire ceci ?

  • Comprendre les espaces de données : obtenez une vue d’ensemble claire de ce que sont les espaces de données, de leur fonctionnement et de leur importance pour un partage de données sécurisé et efficace entre les organisations.
  • Découvrir un cas d’utilisation : explorez une démonstration pratique du partage de données, illustrant la mise en place et le processus dans un scénario réel.

Date: 19 mars 2025

Expertises:

Science des données 

Domaine: Secteur numérique 

A propos du projet: WAL’PROT 

Auteur : Ismail Mahmoudi

1. Introduction

Les données sont un atout crucial dans l’économie numérique, mais leur véritable valeur émerge lorsqu’elles peuvent être partagées et réutilisées en toute sécurité pour générer des insights. L’interopérabilité joue un rôle clé dans la facilitation des échanges de données sans heurts entre systèmes et organisations. Les espaces de données offrent une nouvelle approche architecturale pour instaurer la confiance et définir des politiques d’accès. Ils fournissent des mécanismes sécurisés pour le partage de données tout en maintenant le contrôle et la protection pour tous les acteurs. Alors que les organisations cherchent à briser les silos de données, les espaces de données présentent une solution vitale pour une collaboration fiable et efficace.

2. Qu’est-ce qu’un espace de données ?

Un espace de données est un écosystème numérique décentralisé conçu pour faciliter l’échange de données sécurisé, transparent et souverain entre les participants, tout en respectant un cadre de gouvernance commun. Il ne s’agit pas d’une plateforme de données centralisée, mais plutôt d’une infrastructure où les données restent avec leur fournisseur, et seules les métadonnées ou les algorithmes sont partagés. Les espaces de données permettent un partage standardisé, de haute qualité et efficace des données ouvertes et sensibles à travers les industries et les secteurs, soutenant ainsi la conformité aux exigences de souveraineté et de confidentialité des données. Ils visent à démocratiser l’accès aux données et à garantir l’évolutivité et l’interopérabilité.

3. Comment fonctionnent les espaces de données ?

L’architecture des International Data Spaces (IDS) repose sur des Connecteurs servant d’interfaces sécurisées entre les participants. Ces Connecteurs fonctionnent sur deux niveaux :

  • Le plan de contrôle : responsable de la gestion des identités, du contrôle d’accès, de l’application des contrats et de la journalisation des transactions.
  • Le plan de données : dédié au transfert de données après validation du contrat.

En plus des connecteurs, les composants clés de l’IDS incluent le fournisseur d’identité pour l’authentification, le courtier de métadonnées (Metadata Broker) pour la gestion des catalogues, la chambre de compensation (Clearing House) pour la gestion des logs et des transactions , et l’App Store pour les services de données étendus.

La Figure 1 illustre les interactions entre ces composants.

Figure 1 : Interaction des composants techniques IDS-RAM 4.0

4. Cas d’utilisation : construction de l’espace de données

a. Description du cas d’utilisation : espace de données WAL’PROT

Le projet WAL’PROT vise à répondre à la demande croissante de protéines végétales et alternatives pour la consommation humaine en Europe. Plusieurs partenaires sont impliqués dans ces efforts, notamment des centres de recherche et des laboratoires universitaires travaillant en étroite collaboration. Cela nécessite une solution de partage de données garantissant la souveraineté et la propriété des données de chaque partenaire.

Dans le cadre du projet WAL’PROT , au CETIC, nous nous concentrons sur l’exploration d’initiatives pour la mise en œuvre d’espaces de données, tels que IDS, Eclipse Dataspace Components (EDC) et Gaia-X. Notre travail consiste à examiner les technologies existantes pour la réalisation d’espaces de données et à évaluer leurs avantages pour le cas d’utilisation du projet.

b. Mise en place de l’espace de données

Suite à notre comparaison des implémentations de connecteurs d’espaces de données, en nous concentrant sur leurs aspects techniques pour évaluer leur maturité et leur disponibilité, nous avons examiné des solutions telles que le Connecteur TRUsted Engineering (TRUE) et le Connecteur Eclipse Dataspace (EDC).

Dans le cadre de nos investigations, nous avons identifié Sovity, un connecteur basé sur EDC utilisé pour construire l’espace de données de mobilité. Il étend le cadre EDC en développant des composants supplémentaires et en les intégrant dans une distribution de connecteurs prête à l’emploi. Nous avons sélectionné l’édition Community de Sovity EDC, disponible sous forme d’image Docker, pour construire l’espace de données (figure 2).

Figure 2 : Conception de l’espace de données pour Wal’prot

c. Présentation du cas d’utilisation

Pour illustrer comment les données peuvent être offertes et consommées au sein d’un espace de données, nous fournissons un guide étape par étape utilisant l’interface utilisateur dédiée de Sovity, qui permet aux utilisateurs de gérer et d’interagir efficacement avec le connecteur.

i. Offre de données

Le processus d’offre de données dans un Espace de Données se compose de deux étapes clés : la création d’actifs de données (Data asset) et la définition de contrats (figure 2).

Création d’un actif de données : le participant représentant le fournisseur de données peut utiliser l’interface utilisateur du connecteur pour accéder à la page "Assets" et définir un nouvel actif de données. Cela implique de fournir des métadonnées telles que le nom, la version, la description et les mots-clés, ainsi que des détails techniques sur la source de données (point de terminaison de l’API à partir duquel le connecteur peut récupérer les données). Une fois complété, l’actif de données est enregistré.

Définition du contrat et publication de l’offre : ensuite, le fournisseur crée une définition de contrat sur la page "Contract Definitions". Lors de la définition du contrat, le fournisseur doit spécifier à la fois la Politique d’Accès et les Conditions du Contrat. Une fois la définition du contrat créée, elle est publiée en tant qu’offre dans le catalogue du connecteur, la rendant ainsi découvrable par les autres participants de l’Espace de Données en fonction de la politique d’accès assignée.

Figure 3 : offre de données

ii. Consommation de données

Le processus de consommation de données dans l’Espace de Données se compose de trois étapes clés : la découverte des offres de données, la négociation du contrat et le transfert de données. Nous détaillons chacune de ces étapes ci-dessous (figure 4).

Découverte de l’offre de données : le consommateur peut naviguer vers la page "Catalog Browser" dans l’interface utilisateur de son connecteur. Cette page répertorie les offres de données publiées dans les catalogues des connecteurs des autres participants de l’Espace de Données. L’employé trouvera la définition du contrat pour les offres de données. En cliquant sur cette entrée, il peut consulter plus de détails sur l’offre, tels que les métadonnées de l’actif et les politiques associées.

Négociation du contrat : après avoir découvert l’offre, le consommateur peut initier la négociation du contrat en cliquant sur un bouton dans la vue détaillée de l’offre dans l’interface utilisateur de son connecteur. Cette action envoie une demande de négociation au connecteur du fournisseur, déclenchant une négociation automatique du contrat sans nécessiter d’interaction humaine. Une fois la négociation réussie et un accord conclu, un contrat contraignant est créé et stocké. Le consommateur peut y accéder sur la page "Contracts" de l’interface utilisateur du connecteur et cliquer sur l’entrée pour voir plus de détails.

Transfert de données : le consommateur peut demander le transfert de données. Cela se fait en cliquant sur un bouton dans la vue détaillée du contrat dans l’interface utilisateur de son connecteur. Le consommateur est invité à fournir des détails sur le récepteur de données, y compris les paramètres du point de terminaison. Une fois ces détails fournis, l’employé clique sur un bouton pour lancer le transfert.

Figure 4 : Consommation de données

5. Conclusion

La mise en place d’espaces de données permet un échange de données sécurisé et souverain entre plusieurs parties prenantes. Pour standardiser et faire avancer ce concept, la Data Space Business Alliance (DSBA) réunit des organisations clés, notamment BDVA, la Fondation FIWARE , Gaia-X et IDSA, afin de développer un cadre technique commun. Une mise en œuvre notable à venir soutenant cette vision est le middleware [Simpl->https://digital-strategy.ec.europa.eu/en/policies/simpl, qui vise à rationaliser les fédérations cloud-to-edge et à renforcer les principales initiatives européennes en matière de données.

6. Références