Blog > Data Integrity > Surmonter les problèmes de confiance liés à l’IA : Trois étapes pour s’assurer que les données sont prêtes à l’emploi pour l’IA

Surmonter les problèmes de confiance liés à l’IA : Trois étapes pour s’assurer que les données sont prêtes à l’emploi pour l’IA

Authors Photo Tendü Yoğurtçu, PhD | July 16, 2024

Note de l’auteur : cet article sur les étapes pour s’assurer que les données sont AI-ready a été à l’origine traduit pour publication dans le manifeste de l’évènement DIMS 2024.

Dans un contexte technologique en constante évolution, les entreprises se tournent de plus en plus vers l’intelligence artificielle (IA) pour obtenir des informations pertinentes, améliorer les processus de prise de décision et stimuler l’innovation. Elles cherchent à accroître leur productivité et efficacité, fournir un meilleur service, mieux cibler leurs clients actuels et potentiels, et créer de nouvelles opportunités. L’explosion de l’adoption de l’IA n’est donc pas surprenante.

Selon PwC, l’IA contribuera à hauteur de 15 700 milliards de dollars à l’économie mondiale en 2030, soit plus que la production actuelle de la Chine et de l’Inde réunies. Alors que l’intelligence artificielle devrait rester une priorité pour les entreprises dans un avenir proche, la réalité est que nombreuses d’entre elles ne disposent pas de données prêtes à l’emploi ou « AI ready ». Ainsi, selon Gartner, en 2023, seulement 4 % des organisations ont déclaré que leurs données étaient “prêtes pour l’IA”.

En parallèle, nous constatons de plus en plus souvent les résultats déroutants auxquels les entreprises sont confrontées lorsqu’elles se précipitent sur l’IA sans avoir pris les dispositions nécessaires. Rien que l’année dernière, nous avons assisté à des dysfonctionnements de l’IA, allant de mémoires rédigés par l’IA contenant de fausses citations à des sociétés de conseil renommées impliquées dans des scandales fictifs. Par ailleurs, nous constatons que de nombreuses entreprises ne disposent pas d’une représentation diversifiée de leurs données, ce qui fait que l’IA est alimentée par des jeux de données potentiellement biaisés. Alors que nous aimons penser que les données sont factuelles, voire impartiales, la vérité est que les préjugés humains peuvent également créer des biais dans les données. Il en résulte toute une série de problèmes dans le monde réel – des logiciels de reconnaissance faciale défectueux qui identifient moins bien les femmes et les personnes de couleur, aux inégalités dans la prestation de soins de santé et bien plus encore.

Dans chacune de ces situations, le modèle qui a produit les résultats disposait de données d’entraînement et d’inférence inadaptées à l’objectif visé, entraînant des résultats biaisés et erronés – ce qui souligne ainsi le besoin d’une IA alimentée par des données fiables.

Au final, les résultats de l’IA seront d’autant plus pertinents et fiables que les données qui les alimentent le seront. Pour assurer le succès de l’IA, les organisations doivent donc veiller à ce que les données qui alimentent les modèles d’IA soient intègres, c’est-à-dire qu’elles doivent présenter un maximum de précision, de cohérence et de contexte.

Je détaille ci-après les trois étapes clés que les entreprises devraient suivre pour répondre aux questions relatives à la confiance dans les données et contribuer à une meilleure préparation à l’IA.

Résoudre les défis de l’IA grâce à l’intégrité des données

Les avantages de l’IA sont nombreux, qu’il s’agisse d’utiliser des assistants alimentés par l’IA pour améliorer l’expérience client ou d’utiliser des workflows optimisés par l’IA pour simplifier les opérations et bien plus encore. Si la stimulation de l’innovation, ainsi que l’amélioration de la productivité et des performances sont les principaux cas d’utilisation de l’intelligence artificielle, ces technologies ne résolvent pas à elles seules les problèmes de gestion des données. Il est primordial d’instaurer une gestion diligente et continue des données qui alimentent l’IA pour garantir l’exactitude et la pertinence de celles-ci. Ceci pour détecter toute erreur ou tout biais dans les données d’apprentissage, afin d’éviter que les résultats de l’IA ne soient incorrects ou mal renseignés.

Dans cette optique, les organisations peuvent prendre trois mesures clés pour surmonter les problèmes de données les plus courants et s’assurer que leurs données sont prêtes à l’emploi pour l’IA :

1) Garantir l’accès aux jeux de données essentiels et pertinents

De nombreuses entreprises qui se lancent dans des programmes d’IA constatent qu’elles n’ont pas de vision globale de tous leurs jeux de données. C’est le cas lorsque les données sont stockées en silos, dans différents systèmes et à de multiples emplacements, et qu’elles ne sont pas facilement accessibles dans l’environnement cloud où l’IA est gérée. Par conséquent, les modèles d’IA sont bâtis sur des jeux de données partiels, par exemple pour une géographie spécifique ou des données démographiques sur les clients, et les résultats peuvent devenir biaisés et peu fiables. Pour remédier à cela et contribuer à produire des résultats fiables et dignes de confiance, les organisations doivent intégrer leurs données et entraîner les modèles d’IA avec toutes les données critiques appropriées sur site, dans le cloud et dans des environnements hybrides – y compris les données complexes résidant sur des mainframes.

2) Renforcer la précision et la cohérence des données

Même si une entreprise a accès à tous les ensembles de données critiques, il se peut que ces données soient inexactes ou incohérentes. Pour éviter cela, les dirigeants doivent investir dans la mise en place d’une stratégie complète de qualité et de gouvernance des données afin de s’assurer que les données utilisées sont exactes, cohérentes et prêtes à l’emploi. Pour obtenir des résultats fiables en matière d’IA, vos données doivent répondre à des critères de qualité stricts : elles doivent être exactes, exhaustives, correctement structurées, normalisées et ne pas comporter de doublons. Les données de haute qualité doivent également être pertinentes et gouvernées à l’aide d’un cadre solide.

Ces stratégies peuvent également impliquer des outils proactifs d’observabilité des données qui utilisent des techniques d’apprentissage automatique (ML) pour surveiller la santé des pipelines de données, en identifiant et en traitant rapidement toute anomalie dans les jeux de données qui pourrait causer des problèmes en aval si elle n’était pas traitée.

Lire notre ebook

Les bases d’une IA de confiance : Quelques conseils pour que vos données soient AI Ready

Préparez le futur de votre IA dès aujourd’hui grâce à l’intégrité des données. Il est temps de maximiser le potentiel de vos initiatives en matière d’intelligence artificielle. Laissez-vous inspirer par des cas d’utilisation de l’IA et découvrez comment surmonter les biais, les erreurs et autres défis majeurs. Les connaissances et les fonctionnalités basées sur la technologie dépendent de données fiables.

3) Accroître la puissance de l’IA grâce aux données contextuelles

Pour produire des résultats et des recommandations d’IA contextualisés, nuancés et pertinents, les dirigeants doivent envisager d’ajouter des données tierces et des informations géospatiales. L’ajout de contexte à des jeux de données tels que des points d’intérêt, des données démographiques ou des informations sur les risques est essentiel pour garantir l’intégrité des données et, par conséquent, maximiser la précision et la pertinence des résultats de l’IA. Par exemple, lors de l’utilisation d’outils d’IA pour obtenir des informations sur les catastrophes naturelles ou des modèles prédictifs, l’ajout de points géospatiaux détaillés tels que des informations d’adresse ou des facteurs de risque environnementaux aide les chefs d’entreprise à obtenir des résultats plus éclairés et à découvrir des schémas dans les données qui n’auraient peut-être pas été visibles autrement.

Le résultat ? Des informations fiables et dignes de confiance basées sur l’IA

Il semble évident que, dans un avenir proche, le marché de l’IA va continuer à croître à un rythme exponentiel, avec un nombre apparemment illimité de capacités et de services d’intelligence artificielle à la disposition de ceux qui veulent en tirer parti. En tant que tel, le sujet de l’IA devrait continuer à alimenter les discussions des chefs d’entreprise, qui se concentrent sur l’amélioration de l’efficacité et de la productivité au sein de leur organisation.

Mais pour profiter pleinement des avantages de l’IA et éviter les résultats indésirables, les entreprises doivent d’abord résoudre les problèmes de confiance liés aux données qui alimentent leurs modèles d’IA. En donnant la priorité à une stratégie d’intégrité des données solide qui aide à construire des fondations de données précises, cohérentes et contextuelles, les chefs d’entreprise peuvent conduire des initiatives d’IA qui sont hautement performantes, fiables et produisent des résultats de qualité.

En fin de compte, les possibilités de l’IA sont aussi vastes que les données à partir desquelles elle apprend, ce qui signifie que prioriser l’intégrité des données n’est pas seulement bénéfique pour les chefs d’entreprise d’aujourd’hui – c’est une nécessité.

AI