Utiliser les données pour alimenter l’intelligence artificielle générative : Perspectives et Stratégies
L’intelligence artificielle (IA) générative, un domaine en pleine expansion, promet des avantages économiques substantiels. Selon les recherches récentes de McKinsey, l’IA générative pourrait ajouter entre 2,6 et 4,4 trillions de dollars annuellement à l’économie mondiale, en s’appuyant sur 63 cas d’utilisation différents. Cette estimation impressionnante souligne le rôle crucial des données dans le potentiel de l’IA générative. Pour les responsables des données, cela représente un défi de taille, notamment dans la gestion et l’optimisation des données pour tirer pleinement parti de cette technologie.
Face à ce défi, McKinsey identifie sept actions clés pour les responsables des données. La première est de laisser la valeur guider leurs décisions, en développant une vue claire des implications des données dans l’approche globale de l’entreprise envers l’IA générative. Trois archétypes sont proposés : le preneur, qui consomme des services préexistants ; le façonneur, qui accède et affine les modèles sur ses propres données ; et le créateur, qui construit ses propres modèles fondamentaux.
La deuxième action concerne la construction de capacités spécifiques dans l’architecture des données pour soutenir un large éventail de cas d’utilisation. Cela implique une attention particulière à l’architecture de données existante, notamment pour la gestion des données non structurées telles que les chats, vidéos et codes.
La troisième action se concentre sur la qualité des données tout au long de leur cycle de vie. Les responsables des données doivent étendre leurs programmes d’observabilité des données pour les applications IA génératives, en mettant l’accent sur la qualité des données sources, le prétraitement, les invites et les sorties des modèles de langage à grande échelle (LLM).
La quatrième action porte sur la protection des données sensibles et la préparation à l’évolution rapide des réglementations. Cela implique d’identifier et de prioriser les risques de sécurité liés aux données propriétaires de l’entreprise, de gérer l’accès aux données personnellement identifiables (PII) et de suivre de près les réglementations émergentes.
La cinquième action consiste à développer les compétences en ingénierie des données. Alors que les tâches de codage sont de plus en plus prises en charge par des outils IA génératifs, les responsables des données doivent se concentrer sur le recrutement de talents capables de travailler avec des ensembles de données intégrés, de séquencer et d’enchaîner des invites, de manipuler de grandes quantités de données, d’appliquer des LLM et de travailler avec des paramètres de modèle.
La sixième action met en avant l’utilisation de l’IA générative pour améliorer la fonction de gestion des données elle-même. Les responsables des données doivent identifier les capacités sur lesquelles ils peuvent compter sur les fournisseurs et celles qu’ils devraient construire eux-mêmes.
La septième et dernière action concerne le suivi rigoureux et les interventions rapides. Les responsables des données doivent établir des systèmes pour suivre et gérer activement les progrès de leurs initiatives IA génératives, en développant une série de KPIs centraux et opérationnels pour aider les dirigeants à suivre les progrès et à identifier les causes profondes des problèmes.
En conclusion, l’alignement entre la stratégie des données et les objectifs commerciaux est essentiel. Les entreprises doivent s’adapter et évoluer dans un paysage technologique en rapide mutation, en mettant l’accent sur la qualité des données, la sécurité des données, le développement des talents et un suivi rigoureux pour maximiser les avantages de l’IA générative.
Sources :