VMware et NVIDIA s’associent pour lancer une importante initiative d’IA générative

L’offensive de l’IA générative s’est poursuivie hier avec VMware Inc. et NVIDIA annonçant l’expansion d’un partenariat qui, selon les partenaires, est conçu pour « préparer les centaines de milliers d’entreprises qui fonctionnent sur l’infrastructure infonuagique de VMware à l’ère de l’IA générative ».

Le point central du lancement, qui a eu lieu lors de la conférence des utilisateurs et partenaires VMware Explore 2023 qui se tient cette semaine à Las Vegas, est une plate-forme qui, selon les deux sociétés, comportera le logiciel d’IA générative et « l’informatique accélérée » de NVIDIA, construite sur VMWare Cloud Fondation et optimisé pour l’IA.

Ils ont déclaré dans un communiqué que « pour obtenir plus rapidement des avantages commerciaux, les entreprises cherchent à rationaliser le développement, les tests et le déploiement d’applications d’IA générative. McKinsey estime que l’IA générative pourrait ajouter jusqu’à 4,4 billions de dollars américains par an à l’économie mondiale.

En projetant ce chiffre, publié en juin, McKinsey a déclaré que « l’ère de l’IA générative ne fait que commencer et qu’il faudra du temps pour prendre pleinement conscience des énormes avantages de la technologie. Mais les chefs d’entreprise devraient commencer à mettre en œuvre des cas d’utilisation de l’IA générative dès que possible plutôt que d’attendre les bras croisés, car l’écart de performance entre les retardataires et les premiers utilisateurs va rapidement se creuser. »

« L’avantage concurrentiel ira aux organisations qui seront les premières à utiliser l’IA générative pour accélérer leurs priorités commerciales, leurs innovations et leur croissance. En termes simples, les chefs d’entreprise doivent s’épanouir dès maintenant dans l’IA générative (quiconque peut poser des questions peut utiliser la technologie) et être prêts à apprendre en permanence. »

La nouvelle plate-forme, qui s’appellera VMware Private AI Foundation with NVIDIA, « permettra aux entreprises de personnaliser des modèles et d’exécuter des applications d’IA génératives, y compris des robots conversationnels intelligents, des assistants, la recherche et la synthèse ».

Il sera construit sur les logiciels VMware Cloud Foundation et NVIDIA AI Enterprise. Krish Prasad, vice-président senior et directeur général du groupe commercial d’infrastructure infonuagique de VMware, a écrit dans un article de blog publié peu après l’annonce officielle que, bien que « l’IA générative soit une technologie transformatrice, les entreprises sont confrontées à des défis de taille lors de son déploiement ».

Il s’agit notamment, a-t-il déclaré :

  • Confidentialité : Les données d’entreprise et la propriété intellectuelle sont privées et d’une importance cruciale lors de la formation de grands modèles de langage pour répondre aux besoins spécifiques de l’organisation. Ces données doivent être protégées pour éviter toute fuite en dehors des limites de l’organisation.
  • Choix : Les entreprises doivent être en mesure de choisir le grand modèle de langage (GML) qui correspond le mieux à leur parcours d’IA générative et à leurs besoins organisationnels. L’accès à un vaste écosystème et à une variété de choix est essentiel.
  • Coût : Les modèles d’IA générative sont complexes et coûteux à concevoir, car ils évoluent rapidement avec de nouveaux fournisseurs, des composants SaaS et des logiciels d’IA de pointe lancés et déployés en permanence.
  • Performance : La demande sur l’infrastructure connaît une augmentation substantielle lors des tests de modèle et lorsque les requêtes de données sont exécutées. Les grands modèles de langage, de par leur nature même, nécessitent généralement la gestion d’énormes ensembles de données. Par conséquent, ces modèles peuvent imposer des exigences d’infrastructure importantes, entraînant des problèmes de performances.
  • Conformité : Les organisations de différents secteurs ont des besoins de conformité différents auxquels les solutions d’entreprise, y compris l’IA générative, doivent répondre. Le contrôle d’accès et la préparation à l’audit sont des aspects essentiels à prendre en compte.

Conçue pour relever les cinq défis, la plate-forme, ont déclaré les deux sociétés, comportera « NVIDIA NeMo, un cadre natif du nuage de bout en bout inclus dans NVIDIA AI Enterprise – le système d’exploitation de la plate-forme NVIDIA AI – qui permet aux entreprises de créer, personnaliser et déployer des modèles d’IA génératifs pratiquement n’importe où. NeMo combine des cadres de personnalisation, des boîtes à outils de garde-fou, des outils de conservation de données et des modèles pré-entraînés pour offrir aux entreprises un moyen simple, rentable et rapide d’adopter l’IA générative ».

« Grâce à cela, VMware Private AI Foundation with NVIDIA permettra aux entreprises d’extraire leurs propres données pour créer et exécuter des modèles d’IA génératifs personnalisés sur l’infrastructure infonuagique hybride de VMware. »

Dans un discours prononcé mardi, où il était accompagné du fondateur et PDG de NIVIDIA, Jensen Huang, le PDG de VMware, Raghu Raghuram, a comparé ce qui se passe actuellement sur le front de l’IA générative à l’arrivée de l’ordinateur personnel il y a 40 ans, ou à l’arrivée d’Internet, qui ont tous deux déclenché une « toute nouvelle vague d’innovation en matière d’applications ».

Dans un communiqué, il a déclaré que « les données des clients sont partout – dans leurs centres de données, à la périphérie et dans leurs nuages. En collaboration avec NVIDIA, nous donnerons aux entreprises les moyens d’exécuter leurs charges de travail d’IA générative à côté de leurs données en toute confiance, tout en répondant à leurs préoccupations en matière de confidentialité, de sécurité et de contrôle des données d’entreprise ».

Lors d’une conférence de presse tenue lundi pour annoncer le lancement, Paul Turner, vice-président de la gestion des produits vSphere chez VMware, a déclaré qu’il s’agissait d’un « espace très nouveau, il est difficile pour les gens de réellement comprendre quels sont les applications et services les plus importants et les boîtes à outils dont ils ont besoin, et comment obtenir ces boîtes à outils prescrites aussi facilement que possible. Et c’est l’une des choses que nous considérons en tant que partenaire : nous voulons rendre cela très simple pour nos clients ».

Ils ne feront pas non plus cavalier seul. Il a été annoncé mardi que la plate-forme serait prise en charge par Dell Technologies, Hewlett-Packard Enterprise et Lenovo, « qui seront parmi les premiers à proposer des systèmes qui dynamisent les charges de travail de personnalisation et d’inférence GML d’entreprise avec les GPU NVIDIA L40S, les DPU NVIDIA BlueField – 3 et les Cartes SmartNIC NVIDIA ConnectX-7 ».

Interrogé sur les prix et la disponibilité lors d’une séance de questions-réponses avec les médias et les analystes, Paul Turner a déclaré que les prix n’avaient pas encore été déterminés et que la disponibilité générale de la plate-forme était attendue au début de l’année prochaine.

L’article original (en anglais) est disponible sur IT World Canada, une publication sœur de Direction informatique.

Adaptation et traduction française par Renaud Larue-Langlois.

Paul Barker
Paul Barker
Paul est le fondateur de PBC Communications, une firme de rédaction spécialisée dans le journalisme indépendant. Son travail est apparu dans un certain nombre de magazines technologiques et en ligne sur des sujets allant des problèmes de cybersécurité et du monde en évolution de l'informatique de pointe à la gestion de l'information et aux progrès de l'intelligence artificielle.

Articles connexes

Les protecteurs canadiens de la vie privée publient des principes pour le développement responsable de l’IA

Dans la foulée des directives de cybersécurité pour les systèmes d’IA générative publiées par le gouvernement fédéral, les régulateurs fédéraux, provinciaux et territoriaux de la protection de la vie privée du Canada ont publié leur propre ensemble de lignes directrices liées à la confidentialité.

Lancement de Coveo Relevance Generative Answering

Coveo, un fournisseur montréalais de plateformes d'IA d'entreprise, lance Coveo Relevance Generative Answering, une solution basée sur l’IA qui peut générer des réponses aux requêtes complexes des utilisateurs en tirant parti des grands modèles de langage (GML).

Cinq entreprises canadiennes partagent leurs expériences et cas d’utilisation de l’IA générative au AWS re:Invent 2023

Que font réellement les entreprises canadiennes en termes de projets liés à l’infonuagique et à l’IA générative ? Comment naviguent-elles dans l’incertitude d’une technologie relativement nouvelle ? Telles sont les questions auxquelles un panel de clients a répondu lors d'un briefing avec les médias canadiens dans le cadre de l’événement AWS re:Invent 2023.

AWS offre une formation gratuite en IA aux Canadiens via son nouvel engagement « AI Ready »

Amazon Web Services (AWS) vient de lancer « AI Ready », une nouvelle initiative chargée de fournir gratuitement une formation et un enseignement aux compétences en IA et en IA générative à deux millions de personnes d'ici 2025.

Balado Hashtag Tendances, 16 novembre 2023 — Samsung et l’IA, plus de données pour OpenAI, le Nvidia HGX H200 et l’IA et la météo

Cette semaine : Samsung se lance dans l’intelligence artificielle, OpenAI veut plus de données pour former ses modèles d’IA, le nouveau GPU Nvidia HGX H200 Tensor Core et l’IA pour les prévisions météo.

Emplois en vedette

Les offres d'emplois proviennent directement des employeurs actifs. Les détails de certaines offres peuvent être soit en français, en anglais ou bilinguqes.