VMware et NVIDIA s’associent pour lancer une importante initiative d’IA générative

L’offensive de l’IA générative s’est poursuivie hier avec VMware Inc. et NVIDIA annonçant l’expansion d’un partenariat qui, selon les partenaires, est conçu pour « préparer les centaines de milliers d’entreprises qui fonctionnent sur l’infrastructure infonuagique de VMware à l’ère de l’IA générative ».

Le point central du lancement, qui a eu lieu lors de la conférence des utilisateurs et partenaires VMware Explore 2023 qui se tient cette semaine à Las Vegas, est une plate-forme qui, selon les deux sociétés, comportera le logiciel d’IA générative et « l’informatique accélérée » de NVIDIA, construite sur VMWare Cloud Fondation et optimisé pour l’IA.

Ils ont déclaré dans un communiqué que « pour obtenir plus rapidement des avantages commerciaux, les entreprises cherchent à rationaliser le développement, les tests et le déploiement d’applications d’IA générative. McKinsey estime que l’IA générative pourrait ajouter jusqu’à 4,4 billions de dollars américains par an à l’économie mondiale.

En projetant ce chiffre, publié en juin, McKinsey a déclaré que « l’ère de l’IA générative ne fait que commencer et qu’il faudra du temps pour prendre pleinement conscience des énormes avantages de la technologie. Mais les chefs d’entreprise devraient commencer à mettre en œuvre des cas d’utilisation de l’IA générative dès que possible plutôt que d’attendre les bras croisés, car l’écart de performance entre les retardataires et les premiers utilisateurs va rapidement se creuser. »

« L’avantage concurrentiel ira aux organisations qui seront les premières à utiliser l’IA générative pour accélérer leurs priorités commerciales, leurs innovations et leur croissance. En termes simples, les chefs d’entreprise doivent s’épanouir dès maintenant dans l’IA générative (quiconque peut poser des questions peut utiliser la technologie) et être prêts à apprendre en permanence. »

La nouvelle plate-forme, qui s’appellera VMware Private AI Foundation with NVIDIA, « permettra aux entreprises de personnaliser des modèles et d’exécuter des applications d’IA génératives, y compris des robots conversationnels intelligents, des assistants, la recherche et la synthèse ».

Il sera construit sur les logiciels VMware Cloud Foundation et NVIDIA AI Enterprise. Krish Prasad, vice-président senior et directeur général du groupe commercial d’infrastructure infonuagique de VMware, a écrit dans un article de blog publié peu après l’annonce officielle que, bien que « l’IA générative soit une technologie transformatrice, les entreprises sont confrontées à des défis de taille lors de son déploiement ».

Il s’agit notamment, a-t-il déclaré :

  • Confidentialité : Les données d’entreprise et la propriété intellectuelle sont privées et d’une importance cruciale lors de la formation de grands modèles de langage pour répondre aux besoins spécifiques de l’organisation. Ces données doivent être protégées pour éviter toute fuite en dehors des limites de l’organisation.
  • Choix : Les entreprises doivent être en mesure de choisir le grand modèle de langage (GML) qui correspond le mieux à leur parcours d’IA générative et à leurs besoins organisationnels. L’accès à un vaste écosystème et à une variété de choix est essentiel.
  • Coût : Les modèles d’IA générative sont complexes et coûteux à concevoir, car ils évoluent rapidement avec de nouveaux fournisseurs, des composants SaaS et des logiciels d’IA de pointe lancés et déployés en permanence.
  • Performance : La demande sur l’infrastructure connaît une augmentation substantielle lors des tests de modèle et lorsque les requêtes de données sont exécutées. Les grands modèles de langage, de par leur nature même, nécessitent généralement la gestion d’énormes ensembles de données. Par conséquent, ces modèles peuvent imposer des exigences d’infrastructure importantes, entraînant des problèmes de performances.
  • Conformité : Les organisations de différents secteurs ont des besoins de conformité différents auxquels les solutions d’entreprise, y compris l’IA générative, doivent répondre. Le contrôle d’accès et la préparation à l’audit sont des aspects essentiels à prendre en compte.

Conçue pour relever les cinq défis, la plate-forme, ont déclaré les deux sociétés, comportera « NVIDIA NeMo, un cadre natif du nuage de bout en bout inclus dans NVIDIA AI Enterprise – le système d’exploitation de la plate-forme NVIDIA AI – qui permet aux entreprises de créer, personnaliser et déployer des modèles d’IA génératifs pratiquement n’importe où. NeMo combine des cadres de personnalisation, des boîtes à outils de garde-fou, des outils de conservation de données et des modèles pré-entraînés pour offrir aux entreprises un moyen simple, rentable et rapide d’adopter l’IA générative ».

« Grâce à cela, VMware Private AI Foundation with NVIDIA permettra aux entreprises d’extraire leurs propres données pour créer et exécuter des modèles d’IA génératifs personnalisés sur l’infrastructure infonuagique hybride de VMware. »

Dans un discours prononcé mardi, où il était accompagné du fondateur et PDG de NIVIDIA, Jensen Huang, le PDG de VMware, Raghu Raghuram, a comparé ce qui se passe actuellement sur le front de l’IA générative à l’arrivée de l’ordinateur personnel il y a 40 ans, ou à l’arrivée d’Internet, qui ont tous deux déclenché une « toute nouvelle vague d’innovation en matière d’applications ».

Dans un communiqué, il a déclaré que « les données des clients sont partout – dans leurs centres de données, à la périphérie et dans leurs nuages. En collaboration avec NVIDIA, nous donnerons aux entreprises les moyens d’exécuter leurs charges de travail d’IA générative à côté de leurs données en toute confiance, tout en répondant à leurs préoccupations en matière de confidentialité, de sécurité et de contrôle des données d’entreprise ».

Lors d’une conférence de presse tenue lundi pour annoncer le lancement, Paul Turner, vice-président de la gestion des produits vSphere chez VMware, a déclaré qu’il s’agissait d’un « espace très nouveau, il est difficile pour les gens de réellement comprendre quels sont les applications et services les plus importants et les boîtes à outils dont ils ont besoin, et comment obtenir ces boîtes à outils prescrites aussi facilement que possible. Et c’est l’une des choses que nous considérons en tant que partenaire : nous voulons rendre cela très simple pour nos clients ».

Ils ne feront pas non plus cavalier seul. Il a été annoncé mardi que la plate-forme serait prise en charge par Dell Technologies, Hewlett-Packard Enterprise et Lenovo, « qui seront parmi les premiers à proposer des systèmes qui dynamisent les charges de travail de personnalisation et d’inférence GML d’entreprise avec les GPU NVIDIA L40S, les DPU NVIDIA BlueField – 3 et les Cartes SmartNIC NVIDIA ConnectX-7 ».

Interrogé sur les prix et la disponibilité lors d’une séance de questions-réponses avec les médias et les analystes, Paul Turner a déclaré que les prix n’avaient pas encore été déterminés et que la disponibilité générale de la plate-forme était attendue au début de l’année prochaine.

L’article original (en anglais) est disponible sur IT World Canada, une publication sœur de Direction informatique.

Adaptation et traduction française par Renaud Larue-Langlois.

Paul Barker
Paul Barker
Paul est le fondateur de PBC Communications, une firme de rédaction spécialisée dans le journalisme indépendant. Son travail est apparu dans un certain nombre de magazines technologiques et en ligne sur des sujets allant des problèmes de cybersécurité et du monde en évolution de l'informatique de pointe à la gestion de l'information et aux progrès de l'intelligence artificielle.

Articles connexes

Balado Hashtag Tendances, 14 septembre 2023 — Apple et l’IA, Chrome a 15 ans, Nvidia accélère ses GPU et dévoilement de l’iPhone 15

Cette semaine : Apple dépense des millions sur l’IA chaque jour, le nouveau look de Chrome pour ses 15 ans, Nvidia lance un logiciel pour accélérer ses puces d’IA et dévoilement de l’iPhone 15.

Google étend ses offres de calcul d’IA, son partenariat avec Nvidia et plus encore

L'intelligence artificielle (IA) était au centre de la conférence Google Cloud Next la semaine dernière, alors que Google annonçait des mises à jour de TPU, des instances de machines virtuelles alimentées par des GPU Nvidia, des améliorations de Google Distributed Cloud et une version premium de GKE.

Balado Hashtag Tendances, 10 août 2023 — Des améliorations à SGE, Google tente d’attirer les employés au bureau et de nouvelles puces Apple et...

Cette semaine : SGE retourne du contenu multimédia, Google offre des chambres à prix réduit à ses employés, Apple achète toute la capacité de production de TSMC et une nouvelle puce Nvidia pour l’intelligence artificielle.

AWS annonce des efforts majeurs en IA générative et lance de nouvelles offres

L'intelligence artificielle (AI) générative transformera chaque application, industrie et entreprise et prend enfin forme grâce à un assortiment d'avancées technologiques, a déclaré Swami Sivasubramanian, vice-président bases de données, analyse et apprentissage automatique chez Amazon Web Services (AWS, la semaine dernière.

L’IA générative révolutionne l’industrie des dispositifs médicaux, rapporte GlobalData

La société de données et d'analyse GlobalData a publié un rapport sur l'impact de l'intelligence artificielle (IA) générative dans divers aspects des soins de santé.

Emplois en vedette

Les offres d'emplois proviennent directement des employeurs actifs. Les détails de certaines offres peuvent être soit en français, en anglais ou bilinguqes.