Zubnet AIApprendreWiki › IA générative
Fondamentaux

IA générative

Aussi appelé : GenAI
Les systèmes d'IA qui génèrent du contenu nouveau — texte, images, audio, vidéo, code, modèles 3D — plutôt que d'analyser ou de classer des données existantes. L'IA générative est le terme englobant pour tout, de la rédaction d'essais par ChatGPT à la création d'images par Stable Diffusion en passant par la composition de musique par Suno. Le terme « générative » distingue ces modèles des anciens systèmes d'IA qui ne pouvaient que catégoriser, prédire ou recommander.

Pourquoi c’est important

L'intelligence artificielle générative est le terme qui a introduit l'IA dans la culture grand public. C'est ce que les gens entendent lorsqu'ils disent « IA » entre 2024 et 2026 — la capacité de créer, et non seulement de calculer. Comprendre cette catégorie vous aide à naviguer dans le paysage : les LLM génèrent du texte, les modèles de diffusion génèrent des images, et les frontières entre les modalités s'estompent rapidement.

En profondeur

Chaque système d'IA générative, indépendamment de sa modalité, effectue essentiellement la même chose au niveau conceptuel : il apprend la distribution statistique de ses données d'entraînement, puis en tire des échantillons pour produire de nouvelles sorties. Un modèle de langage apprend la distribution de probabilité des séquences de mots — étant donné tout ce qui a été écrit sur Internet, quel jeton est le plus probable à suivre ? Un modèle d'image apprend la distribution des arrangements de pixels qui constituent « une photo de chat » versus « une peinture à l'huile de coucher de soleil ». La sortie n'est pas extraite d'une base de données. Elle est construite, jeton par jeton ou pixel par pixel, guidée par des motifs appris. C'est ce qui rend l'IA générative véritablement différente des moteurs de recherche ou des systèmes de recommandation : elle produit des choses qui n'existaient pas auparavant, assemblées à partir des motifs qu'elle a absorbés lors de son entraînement.

Les modalités et qui les détient

La génération de texte est dominée par les grands modèles de langage. La série GPT d'OpenAI, Claude d'Anthropic, Gemini de Google et la famille Llama à accès ouvert de Meta sont les principaux acteurs, avec une douzaine de laboratoires plus petits et de projets open source qui combilent des niches. La génération d'images s'est divisée en deux camps : les modèles de diffusion (Stable Diffusion de Stability AI, Midjourney, DALL-E 3) et les approches plus récentes de correspondance de flux. La génération vidéo est arrivée plus tard et reste plus complexe — Runway, Pika, Veo de Google et Sora d'OpenAI représentent l'avant-garde actuelle, mais la génération vidéo est coûteuse et lutte encore avec la cohérence temporelle. La génération audio englobe la synthèse vocale (ElevenLabs, modèles vocaux d'OpenAI), la composition musicale (Suno, Udio) et les effets sonores. La génération de code est devenue une catégorie à part, avec GitHub Copilot, Cursor et divers assistants de codage alimentés par Claude et GPT qui transforment la manière dont le logiciel est rédigé. La génération de modèles 3D est la modalité la plus jeune, avec des outils comme Meshy, Tripo et des recherches de NVIDIA commençant à produire des maillages et textures utilisables à partir de prompts textuels ou d'images. La tendance à travers toutes les modalités est la même : la qualité s'améliore de manière spectaculaire tous les six mois, les coûts baissent et l'écart entre « généré par l'IA » et « créé par un humain » se réduit.

Le tournant de 2022

L'IA générative existait depuis des années avant de devenir mainstream. GPT-2 pouvait écrire des paragraphes passables en 2019. DALL-E générait des images grossières en début 2021. Mais deux sorties en 2022 ont tout changé. Stable Diffusion, publiée open source en août 2022, a rendu la génération d'images accessible à tous gratuitement sur leur ordinateur — en une nuit, des millions de personnes ont commencé à créer des images qui auraient nécessité un artiste professionnel ou une abonnement à des photos stock. Puis ChatGPT a été lancé en novembre 2022, atteignant 100 millions d'utilisateurs en deux mois. La différence avant-après est frappante. Avant 2022, l'IA générative était une curiosité de recherche discutée à NeurIPS. Après 2022, c'était un sujet de réunions de conseil d'administration, de débats sur les politiques scolaires et de tables de cuisine. La technologie elle-même s'améliorait progressivement, mais la percée de l'interface — la rendre conversationnelle, accessible, gratuite — est ce qui a déclenché le changement culturel.

Qu'est-ce que cela a changé en pratique

L'impact commercial a été inégal mais réel. La création de contenu a été la première industrie à en ressentir les effets : les copies de marketing, les publications sur les réseaux sociaux, les articles de blog, les descriptions de produits — des tâches qui prenaient autrefois des heures à un rédacteur peuvent maintenant être rédigées en quelques secondes. Le service client a adopté des chatbots et des assistants IA qui gèrent les demandes routinières, les cas complexes étant transférés uniquement aux agents humains. Le développement logiciel a connu les gains de productivité les plus mesurables, avec des études montrant une réduction de 30–55 % du temps nécessaire à la complétion du code lorsque les développeurs utilisent des assistants IA. Les outils créatifs ont intégré l'IA générative à grande échelle : Adobe a ajouté la fonction de remplissage génératif à Photoshop, Canva a intégré la génération d'images à partir de texte et les outils de montage vidéo ont commencé à offrir la génération et le montage de scènes alimentées par l'IA. Le motif est cohérent — l'IA générative fonctionne le mieux comme accélérateur pour des personnes compétentes, et non comme remplacement. Un bon rédacteur avec des outils IA produit plus et plus rapidement. Un mauvais rédacteur avec des outils IA produit plus de mauvais écrits, plus rapidement.

Les questions dérangeantes

L'IA générative a hérité du contenu d'Internet et de ses problèmes. Le droit d'auteur est la préoccupation juridique la plus active : les modèles entraînés sur des textes, images et musiques protégés par le droit d'auteur font face à des poursuites de la part du New York Times, Getty Images et de milliers de créateurs individuels qui n'ont jamais consenti à l'utilisation de leur travail comme données d'entraînement. Les résultats juridiques façonneront l'économie entière du domaine. Le déplacement d'emplois est réel mais plus lent que ne le suggèrent les titres de presse — la traduction, la rédaction de copies, l'illustration et le codage de base voient tous une diminution de la demande pour les emplois d'entrée, mais le scénario « l'IA remplace tout le monde » n'a pas encore pris forme. La désinformation est un problème structurel : si la génération de textes et d'images convaincants coûte presque rien, le volume de contenus faux apparaissant crédibles augmente sans limite. Et l'inondation de la qualité — le volume énorme de contenus générés par l'IA qui remplissent Internet — dégrade déjà les résultats de recherche, les flux de médias sociaux et les magasins d'applications. Ce ne sont pas des risques hypothétiques. Ils se produisent maintenant, et les outils pour les détecter et les gérer sont constamment en retard par rapport aux outils de génération de contenus.

Concepts connexes

← Tous les termes
← GPU Google DeepMind →
ESC