ElevenLabs a ete fondee en 2022 par Piotr Dabkowski et Mati Staniszewski, deux ingenieurs polonais qui se sont rencontres lors d'une rencontre de passionnes d'apprentissage automatique et ont noue des liens autour d'une frustration partagee : le doublage dans les films et series etait horrible. Dabkowski, qui avait fait de la recherche chez Google, apportait une expertise technique approfondie en audio generatif; Staniszewski, ancien stratege chez Palantir, apportait le sens des affaires. Leur argumentaire etait simple — des voix IA qui sonnent veritablement humaines — et les investisseurs ont adhere rapidement. L'entreprise a leve 1 million de dollars en pre-amorcage, puis une Serie B de 80 millions de dollars menee par Andreessen Horowitz et rejointe par Sequoia, Smash Capital et d'autres, atteignant une valorisation de 1,1 milliard de dollars debut 2024. En janvier 2025, ils avaient leve une Serie C de 180 millions de dollars a une valorisation estimee a 3,3 milliards de dollars, en faisant l'une des entreprises d'IA les plus rapides de l'histoire a atteindre ce seuil.
Ce qui distinguait ElevenLabs des anciens outils de synthese vocale etait une qualite qui franchissait la vallee de l'etrangete. Leur modele Multilingual v2, publie en 2023, pouvait generer de la parole dans 29 langues avec une prosodie naturelle, de l'emotion et un rythme qu'il etait veritablement difficile de distinguer d'un enregistrement humain. Le clonage vocal — ou le systeme apprend a reproduire la voix d'une personne specifique a partir d'un court echantillon audio — est devenu leur fonctionnalite signature. Les professionnels l'utilisaient pour cloner leurs propres voix pour la narration de livres audio, la creation de contenu et le doublage. Le marche Voice Library permettait aux utilisateurs de partager et de monetiser des voix personnalisees, creant un ecosysteme autour de la technologie. Leur API d'IA conversationnelle en temps reel, lancee plus tard, a permis aux developpeurs de construire des agents vocaux capables de tenir des conversations telephoniques naturelles, ouvrant des applications en service a la clientele, en sante et en education.
Un grand pouvoir a entraine une controverse previsible. La technologie de clonage vocal est inheremment a double usage — le meme outil qui permet a un auteur de narrer son propre livre audio sans passer des heures en studio permet aussi a un acteur malveillant d'usurper l'identite de quelqu'un a des fins de fraude ou de desinformation. ElevenLabs a fait face a des critiques precoces quand des voix clonees de celebrites sont apparues en ligne, et l'entreprise a repondu en resserrant ses exigences de verification, en ajoutant un filigranage a l'audio genere via leur AI Speech Classifier, et en implementant une liste de voix protegees. Ils ont egalement adopte la norme C2PA pour la provenance des contenus. Ces mesures ont aide, mais la tension fondamentale demeure : plus la technologie s'ameliore, plus il est difficile de controler les abus, et ElevenLabs s'est engage a la rendre aussi performante que possible.
ElevenLabs exploite un modele d'affaires API freemium. Les utilisateurs gratuits beneficient d'un nombre limite de caracteres par mois; les forfaits payants s'echelonnent des createurs individuels aux contrats entreprise. La tarification est directe et conviviale pour les developpeurs, ce qui les a aides a batir une grande communaute rapidement. Ils ont egalement lance des produits autonomes comme l'application ElevenLabs Reader (pour ecouter des articles et documents) et un studio de doublage pour la localisation video. Les concurrents incluent Amazon Polly, Google Cloud TTS, Microsoft Azure Speech et des nouveaux entrants comme PlayHT et Cartesia, mais ElevenLabs a maintenu une avance qualitative qui fait revenir les developpeurs. L'entreprise s'est aussi etendue agressivement dans la generation de musique et d'effets sonores, signalant une ambition de dominer tout l'audio generatif, pas seulement la parole.
Au debut de 2026, ElevenLabs est le choix par defaut pour les developpeurs construisant des applications vocales. Leur technologie est a la base de milliers d'applications, de podcasts, de livres audio et d'outils d'entreprise. La veritable question est de savoir s'ils peuvent maintenir leur avance alors que les grands fournisseurs infonuagiques et les alternatives open source comblent l'ecart qualitatif, et si l'environnement reglementaire autour des medias synthetiques creera des obstacles ou des remparts. Pour le moment, ils sont l'entreprise qui a prouve que les voix IA pouvaient etre suffisamment bonnes pour remplacer les enregistrements humains dans la plupart des contextes — une etape qui semblait encore lointaine avant qu'ils ne la concretisent.