Cada sistema de IA gerativa, independentemente da modalidade, faz basicamente a mesma coisa em nível conceitual: aprende a distribuição estatística de seus dados de treinamento, depois amostra dessa distribuição para produzir novas saídas. Um modelo de linguagem aprende a distribuição de probabilidade sobre sequências de palavras — dada tudo o que foi escrito na internet, qual token é mais provável de vir em seguida? Um modelo de imagem aprende a distribuição de arranjos de pixels que constituem "uma foto de um gato" versus "um quadro a óleo de um pôr do sol". A saída não é recuperada de um banco de dados. Ela é construída, token por token ou pixel por pixel, guiada por padrões aprendidos. Isso é o que torna a IA gerativa genuinamente diferente de motores de busca ou sistemas de recomendação: ela produz coisas que nunca existiram antes, montadas a partir de padrões que absorveu durante o treinamento.
A geração de texto é dominada por grandes modelos de linguagem. A série GPT da OpenAI, o Claude da Anthropic, o Gemini da Google e a família Llama de código aberto da Meta são os principais players, com dezenas de laboratórios menores e projetos de código aberto preenchendo nichos. A geração de imagens se dividiu em dois grupos: modelos de difusão (Stable Diffusion da Stability AI, Midjourney, DALL-E 3) e abordagens mais recentes de correspondência de fluxo. A geração de vídeo chegou mais tarde e ainda é mais difícil — Runway, Pika, Veo da Google e Sora da OpenAI representam a fronteira atual, mas a geração de vídeo é cara e ainda lida com consistência temporal. A geração de áudio abrange síntese de fala (ElevenLabs, modelos de voz da OpenAI), composição musical (Suno, Udio) e efeitos sonoros. A geração de código tornou-se sua própria categoria, com o GitHub Copilot, o Cursor e diversos assistentes de codificação alimentados por Claude e GPT transformando a forma como o software é escrito. A geração de modelos 3D é a modalidade mais nova, com ferramentas como Meshy, Tripo e pesquisas da NVIDIA começando a produzir malhas e texturas úteis a partir de prompts de texto ou imagem. A tendência em todas as modalidades é a mesma: a qualidade melhora drasticamente a cada seis meses, os custos caem e o abismo entre "gerado por IA" e "criado por humanos" se estreita.
A IA gerativa existia há anos antes de se tornar mainstream. O GPT-2 poderia escrever parágrafos passáveis em 2019. O DALL-E gerou imagens grosseiras no início de 2021. Mas duas liberações em 2022 mudaram tudo. A Stable Diffusion, liberada como código aberto em agosto de 2022, colocou a geração de imagens em qualquer laptop de graça — em uma noite, milhões de pessoas começaram a criar imagens que antes exigiriam um artista profissional ou uma assinatura de foto de stock. Depois, o ChatGPT foi lançado em novembro de 2022, atingindo 100 milhões de usuários em dois meses. A diferença antes e depois é marcante. Antes de 2022, a IA gerativa era uma curiosidade de pesquisa discutida no NeurIPS. Após 2022, tornou-se tema de reuniões de diretoria, debates sobre políticas escolares e mesas de jantar. A tecnologia em si melhorava gradualmente, mas a quebra de interface — torná-la conversacional, acessível e gratuita — é o que provocou a mudança cultural.
O impacto empresarial foi desigual, mas real. A criação de conteúdo foi a primeira indústria a sentir isso: cópias de marketing, posts de redes sociais, artigos de blog, descrições de produtos — tarefas que antes levavam a um escritor horas podem agora ser redigidas em segundos. O atendimento ao cliente adotou chatbots e assistentes de IA que lidam com consultas rotineiras, com agentes humanos escalando apenas os casos difíceis. O desenvolvimento de software viu os maiores ganhos de produtividade mensuráveis, com estudos mostrando que a conclusão de código é 30–55% mais rápida quando os desenvolvedores usam assistentes de IA. Ferramentas criativas integraram IA gerativa em toda a linha: a Adobe adicionou preenchimento gerativo ao Photoshop, o Canva incorporou geração de imagem a partir de texto e ferramentas de edição de vídeo começaram a oferecer geração e edição de cenas com IA. O padrão é consistente — a IA gerativa funciona melhor como acelerador para pessoas habilidosas, não como substituição delas. Um bom escritor com ferramentas de IA produz mais e mais rápido. Um mau escritor com ferramentas de IA produz mais escritos ruins, mais rápido.
A IA gerativa herda o conteúdo da internet e os problemas da internet. Direitos autorais são a preocupação jurídica mais ativa: modelos treinados com textos, imagens e música com direitos autorais enfrentam ações judiciais da New York Times, Getty Images e milhares de criadores individuais que nunca consentiram em ter seu trabalho usado como dados de treinamento. Os resultados legais moldarão a economia de todo o campo. O desemprego é real, mas mais lento do que os manchetes sugerem — tradução, redação de textos, ilustração e programação básica estão todas vendo uma demanda reduzida por trabalho de nível inicial, mas o cenário "a IA substitui todos" não se materializou. Desinformação é um problema estrutural: se gerar textos e imagens convincentes custa quase nada, o volume de conteúdo falso plausível escala sem limites. E a inundação de qualidade — o volume absurdo de conteúdo gerado por IA enchendo a internet — já está degradando resultados de busca, feeds de redes sociais e lojas de aplicativos. Esses não são riscos hipotéticos. Eles estão acontecendo agora, e as ferramentas para detectar e gerenciar esses problemas estão consistentemente atrás das ferramentas para gerar conteúdo.