Três níveis: baseado em prompt (não confiável), decodificação restringida (confiável), validado por schema (garantido). JSON Schema é o padrão. Ideal para extração de dados; não necessário para escrita criativa.
Nível 1: pedir “responda em JSON” no prompt. Funciona na maioria das vezes, mas o modelo pode incluir texto extra ou produzir JSON malformado. Nível 2: decodificação restringida, onde o motor de inferência força cada token a ser válido no contexto do JSON parcial. Nível 3: schema JSON predefinido, onde a API aceita uma definição de schema e garante que a saída se conforma. Claude, GPT e Gemini todos oferecem Nível 3.
Saída estruturada é essencial quando o resultado alimenta código downstream: extração de entidades, classificação, preenchimento de formulários, geração de chamadas de API. Não é necessária para respostas conversacionais ou escrita criativa, onde a flexibilidade do texto livre é uma vantagem.