A Upstage foi fundada em 2020 por Sung Kim, ex-pesquisador do Kakao Brain que já havia feito nome ensinando um dos cursos de machine learning mais populares da Coreia (e depois globalmente pelo YouTube). A empresa começou com foco em compreensão de documentos — um canto pouco glamoroso da IA que por acaso tinha enorme demanda comercial. Enquanto laboratórios ocidentais de IA perseguiam chatbots e geradores de imagem, a Upstage construia tecnologia para ler, parsear e extrair informação estruturada de documentos do mundo real: faturas, contratos, formulários manuscritos, PDFs escaneados com idiomas mistos.
O momento de avanço da Upstage veio com o Solar 10.7B, lançado no final de 2023. Numa época em que a narrativa da indústria era "maior é melhor" e laboratórios corriam para treinar modelos de 70B, 180B e trilhões de parâmetros, o Solar 10.7B chegou ao topo do Open LLM Leaderboard do Hugging Face — batendo modelos várias vezes maiores. O segredo foi uma técnica que a Upstage chamou de Depth Up-Scaling (DUS), que envolvia pegar um modelo base pré-treinado e cuidadosamente escalá-lo duplicando e fazendo fine-tuning de camadas intermediárias. Seu tamanho modesto significava que podia rodar em uma única GPU, tornando-o prático para implantação de formas que modelos de 70B+ simplesmente não eram.
Enquanto o Solar ganhou manchetes, a stack de Document AI da Upstage tem sido indiscutivelmente mais importante para o resultado financeiro da empresa. Suas ferramentas de OCR, análise de layout e parsing de documentos lidam com o tipo de processamento confuso de documentos multi-formato e multi-idioma com que empresas lidam diariamente. A Upstage construiu modelos especializados para extração de tabelas, identificação de pares chave-valor e reconhecimento de manuscrito.
A Upstage opera em um cenário de IA coreano dominado por grandes conglomerados — Samsung, Naver, Kakao e LG — todos com seus próprios laboratórios de IA e recursos significativos. O que a Upstage tem que os gigantes não têm é foco e velocidade. A empresa levantou financiamento significativo incluindo uma grande rodada liderada pela SoftBank.
O desafio para a Upstage é familiar a todo defensor de modelos pequenos: conforme modelos de fronteira ficam mais baratos de rodar e preços de API continuam caindo, a vantagem prática de um modelo menor diminui. A Upstage respondeu continuando a lançar modelos Solar aprimorados, expandindo para capacidades multi-idioma e multimodais, e aprofundando seu fosso de Document AI. Se a Upstage se torna a resposta da Coreia à Mistral — um laboratório menor e focado que supera expectativas indefinidamente — ou é absorvida em um ecossistema maior permanece uma questão em aberto.