A SAP adquiriu Dremio e Prior Labs num único anúncio, com um compromisso separado de $1,17B em quatro anos pro desenvolvimento da Prior Labs. O enquadramento estratégico vem do CTO da SAP Philipp Herzig: *"A IA enterprise não trava porque os modelos não são bons o bastante; trava porque os dados não estão prontos."* Esse é o split piso-vs-teto que vem silenciosamente definindo a IA enterprise por dois anos — os labs fronteira empurram o teto de capacidade do modelo, mas as empresas queimam orçamentos colocando seus dados tabulares num estado onde qualquer modelo pode usá-los produtivamente. A SAP está comprando as duas camadas num único movimento.
A Dremio traz um data lakehouse com duas tecnologias open-source que importam pro ecossistema mais amplo: Apache Iceberg (formato de tabela colunar com controle de versão, o padrão aberto emergente) e Apache Polaris (gestão de metadados pra tabelas Iceberg). Mais um agente IA integrado que permite usuários consultarem sem escrever SQL. A Prior Labs traz TabPFN-2.5 — um transformer especificamente otimizado pra dados tabulares, fazendo aprendizado in-context em vez de treinamento por tarefa, capaz de processar até 100.000 linhas de planilha por tarefa. Há também um motor de destilação que gera algoritmos leves específicos do dataset a partir do modelo base. Alvo de integração: Business Data Cloud da SAP; rotas de integração HANA, Datasphere e Joule não foram divulgadas. Sem termos financeiros nas aquisições individuais; os $1,17B/4 anos é o compromisso pro desenvolvimento TabPFN, não preço de compra.
Pra devs, o sinal estrutural é que IA tabular é a fronteira subatendida. Imagem, texto e código atraem atenção porque apps consumer e ferramental dev são a superfície de marketing, mas dados em linhas-e-colunas é onde a maioria dos dados enterprise vive, e abordagens de modelo que funcionam pra texto não estruturado não transferem limpo pra cargas tabulares. A abordagem aprendizado-in-context da TabPFN (sem fine-tuning por dataset, só alimentar a tabela na inferência) é significativamente diferente da abordagem LLM-sobre-tabelas que a maioria dos vendors enterprise vinha entregando. A SAP apostando $1,17B em quatro anos nesse time é validação real de que abordagens transformer-específico-tabular são comercialmente viáveis, não só um thread acadêmico. Fica de olho se Snowflake, Databricks e Microsoft Fabric vão contra-mover com seus próprios jogos de modelos fundação tabulares.
Se você constrói produtos IA enterprise, a implicação prática é que o stack está bifurcando: modelos labs fronteira pra cargas não estruturadas, modelos tabular-específicos pra cargas estruturadas, e a camada lakehouse (Iceberg + Polaris + Delta Lake) virando o substrato padrão. Se você entrega retrieval contra dados tabulares, modelos estilo TabPFN de aprendizado in-context valem avaliar contra sua abordagem atual LLM-com-ferramentas-SQL — a forma de latência e custo é significativamente diferente, e frequentemente melhor pra tabelas de alta cardinalidade. Se você mantém um projeto open-source no espaço lakehouse, SAP se comprometendo tão forte com Iceberg é altista pra gravidade desse formato vs Delta Lake ou Hudi. A história real não é que SAP fez aquisições; é que articularam IA tabular como um stack separado valendo $1,17B de investimento dedicado.
