Upstage 展示了要建立世界級語言模型並不需要百億參數。Solar 10.7B 在開放測試中表現卓越,挑戰了當前「規模就是一切」的主流觀點,並證明創新的訓練技巧可以彌補原始規模的不足。除了模型本身,Upstage 的 Document AI 作品解決了 AI 生態系統中最實用的缺口之一 — 將混亂的現實世界文件轉換為結構化數據 — 他們在首爾的成功證明,有意義的人工智慧創新正在遠離主導頭條新聞的矽谷與北京走廊之外蓬勃發展。
Upstage 於 2020 年由曾擔任 Kakao Brain 研究員的 Kim Sung 創立,Kim 曾在韓國教授最受歡迎的機器學習課程(後透過 YouTube 全球發行),聲名遠播。其共同創始人包括 Park Lucy 及其他韓國自然語言處理社群的資深成員。公司初期專注於文件理解——這個在 AI 領域看似不性感的領域,卻擁有龐大的商業需求。當時西方 AI 實驗室正追逐聊天機器人與影像生成器,Upstage 卻致力於開發技術,從混亂的真實世界文件(如發票、合約、手寫表格、混合語言的掃描 PDF)中讀取、解析並提取結構化資訊。這種務實的焦點讓他們在 LLM 風潮尚未席捲之前,就已獲得早期收入與韓國企業界的聲譽。
Upstage 的突破性時刻來自 2023 年底推出的 Solar 10.7B。當時產業的主流敘述是「越大越好」,實驗室競相訓練 70B、180B 甚至兆級參數的模型,而 Solar 10.7B 卻登上 Hugging Face Open LLM Leaderboard 榜首,擊敗數倍於其規模的模型。其秘密在於 Upstage 自稱的 Depth Up-Scaling(DUS)技術,透過複製並微調中間層,而非從頭訓練更大模型,精準擴展預訓練基礎模型。這不僅是基準測試的技巧;模型在實際任務中表現優異,且規模適中,能在單一 GPU 上運行,使部署方式比 70B+ 模型更具實用性。Solar 成為「小但強大」LLM 開發學派的參考典範,與 Mistral 的 7B 及 Microsoft 的 Phi 系列齊名。
雖然 Solar 獲得頭條新聞,Upstage 的文件 AI 套件或許對公司的營收更具關鍵意義。其 OCR、布局分析與文件解析工具處理企業日常面對的混亂、多格式、多語言文件處理——而一般用途的 LLM 還難以應對。Upstage 開發專用模型,針對表格提取、鍵值對識別與手寫辨識,鎖定金融、法律、醫療與政府等產業。在文件處理流程密集且法規要求高準確度的韓國,這無疑是自然契合。公司透過合作夥伴關係與 API 接入國際市場,將文件 AI 定位為語言模型的補充,而非獨立產品線。其主張令人信服:用 Solar 進行推理與生成,用文件 AI 吞食餵養這些模型的真實資訊。
Upstage 運作於由大型企業集團主導的韓國 AI 環境——三星、NAVER、Kakao 與 LG 等公司皆擁有自家 AI 實驗室與龐大資源。Upstage 的優勢在於焦點與速度。三星 SDS 將 AI 視為數千項功能之一,NAVER 則整合至既有搜尋與電商帝國,而 Upstage 能以新創的敏捷度迭代模型並推出產品。公司曾獲得重大融資,包括由 SoftBank 領投的輪次,使其在計算資源上具備競爭力,同時維持獨立性。韓國政府亦支持本土 AI 發展,但監管環境較中國「先建後管」的作法更謹慎。
Upstage 面對的挑戰對所有小模型支持者而言都耳熟能詳:當前沿模型的運行成本降低,API 價格持續下降,小模型的實用優勢逐漸縮小。若能以每 token 分數錢的價格呼叫 GPT-4 級別的智慧,自行運行 10B 模型的商業案例便更難成立。Upstage 回應方式包括持續推出改進版 Solar 模型、擴展多語言與多模態能力,並深化文件 AI 的護城河。公司亦積極拓展 API 平台業務,透過統一介面讓開發者存取完整技術堆疊。Upstage 是否會成為韓國版 Mistral——一個規模小但持續超越預期的專注實驗室,或被納入更大生態系,仍是未解之謎。然而,其高效創新紀錄,使其成為美中軸心之外最引人注目的 AI 公司之一。