月之暗面(Moonshot AI)於 2023 年誕生自楊植麟之手。他的學術研究早已塑造了業界對長上下文建模的思考方式。楊植麟在卡內基美隆大學師從 Ruslan Salakhutdinov 和 William Cohen 取得博士學位,隨後在 Google Brain 工作期間共同撰寫了 Transformer-XL 和 XLNet —— 兩篇直接解決標準 Transformer 處理長序列限制的論文。楊植麟沒有繼續在西方實驗室做研究,而是回到中國創立了月之暗面,押注一個核心信念:上下文長度將是下一代 AI 助理的決定性差異化因素。他在第一年就融資超過 10 億美元,投資者包括紅杉中國、阿里巴巴和洪杉(前紅杉資本中國),到 2024 年初估值達到約 25 億美元。
月之暗面的旗艦產品 Kimi 於 2023 年 10 月推出,擁有 20 萬 token 的上下文視窗 —— 當時大多數競品的上限不過 8,000 到 32,000 token。到 2024 年初,他們已將其推至 200 萬 token,使 Kimi 能夠在單次對話中吸收整個程式碼庫、完整的書籍或數百頁的法律文件。這不僅是技術展示;Kimi 迅速成為中國最受歡迎的 AI 助理之一,尤其在需要處理大量文字的學生和知識工作者中。該產品增長之快,以至於在中國社群媒體上的病毒式傳播期間多次因負載過大而當機,但這個問題反而弔詭地進一步提升了它的知名度。
在底層技術上,月之暗面建立在楊植麟先前在高效注意力機制方面的研究之上。他們擴展上下文視窗的方法結合了稀疏注意力模式、記憶體高效的 KV 快取管理,以及專為長序列推理優化的客製化基礎設施。該公司對其模型的確切架構相當保密,但基準測試結果和用戶反饋顯示,他們是真正處理長上下文而非暗中截斷 —— 這一區別很重要,因為有幾家競爭者被發現宣傳大的上下文視窗,實際上卻忽略了大部分輸入。月之暗面也大力投資了檢索增強方法來補充原始上下文視窗,讓 Kimi 能夠搜索網路並將即時資訊與用戶上傳的文件整合。
月之暗面在中國擁擠的 AI 新創圈中佔據獨特位置。百度、阿里巴巴和字節跳動擁有龐大的分發優勢,而智譜 AI 和 MiniMax 等同行新創在通用能力上競爭,月之暗面則圍繞長上下文使用場景開闢出清晰的身份認同。即使更大的玩家紛紛追趕其上下文長度,這個聚焦點也為他們提供了可防禦的利基。該公司也有效地應對了中國的監管環境,取得了運營面向公眾的 AI 助理所需的審批。到 2025 年中,Kimi 已擴展至包括圖像理解和生成在內的多模態功能,月之暗面也在探索企業應用 —— 但核心身份不變:那個認真對待上下文的公司。
月之暗面最大的挑戰是可持續性。在 200 萬 token 上下文上進行推理的成本極其高昂,該公司燒錢的速度甚至讓矽谷的創投都感到緊張。長上下文的優勢能否持續也存在疑問,因為競爭者正在改善自己的上下文處理能力,而基於檢索的方法也在降低對超大視窗的需求。楊植麟公開主張,更長的上下文不僅是一項功能,而是與 AI 互動的根本不同方式 —— 它能實現當模型只能看到片段時不可能出現的推理模式。這一論點在商業上是否成立,將決定月之暗面是成為時代標誌性公司,還是一個技術令人印象深刻但燃燒過速的警示案例。