克靈AI(Kling AI)是快手(Kuaishou)旗下的視頻生成平台,而快手是中國短視頻公司,雖然在國內長期處於字節跳動抖音(Douyin)之後,但卻悄悄建立了中國最令人印象深刻的AI研究實驗室之一。快手由蘇華與程一笑於2011年創立,最初是作為一個GIF製作工具,後轉型為短視頻平台。該公司在2021年於香港上市,當時估值高達1500億美元,儘管其股價後續大幅下跌,但其AI能力卻持續成長。克靈於2024年6月作為研究示範問世,立即因其生成的視頻在物理一致性與動作真實性方面達到甚至超越當時西方競爭對手的水準而引起關注。
克靈在最初釋出時之所以脫穎而出,是因為它解決了視頻生成中最困難的幾個問題:物理學、物體永續性與時間一致性。早期的AI視頻生成器產生的畫面往往夢幻般地讓物體變形、手部複製,甚至重力可有可無。克靈的輸出則展現出人物以真實步態行走、物體以合理的物理規律互動,以及攝影機運動看起來是有意圖而非隨機生成。其底層架構採用專有3D變分自編碼器(variational autoencoder)結合擴散變換器(diffusion transformer),同時處理空間與時間維度,而非將其分開處理。快手的研究人員發表了這項工作的部分內容,描述了基於公司多年來在社交媒體平台上視頻理解經驗所改進的運動建模技術。到2024年底推出的克靈1.5版本,平台已支援長達兩分鐘的視頻——這在大多數競爭對手僅限於4至10秒的時代,是一個驚人的成就。
克靈的國際策略比大多數中國AI產品更具侵略性。與專注於本地市場不同,快手推出了支援英文、信用點數計費與API存取的全球平台klingai.com,目標是全球的開發者與創意專業人士。免費層足夠慷慨,足以吸引龐大的用戶群,而付費方案在價格上壓過Runway與Luma,同時提供競爭或更優質的品質。這種以全球為首的策略對中國視頻AI產品來說並不尋常——大多數中國AI工具若要接觸國際用戶,通常要透過微信(WeChat)或小紅書(Xiaohongshu)間接達成。克靈則直接透過Twitter示範、YouTube比較與直接聯繫視覺特效專業人士與內容創作者,打入西方創意社群。
作為視頻平台的背景,讓克靈擁有純粹AI新創公司所缺乏的優勢。該公司每日處理與服務數十億支視頻片段,這意味著它既有龐大的真實世界視頻訓練數據集,也有經過驗證的大規模視頻處理基礎設施。快手的推薦演算法已分析視頻內容超過十年,理解視頻中的運動、物體、場景與人類行為。這種關於什麼讓視頻看起來「正確」的機構知識,直接轉化為更優秀的生成模型。公司也擁有足夠的財務彈性,以慷慨的免費層作為獲客策略,並透過核心快手應用的廣告收入進行補貼,該應用在中國擁有超過3億日活用戶,仍保持盈利。
克靈的問世加速了AI領域中已經成為最競爭激烈的前沿:視頻生成。僅在2024年,Runway推出了Gen-3 Alpha,Luma釋出了Dream Machine,MiniMax推出了Hailuo視頻,Google預覽了Veo——而克靈則透過快速版本更新與其保持同步。到2025年初,領先視頻生成器之間的品質差距已大幅縮小,競爭轉向更長的持續時間、更好的控制(攝影機運動、角色一致性、唇語同步)與更低的延遲。克靈在動作品質方面表現尤為出色,現在透過網頁平台與API提供圖像到視頻、文字到視頻與視頻延長功能。對整體AI視頻市場而言,克靈的出現是一個警鐘:它證明了中國實驗室能在尖端生成式AI上與矽谷匹敵甚至超越,而來自中國的競爭將持續壓低價格並加快創新。