新創公司Wafer正在訓練AI模型來自動為任何晶片架構最佳化軟體,有可能打破Nvidia對效能軟體生態系統的壟斷。該公司在開源模型上使用強化學習來撰寫kernel程式碼,並為Claude和GPT-4等模型添加「代理性控制結構」來提升它們針對特定硬體的程式設計能力。Wafer已經與AMD和Amazon建立了合作關係,從包括Google的Jeff Dean和OpenAI的Wojciech Zaremba在內的知名投資者那裡募集了400萬美元。
這很重要,因為Nvidia 4兆美元的估值不僅僅建立在優越的矽晶片上——而是他們的CUDA軟體生態系統讓他們的晶片更容易程式設計和最佳化。正如Wafer執行長Emilio Andere指出的,「最好的AMD硬體、最好的Trainium硬體、最好的TPUs」現在都能匹配Nvidia的原始運算能力。瓶頸一直是釋放這種潛力所需的稀缺且昂貴的效能工程師。如果AI能夠自動化這項最佳化工作,那麼每個晶片都會變得像Nvidia的晶片一樣容易使用。
更廣泛的「AI民主化」敘述遠遠超出了晶片範圍。業界討論揭示了類似的模式,在農業領域,專家們辯論AI是否能讓先進的農業技術為小農所用;在通用運算介面方面,一些人認為large language models將成為通用UI,使所有軟體更易於使用。但晶片最佳化問題更加具體——它是關於自動化一個特定的、可測量的工程任務,而不是關於「賦權每個人」的模糊承諾。
對於開發者來說,這可能會重塑基礎設施選擇。如果Wafer和類似工具能夠可靠地為替代晶片最佳化程式碼,那麼GPU短缺溢價和CUDA鎖定就變得不那麼重要了。真正的考驗將是AI產生的最佳化是否能在生產工作負載中匹配手工調校的效能,而不僅僅是基準測試。
