AI工作負載正在推動企業走向供應商所稱的「適應性分層」——自動化資料配置系統,承諾在運算需求波動時最佳化儲存成本。與傳統階層式儲存管理不同,這些較新的系統聲稱使用智慧演算法在儲存層之間自動移動資料,回應存取模式和效能需求,無需人工介入。
潛在的危機是真實的:AI訓練和推論工作負載創造了不可預測的資料存取模式,而傳統儲存架構並非為處理這些而設計。當你的模型需要為訓練提取隨機資料集,或為具有截然不同記憶體佔用的推論請求提供服務時,靜態儲存配置就會變成成本災難。適應性分層的承諾聽起來很有說服力——讓AI管理AI基礎設施成本。
但我以前見過這種情況。「智慧」儲存管理已經被承諾了數十年,結果充其量也是好壞參半。根本問題不是資料配置——而是AI工作負載本質上就是昂貴且不可預測的。無論多少熱儲存和冷儲存之間的自動重組都無法解決這樣的事實:訓練大型模型需要大量的運算和記憶體,通常是同時進行的。
如果你正在處理螺旋攀升的AI基礎設施成本,首先關注基礎:適當的資源排程、工作負載批次處理,以及為你的使用案例選擇正確的模型。適應性分層可能在邊際上有幫助,但它不是AI成本危機的萬靈丹。真正的解決方案是建構更高效的模型,更好地理解你的實際運算需求。
