一位資料科學家剛剛展示了我們一直在等待的:處理完整工作流程的AI,而不僅僅是程式碼片段。使用Codex和Model Context Protocol (MCP),他在30分鐘內處理了1.85GB的Apple Health XML資料——從Google Drive下載到BigQuery分析。AI定位了檔案,引用了六年前的GitHub程式碼,編寫了Python解析器,上傳了資料集,執行了SQL查詢,並產生了結構化報告。本來需要「至少一整天」的手動工作變成了與AI代理的引導式對話。
這很重要,因為它代表了從AI作為程式設計助手向AI作為工作流程參與者的轉變。雖然Cursor和Claude等工具幫助編寫單個函式,但這種方法透過MCP連接Google Drive、GitHub、BigQuery和分析工具——本質上創建了理解你整個資料基礎設施的AI代理。開發者明確選擇Codex而不是他慣用的Claude來測試工具,這表明這些工作流程正在各供應商之間標準化。
目前還沒有其他報導,這很說明問題。資料科學社群往往對AI炒作持懷疑態度,但這感覺不同——這是一個有具體時間線、檔案大小和工具整合的實際範例。作者承認這是一個使用個人健康資料的「簡單範例」,而不是具有治理要求、資料品質問題或法規約束的企業級複雜性。
對於建構AI工作流程的開發者來說,這驗證了MCP連接不同系統的方法。真正的測試不是AI是否能分析乾淨的資料集——而是它能否處理通常會扼殺個人專案的混亂現實世界資料工程。基於這個範例,我們正在接近目標。
