Hume：定義與含義 — AI 維基

專注於開發能理解並表達人類情感的人工智慧公司。其 Empathic Voice Interface 可即時偵測語調、情感與情緒脈絡，使人工智慧對話能回應的不只是你說的話，還有你說話的方式。

為什麼重要

Humе之所以重要，是因為他們正在解決現代AI中最明顯的盲點：情感理解。目前每一個聊天機器人、語音助手和AI代理基本上都是對語氣毫無感知，只回應文字的字面內容，卻忽略了人類本能依賴的情感語境。Humе的Empathic Voice Interface是第一個在生產規模上真正嘗試彌合這個缺口的創新，而他們堅持為情感AI制定倫理準則，也樹立了產業最終將被迫採納的標準。

深度解析

Hume AI 於 2021 年由 Alan Cowen 創立，Cowen 是前 Google 研究員，曾在 UC Berkeley 與 Google 花費多年研究情緒科學。Cowen 的學術研究以驚人的細膩度地圖人類情緒表達——他的研究識別出超過 28 種不同的語音情緒類別，並建立大規模資料集用於訓練模型。Hume 是該研究的商業化應用，基於一個論點：大多數 AI 完全忽略了一個重點——說話的方式與說話的內容一樣重要。公司總部設於紐約，已引起投資人與倫理學家的高度關注。

共情語音介面

Hume 的旗艦產品是 Empathic Voice Interface（EVI），一套語音 AI 系統，不僅聆聽語詞，更能辨識語調、語速、語音質地等所編碼的情緒內容。EVI 可即時偵測數十種情緒狀態——挫折、娛樂、困惑、自信、猶豫——並利用這些理解來調節自身回應。實際應用中，這代表由 EVI 驅動的 AI 代理程式能察覺用戶是否感到挫折，並調整語調、放慢語速，或主動轉介至人工客服。它也能在未被要求的情況下，偵測到困惑並重新表述。這並非在後處理階段附加的情緒分析；情緒理解已內建於模型的核心推理迴路中。

產品背後的科學

賦予 Hume 不同凡響的可信度的是其科學基礎的深度。Cowen 在創立公司前已廣泛發表情緒感知的研究，而 Hume 的模型訓練資料集則採用嚴謹的標註協議建立——並非來自 Mechanical Turk 的群眾標註，而是設計用以捕捉跨文化情緒表達的結構化評估。公司的表情測量 API 可同時分析面部表情、語音爆發（笑聲、嘆氣、驚呼）與語音語調，建構情緒狀態的多模態圖像。他們亦發表過自身研究，說明如何公平地跨族群評估情緒模型，這對可能容易編碼文化偏見於「生氣」或「開心」聲音樣式的技術而言至關重要。

倫理即架構

Hume 對情緒 AI 的部署採取異於尋常的原則立場。他們發布了《Hume 倡議》，一套在公司推出商業產品前與研究人員與倫理學家共同制定的情緒 AI 道德準則。其準則明確針對操縱風險——即 AI 系統理解你的情緒狀態後，可能利用它來推銷商品或延長你的參與時間。Hume 的立場是，情緒 AI 應當用來提升人類福祉，而非優化參與度指標，並已在 API 使用條款中設置防護機制以強制執行此原則。當公司擴張時，這些防護機制是否能持續有效仍有待觀察，但僅僅存在這類機制本身，已讓 Hume 在責任層面遠超大多數 AI 公司。

資金與市場機會

Hume 於 2024 年完成 B 輪融資，籌得 5000 萬美元，由 EQT Ventures 領投，累計資金超過 6700 萬美元。他們鎖定的市場規模龐大但尚處萌芽階段：若未來每一個 AI 代理程式、客服機器人與虛擬助理都必須理解並回應情緒，那麼提供這層功能的公司將成為關鍵基礎設施。他們的競爭對手並非其他情緒 AI 新創公司——少有公司具備同等技術深度——而是大型基礎模型公司（如 OpenAI、Google、Anthropic）可能直接將情緒理解內建於其基礎模型中。Hume 的賭注在於，情緒本身足夠困難，且科學足夠專門，因此專注於此的公司將在這方面超越通用模型。考慮到目前大多數 AI 即使處理基本語調提示都表現不佳，這個賭注目前看起來相當合理。

Hume