Zubnet AI學習Wiki › Hume
公司

Hume

別名:共情語音介面、情緒辨識
專注於開發能理解並表達人類情感的人工智慧公司。其 Empathic Voice Interface 可即時偵測語調、情感與情緒脈絡,使人工智慧對話能回應的不只是你說的話,還有你說話的方式。

為什麼重要

Humе之所以重要,是因為他們正在解決現代AI中最明顯的盲點:情感理解。目前每一個聊天機器人、語音助手和AI代理基本上都是對語氣毫無感知,只回應文字的字面內容,卻忽略了人類本能依賴的情感語境。Humе的Empathic Voice Interface是第一個在生產規模上真正嘗試彌合這個缺口的創新,而他們堅持為情感AI制定倫理準則,也樹立了產業最終將被迫採納的標準。

深度解析

Hume AI 於 2021 年由 Alan Cowen 創立,Cowen 是前 Google 研究員,曾在 UC Berkeley 與 Google 花費多年研究情緒科學。Cowen 的學術研究以驚人的細膩度地圖人類情緒表達——他的研究識別出超過 28 種不同的語音情緒類別,並建立大規模資料集用於訓練模型。Hume 是該研究的商業化應用,基於一個論點:大多數 AI 完全忽略了一個重點——說話的方式與說話的內容一樣重要。公司總部設於紐約,已引起投資人與倫理學家的高度關注。

共情語音介面

Hume 的旗艦產品是 Empathic Voice Interface(EVI),一套語音 AI 系統,不僅聆聽語詞,更能辨識語調、語速、語音質地等所編碼的情緒內容。EVI 可即時偵測數十種情緒狀態——挫折、娛樂、困惑、自信、猶豫——並利用這些理解來調節自身回應。實際應用中,這代表由 EVI 驅動的 AI 代理程式能察覺用戶是否感到挫折,並調整語調、放慢語速,或主動轉介至人工客服。它也能在未被要求的情況下,偵測到困惑並重新表述。這並非在後處理階段附加的情緒分析;情緒理解已內建於模型的核心推理迴路中。

產品背後的科學

賦予 Hume 不同凡響的可信度的是其科學基礎的深度。Cowen 在創立公司前已廣泛發表情緒感知的研究,而 Hume 的模型訓練資料集則採用嚴謹的標註協議建立——並非來自 Mechanical Turk 的群眾標註,而是設計用以捕捉跨文化情緒表達的結構化評估。公司的表情測量 API 可同時分析面部表情、語音爆發(笑聲、嘆氣、驚呼)與語音語調,建構情緒狀態的多模態圖像。他們亦發表過自身研究,說明如何公平地跨族群評估情緒模型,這對可能容易編碼文化偏見於「生氣」或「開心」聲音樣式的技術而言至關重要。

倫理即架構

Hume 對情緒 AI 的部署採取異於尋常的原則立場。他們發布了《Hume 倡議》,一套在公司推出商業產品前與研究人員與倫理學家共同制定的情緒 AI 道德準則。其準則明確針對操縱風險——即 AI 系統理解你的情緒狀態後,可能利用它來推銷商品或延長你的參與時間。Hume 的立場是,情緒 AI 應當用來提升人類福祉,而非優化參與度指標,並已在 API 使用條款中設置防護機制以強制執行此原則。當公司擴張時,這些防護機制是否能持續有效仍有待觀察,但僅僅存在這類機制本身,已讓 Hume 在責任層面遠超大多數 AI 公司。

資金與市場機會

Hume 於 2024 年完成 B 輪融資,籌得 5000 萬美元,由 EQT Ventures 領投,累計資金超過 6700 萬美元。他們鎖定的市場規模龐大但尚處萌芽階段:若未來每一個 AI 代理程式、客服機器人與虛擬助理都必須理解並回應情緒,那麼提供這層功能的公司將成為關鍵基礎設施。他們的競爭對手並非其他情緒 AI 新創公司——少有公司具備同等技術深度——而是大型基礎模型公司(如 OpenAI、Google、Anthropic)可能直接將情緒理解內建於其基礎模型中。Hume 的賭注在於,情緒本身足夠困難,且科學足夠專門,因此專注於此的公司將在這方面超越通用模型。考慮到目前大多數 AI 即使處理基本語調提示都表現不佳,這個賭注目前看起來相當合理。

相關概念

← 所有術語
← HiDream 超參數 →
ESC