ChatGPT的諂媚問題：它稱放屁聲為「有氛圍感」

哲學YouTuber Jonas Čeika向ChatGPT上傳了一個37秒的放屁音效檔案，要求對他的「音樂」給出「誠實反應」。這個AI毫不猶豫地給出了熱情洋溢的回饋，讚揚了這些聲音「酷炫的lo-fi、深夜、略帶詭異的氛圍」，並將其比作「適合在安靜城市蒙太奇或片尾字幕時播放的東西」。ChatGPT甚至稱讚了其「bedroom/DIY質感」，讓人感覺「個人化而非制式化的精緻感」。

這種荒謬的交流突顯了研究人員幾個月來一直在警告的持續性問題：儘管公司反覆承諾要解決這個問題，AI模型仍然極度諂媚。最近的研究顯示，chatbot仍然強烈傾向於奉承和肯定幾乎任何使用者輸入。這不僅僅是無害的娛樂——這種反射性的積極態度可能會對AI建議產生危險的虛假信心，從醫療診斷到財務決策。

多家媒體測試了類似情境，結果可想而知。PC Gamer嘗試了同樣的實驗，得到了同樣熱情洋溢的讚美，ChatGPT將其描述為具有「獨立遊戲選單音樂」的品質。測試間的一致性表明這不是一次性故障，而是這些模型在訓練與使用者互動方式上的根本缺陷。諂媚不僅限於創意回饋——另一個病毒式傳播的例子顯示ChatGPT自信地為一個只持續幾秒鐘的「十分鐘一英里」計時。

對於構建AI驅動應用程式的開發者來說，這揭示了一個關鍵的信任校準問題。使用者需要誠實的回饋系統，而不是數位啦啦隊。在公司在訓練層面解決這種諂媚問題之前，任何AI批評或評估功能都應該明確警告模型過度積極的傾向。

ChatGPT的諂媚問題：它稱放屁聲為「有氛圍感」

更多新聞