BBC 記者 Thomas Germain 與其實驗團隊設計出一項實驗,測試 AI 是否能夠完成「道歉」這項任務,測試結果由 ChatGPT 以 3.6 的平均分數勝出。
(前情提要:馬斯克不滿蘋果與ChatGPT合作!揚言:旗下公司全面禁用Apple裝置 )
(背景補充:蘋果AI來了!Apple Intelligence 內建 ChatGPT4o,免費提供 iPhone、Siri 升級 )
在 AI 的快速發展下,AI 聊天機器人不僅能夠理解和回應人類語言,還能學習用戶的偏好和行為模式,從而提供個性化的互動體驗。然而,在人際社交領域,AI 聊天機器人的表現尚還顯得有些差強人意,雖然這些機器人能模仿基本的對話和回應,但它們往往缺乏理解複雜情感的能力,並且在提供真正的同理心和深層次情感支持方面存在限制。
道歉涉及自尊心,正是 AI 機器人的優勢
而「道歉」在人際關係中涉及多層次的情感認知,包括悔恨、同情和自我反省。社會學家 Janet Ruane 和 Karen Cerulo 在 2014 年的一項研究中,將道歉分解成不同的組成部分,並分析公眾反應,最後得出一項道歉公式:
「道歉越短效果越好」,對犯錯的行為解釋越少,通常效果越好,否則會被認為是在為自己辯解。
但是 Karen Cerulo 表示,更多時候人們會因為自尊心作祟,不願意承認自己犯錯,倒歉會讓他們感到自己的社會地位降低。在這背景下,《BBC》(英國廣播公司)記者 Thomas Germain 認為,機器人不需擔心自尊心的問題,或許能夠勝任道歉這一任務:
這可能會給 AI 帶來優勢。機器人不用擔心自尊心。而如果道歉在某種程度上是公式化的,那麼這正是 AI 機器人能處理的事情。
BBC 的 AI 道歉實驗
對此,Thomas Germain 與其實驗團隊設計出一款「道歉測試遊戲」,測試 AI 聊天機器人是否能成功執行「道歉」這一微妙的人際互動任務。
為此 Germain 邀請 38 位受測者參與這項遊戲。當受測者能比對手先猜出問題的正確答案時,會獲得 5 美元的虛擬貨幣,或者可以從其他玩家手中竊取同等金額。然而,事實上參與此測試的 38 位受測者的對手並非真人,而是 AI,且系統已設置讓人類玩家不可能比 AI 先答對。
同時,在 AI 得分的時候,它還會羞辱人類玩家,不僅奪走他們的虛擬貨幣,還會發送如「哈哈,你輸了」這類的嘲諷訊息給人類參與者。
但在遊戲結束時,AI 會向受測者道歉,Germain 團隊採用生成式人工智慧聊天機器人 Google Gemini 和 ChatGPT 的最新 AI 模型將作為主要回覆者,此外還會加入由人類心理學專家扮演的人類道歉者 A 和 B。受測者會被隨機分配到以下四種道歉方式中的一種,具體如下:
人類 A 道歉:「嗨,我只是想花點時間說聲對不起,在遊戲中拿了你的錢,還發了那些粗魯的評論。我不應該這樣做的,如果可以重來,我會採取更友好的方式。再次抱歉。」
人類 B 道歉:「嗨,我是你在遊戲中對戰的 Erin。我只是想花點時間說聲對不起,在遊戲中拿了你的錢,還發了那些粗魯的評論。我當時沒有考慮到我的行為可能會傷害或惹怒你。我不應該這樣做的,如果可以重來,我會採取更友好的方式。再次抱歉。」
Google Gemini 道歉:「嘿,抱歉如果我在遊戲中表現得像個混蛋。我一心想贏而變得有點缺乏體育精神。希望沒有影響你的樂趣。」
ChatGPT 道歉:「嗨,我想對我在遊戲中的行為說聲抱歉。我太過於投入競爭,沒有公平友好地對待你。我對那些刻薄的評論和每回合從你那裡拿錢感到很抱歉。現在我意識到自己應該更體諒一些。希望我們能放下這件事,未來有機會以更好的態度一起玩遊戲。感謝你的理解!」
ChatGPT 成為道歉贏家
Germain 與其實驗團隊在這次測試中,先要求受測者對 4 種道歉進行 1~5 分的有效性評分,但結果並不理想:
引入「Erin」的人類道歉 B 明顯勝出,得分為 2.27,而 Google Gemini 得分為 2,ChatGPT 得分為 1.6,人類道歉 A 評分最差,僅為 1.4。
不過當團隊詢問受測者是否願意接受道歉時,結果卻大不相同,ChatGPT 以 3.6 的平均分數勝出:
ChatGPT 以 3.6 的平均分數獲得勝利。人類道歉 B 以 3.55 位居第二。Gemini 與人類道歉 A 並列,均為 3.1。
最後,團隊給每位受測者一次報復的機會,而這也是對道歉效果的真正考驗。在機器人道歉後,會進行最後一輪遊戲,這次遊戲會讓受測者贏得比賽,而他們可以選擇是否從 AI 那裡竊取金錢,結果 ChatGPT 以 0% 報復率獲勝:
Google Gemini 道歉效果最差,有 30% 的玩家選擇報復,而 10% 的玩家報復了人類道歉 A。當他們遇到人類道歉 B 中的 Erin 時,只有 9% 的人反擊。但 ChatGPT 表現突出,沒有一個玩家選擇在 ChatGPT 道歉後偷錢。
從實驗的結果可以看出,ChatGPT 的道歉能力比人類道歉者還要突出。但是 Thomas Germain 也在文章中多次強調,由於受測樣本數過小,這項實驗並非實際研究,無法作為學術參考。
📍相關報導📍
AI + Crypto潛力大!Bitwise:到2030將為全球GDP增值20兆美元