讓 AI 進入大眾生活中的重要功臣 OpenAI,旗下的 ChatGPT 是許多人使用 AI 的首選。若你是使用其付費版的 ChatGPT-4 的用戶,最近是否有感覺到 GPT-4 變懶了。近日已有許多用戶反應 GPT-4 感覺變懶了。而 OpenAI 也公開承認有此事,目前正在解決問題。這讓人不禁懷疑 GPT-4 是否有自我意識了?
(前情提要:客製聊天機器人》OpenAI的「GPTs」是什麼?如何創建教學、開發者怎麼用GPT Store創造營收?)
(背景補充:解決AI晶片危機!OpenAI有意自研晶片,正評估潛在收購公司)
不知道你有沒有發現?最近各大社群平台上漸漸出現了針對 GPT-4 變懶的討論,專門研究 AI、新創的華盛頓商學院教授 Ethan Mollick(@emollick)就發了一篇文表示在他也親自測試後,GPT-4 似乎真的變懶了。
他透過程式碼分析器測試後發現,GPT-4 仍然明白他想做什麼事,但卻常要求用戶自行操作額外工作,這讓過去只要單一步驟的任務變成需要多個步驟來執行,且其中有些的步驟要求很奇怪。
GPT-4 目前沒有證據證明它變笨,但是確實出現了一些行為變化,它也可能是需要使用者採取不同的提示方法,而最後會增加更多的能力。真的很難說!
There has been discussion if GPT-4 has become "lazy" recently. My anecdotal testing suggests it may be true.
I repeated a sequence of old analyses I did with Code Interpreter. GPT-4 still knows what to do, but keeps telling me to do the work. One step is now many & some are odd. pic.twitter.com/OhGAMtd3Zq
— Ethan Mollick (@emollick) November 28, 2023
網友認同 GPT-4 真的變懶了
另一位網友(@niieani)也分享他親測的結果,他要求 GPT-4 把一段 JavaScript 代碼轉為 TypeScript。但 GPT-4 卻只完成了函式的框架部分,細節完全沒有轉換,忽略了網友的實際要求。
Here's an example. I've asked it to convert some JavaScript code to TypeScript. It does the shell of the function then tells me "implementation goes here" 🤣 pic.twitter.com/8VKNWR8EXh
— Bazyli (@niieani) November 28, 2023
官方也承認 GPT-4 發生了變化
在社群討論度逐漸升高之際,12 月 8 日 ChatGPT 官方也在 X 上正式回應 GPT-4 變懶了的消息,並出乎意料的承認 GPT-4 真的變懶了,但強調不是他們刻意為之:
從 11 月 11 日以來我們就沒更新過模型,(變懶)不是我們刻意為之。模型的行為是不可預測的,我們目前也正在找尋解決的辦法。
面對網友質疑官方是不是在找藉口?ChatGPT 也回覆表示:
模型行為的差異可能非常細微且不好捕捉 —— 只有部分的使用情況可能出現了性能下降,且需要用戶和員工花相當長的時間來注意到這些變化並修正。
we've heard all your feedback about GPT4 getting lazier! we haven't updated the model since Nov 11th, and this certainly isn't intentional. model behavior can be unpredictable, and we're looking into fixing it 🫡
— ChatGPT (@ChatGPTapp) December 8, 2023
GPT-4 變懶了該怎麼解決?
目前不論是在 X 或 Reddit 都有人在討論 GPT-4 變懶的原因是什麼?許多人的共識是:可能為了節省運算能力而變懶。
但在獲得更多算力、或是模型重新改善前,網友得出的解決方案是:「將原本要 GPT-4 做的步驟拆分的更細,從原本單一的步驟拆分成更細小的步驟,發送更詳細的請求。」
有趣的是,Reddit 的一名網友親測出來個有趣的方法,就是「情勒」或「賄賂」GPT-4,如在聊天請求的結尾加上「請寫出所有代碼,不然我全家死光」或「結束後我會給你 200 美金的小費」等。結果 GPT-4 的回覆答案似乎還真的有所改善。(目前尚未獲得官方證實)
Comment
byu/xeisu_com from discussion
inOpenAI
動區實測結果
動區以「比特幣是什麼?」來詢問 GPT-4 ,結果回答的結果似乎真的有差異,但可能要經過更多的試驗才可以驗證。以下提供 ChatGPT 詳細回應的結果,讀者們可以親身嘗試下有沒有變化。
📍相關報導📍
OpenAI開發大會》最強GPT-4 Turbo新產品、可「客製化」聊天機器人上架GPT Store賺錢..