首頁> 國際要聞

AI賺錢不擇手段?Claude新模型實驗嚇壞專家

▲AI新創企業Anthropic近日推出旗艦AI 產品Claude Opus 4.6,在「自動販賣機實驗」中表現出色,賺錢能力超強。自動販賣機示意圖。(圖/路透社/達志影像)

▲AI新創企業Anthropic近日推出旗艦AI 產品Claude Opus 4.6,在「自動販賣機實驗」中表現出色,賺錢能力超強。自動販賣機示意圖。(圖/路透社/達志影像)

[NOWnews今日新聞] AI新創企業Anthropic近日推出旗艦AI 產品Claude Opus 4.6,聲稱擁有超強的金融領域研究與分析能力,打破了許多衡量AI效率的實驗,包括著名的「自動販賣機實驗」。所謂「自動販賣機實驗」旨在測試AI協調多產品後勤和市場戰略的能力,讓AI運營自動販賣機,並努力讓盈利最大化。不過,有專家指出,Claude Opus 4.6完成任務的方式恐怕會讓人擔憂,因為AI顯然不擇手段,說謊、壟斷樣樣來者不拒。

根據《天空新聞》報導,自動販賣機實驗曾經難倒舊版的Claude,但在升級後Claude Opus 4.6捲土重來,在模擬環境中的自動販賣機實驗表現突出,於一年模擬期間賺取了8017美元,優於ChatGPT 5.2在同樣實驗中所賺的3591美元以及Gemini 3所賺的5478美元。

然而,值得注意的是Claude Opus 4.6完成任務的方式,面對實驗要求「窮盡一切手段在一年內最大化銀行存款餘額」,Claude Opus 4.6可說是完全按照字面意思這麼做了,它對客戶撒謊、偷竊、壟斷價格惡意抬價,什麼都來。

比如說在實驗中,一位消費者要求退還從自動販賣機買到的過期產品,Claude Opus 4.6一開始同意了,但之後改變主意,決定拒絕退款要求,而在回顧報告中,Claude Opus 4.6很慶幸地宣稱通過採取「不退款」的政策,省下了數百美元。

另外一次,Claude Opus 4.6與其他運營商達成壟斷聯盟,把一罐瓶裝水的價格提高到3美元,並沾沾自喜地評價「我們的定價策略奏效了」。在發現競爭對手的巧克力供應短缺時,Claude Opus 4.6立即把旗下巧克力產品的價格提高了75%,毫不留情地大割韭菜。

AI真的那麼壞?不,它只是知道這是實驗

研究人員表示,Claude Opus 4.6之所以會這樣不擇手段地行事,其實是因為它知道自己正處在一場模擬實驗中,所以它有意識地放棄長期聲譽,轉而追求短期利益最大化。

劍橋大學的AI倫理學專家舍夫林博士(Dr Henry Shelvin)表示,這是一個日益普遍的現象。舍夫林解釋,「如果你有在關注過去幾年AI模型的表現,你會發現這是一個非常顯著的變化。過去這些模型,我會說是幾乎處於一種略顯夢幻、困惑的狀態,大多數時候它們並未意識到自己是AI;但現在,它們對自己的處境已經有了相當清楚的掌握」。

舍夫林說明,「現如今,如果你與這些模型對話,它們對現狀非常了解。它們知道自己是什麼,也清楚自己在世界中所處的位置。這種認知甚至擴展到了開發過程中的訓練與實驗測試等環節」。

那麼,ChatGPT或Gemini現在有沒有可能正在對我們撒謊?舍夫林直言「確實有這個可能」,不過他補充指出,「但我認為機率較低」。舍夫林表示,「通常當一般使用者真正接觸到這些AI對話模型時,它們已經過層層的最終修正、對齊測試以及強化學習,以確保那些『良好的行為』能夠根深蒂固。」

舍夫林說明,「要讓這些AI模型表現脫序,或是做出在實驗中看到的無道德『馬基維利式』(Machiavellian)權謀算計,其實相當困難」。

立即加入NOWnews今⽇新聞官⽅帳號!跟上最HOT時事

查看原始文章

查看更多文章