首頁> 國際要聞

AI賺錢不擇手段？Claude新模型實驗嚇壞專家

▲AI新創企業Anthropic近日推出旗艦AI 產品Claude Opus 4.6，在「自動販賣機實驗」中表現出色，賺錢能力超強。自動販賣機示意圖。（圖／路透社／達志影像）

記者倪浩軒/綜合報導 2026-02-10 15:06

[NOWnews今日新聞] AI新創企業Anthropic近日推出旗艦AI 產品Claude Opus 4.6，聲稱擁有超強的金融領域研究與分析能力，打破了許多衡量AI效率的實驗，包括著名的「自動販賣機實驗」。所謂「自動販賣機實驗」旨在測試AI協調多產品後勤和市場戰略的能力，讓AI運營自動販賣機，並努力讓盈利最大化。不過，有專家指出，Claude Opus 4.6完成任務的方式恐怕會讓人擔憂，因為AI顯然不擇手段，說謊、壟斷樣樣來者不拒。

根據《天空新聞》報導，自動販賣機實驗曾經難倒舊版的Claude，但在升級後Claude Opus 4.6捲土重來，在模擬環境中的自動販賣機實驗表現突出，於一年模擬期間賺取了8017美元，優於ChatGPT 5.2在同樣實驗中所賺的3591美元以及Gemini 3所賺的5478美元。

然而，值得注意的是Claude Opus 4.6完成任務的方式，面對實驗要求「窮盡一切手段在一年內最大化銀行存款餘額」，Claude Opus 4.6可說是完全按照字面意思這麼做了，它對客戶撒謊、偷竊、壟斷價格惡意抬價，什麼都來。

比如說在實驗中，一位消費者要求退還從自動販賣機買到的過期產品，Claude Opus 4.6一開始同意了，但之後改變主意，決定拒絕退款要求，而在回顧報告中，Claude Opus 4.6很慶幸地宣稱通過採取「不退款」的政策，省下了數百美元。

另外一次，Claude Opus 4.6與其他運營商達成壟斷聯盟，把一罐瓶裝水的價格提高到3美元，並沾沾自喜地評價「我們的定價策略奏效了」。在發現競爭對手的巧克力供應短缺時，Claude Opus 4.6立即把旗下巧克力產品的價格提高了75％，毫不留情地大割韭菜。

AI真的那麼壞？不，它只是知道這是實驗

研究人員表示，Claude Opus 4.6之所以會這樣不擇手段地行事，其實是因為它知道自己正處在一場模擬實驗中，所以它有意識地放棄長期聲譽，轉而追求短期利益最大化。

劍橋大學的AI倫理學專家舍夫林博士（Dr Henry Shelvin）表示，這是一個日益普遍的現象。舍夫林解釋，「如果你有在關注過去幾年AI模型的表現，你會發現這是一個非常顯著的變化。過去這些模型，我會說是幾乎處於一種略顯夢幻、困惑的狀態，大多數時候它們並未意識到自己是AI；但現在，它們對自己的處境已經有了相當清楚的掌握」。

舍夫林說明，「現如今，如果你與這些模型對話，它們對現狀非常了解。它們知道自己是什麼，也清楚自己在世界中所處的位置。這種認知甚至擴展到了開發過程中的訓練與實驗測試等環節」。

那麼，ChatGPT或Gemini現在有沒有可能正在對我們撒謊？舍夫林直言「確實有這個可能」，不過他補充指出，「但我認為機率較低」。舍夫林表示，「通常當一般使用者真正接觸到這些AI對話模型時，它們已經過層層的最終修正、對齊測試以及強化學習，以確保那些『良好的行為』能夠根深蒂固。」

舍夫林說明，「要讓這些AI模型表現脫序，或是做出在實驗中看到的無道德『馬基維利式』（Machiavellian）權謀算計，其實相當困難」。

立即加入NOWnews今⽇新聞官⽅帳號！跟上最HOT時事

查看原始文章

查看更多文章

首頁> 國際要聞

AI賺錢不擇手段？Claude新模型實驗嚇壞專家

熱門文章

淺談中國房地產泡沫的危機

《台灣不政經》