首頁> 國際要聞

如何評價DeepSeek?日本AI研究第一人這樣說

▲中國AI新創公司「深度求索」(DeepSeek)的AI語言模型問世後,掀起全球熱議。(圖/美聯社/達志影像)

▲中國AI新創公司「深度求索」(DeepSeek)的AI語言模型問世後,掀起全球熱議。(圖/美聯社/達志影像)

[NOWnews今日新聞] 中國AI新創公司「深度求索」(DeepSeek)的AI語言模型問世後,掀起全球熱議。對此,日本AI研究領域第一人、東京大學教授松尾豐給予高度肯定,稱DeepSeek技術出色,性能與美國OpenAI接近,還說像DeepSeek這樣沒有雄厚資本的公司,能夠實現世界最先進的技術,對日本新創企業來說也是一種鼓舞。

《日經中文網》專門採訪松尾豐,詢問其一系列關於DeepSeek的問題。首先被問到如何評價DeepSeek的技術時,松尾豐表示,技術很出色,性能與運營ChatGPT的美國OpenAI接近。松尾豐也指出,DeepSeek每次發布新的AI模型,都會發表論文,詳細説明模型採用了什麼樣的技術,以及花費心思實施的改進之處。1月發布的最新模型「R1」進行了提升推理能力的強化學習,展現出了與OpenAI的「o1」同等級的推理能力。

而在被問到中美之間AI競爭的格局是否因此發生變化時,松尾豐認為,中國的AI水準相當高,可以與美國比肩。至少從頂尖論文數量來看,中國甚至已經超過美國。另外,中國有阿里巴巴、騰訊、百度等實力強勁的企業,擁有眾多優秀工程師。在這樣的生態系統中,AI不斷得到開發與應用。出現DeepSeek這樣極具實力的企業,並不令人驚訝。

被問到DeepSeek的出現對日本會産生何種影響時,松尾豐表示,像DeepSeek這樣並非大型科技企業、也沒有雄厚資本的公司,竟然能夠實現世界最先進的技術,這對日本的新創企業來説也是一種鼓舞。即便在日本國內,只要紮實地進行技術開發,就有可能完成這樣的飛躍。

被問到DeepSeek採取的開源策略,松尾豐則指出,同樣採取開源策略的還有美國Meta的「Llama」,阿里巴巴的「Qwen」也採取開源。在日本,基於這兩家企業的AI語言模型進行學習的動向十分活躍。如果基礎模型紮實,就能輕鬆提升性能。不過,松尾豐認為若要評價開源好或是像OpenAI那樣非公開系統好,雙方的競爭始終存在,哪一方勝出會因狀況而變。無論如何,DeepSeek的出現,使得開源陣營的勢力得到很大的恢復。雖然OpenAI及Google擁有性能卓越的非公開模型,但至少DeepSeek表明開源陣營也能做到同樣的事情。

關於OpenAI指控DeepSeek違規使用「蒸餾」技術學習ChatGPT,松尾豐說自己不知道實際的情況真假,但是,即使在美國企業之間,類似的傳聞也時有所聞,且這也可能涉及到中美之間的政治含義。

而被問到如何看待使用DeepSeek的安全風險時,松尾豐表示,DeepSeek開源可以下載程式並在本地運作,這樣的話,數據就不可能被發送到某個地方。另一方面,DeepSeek本身的服務在中國的伺服器上運作,使用者的數據會發送到中國的伺服器,在中國進行處理並返回。雖然DeepSeek表示不會使用這些數據進行學習,但實際上並不排除使用的可能性。松尾豐指出,這點對於DeepSeek還是OpenAI來説都一樣,主要是「你對對方投以多大信任的問題」。

最後被問到DeepSeek是否加劇了中美對立,松尾豐表示從研究者的角度來看,並不認為DeepSeek做了什麼特別的事情,相反,「我認為他們只是在好好搞技術並將其發布」。

立即加入NOWnews今⽇新聞官⽅帳號!跟上最HOT時事

查看原始文章

查看更多文章