-
中國AI公司幾個月就弄通了OpenAI的推理模型,美研究人員:我們很驚訝
最后更新: 2024-12-25 13:18:24【文/觀察者網 賴家琪】“中國初創公司已展現出趕超美國人工智能(AI)模型的跡象,而且他們追趕的速度比許多業內人士預期的要快。”美國《華爾街日報》在12月24日的一篇報道中,通過對比中美兩國AI企業推理模型的表現以及研發速度,得出了以上結論。
11月,由中國私募巨頭幻方量化投資的AI公司DeepSeek(深度求索)發布了其推理模型DeepSeek-R1的預覽版。根據DeepSeek的說法,這一模型的能力已接近甚至超越了OpenAI于今年9月發布的推理模型o1的預覽版。
除了DeepSeek外,擁有中國互聯網巨頭阿里巴巴和騰訊投資的初創公司Moonshot AI(月之暗面)表示,他們開發了一種專門用于數學的模型,其功能接近o1。阿里巴巴也稱,他們自己的一個實驗模型在解決數學問題上的表現優于美國模型的預覽版。
《華爾街日報》稱,由于這些公司尚未發表描述其模型的論文,且現在沒有一致認可的對AI模型能力進行評估的單一測試,目前很難驗證這些中國公司的說法。盡管如此,一些美國專家表示,他們對此“印象深刻”。
“中國正在更快地迎頭趕上。”OpenAI前研究員、現為AI企業家的安德魯·卡爾(Andrew Carr)說,DeepSeek研究員在“在幾個月內就弄通了OpenAI推理模型的辦法,坦率地說,我的許多同事都對此感到驚訝”。
《華爾街日報》用今年美國數學競賽AIME中的15個問題進行了測試。他們發現,OpenAI的推理模型還是要比中國幾家公司的推理模型更快地找到答案。測試結果顯示,OpenAI模型在10秒內給出了答案,而DeepSeek花了2分多鐘。
不過,該報仍稱贊了DeepSeek的表現,稱在目前很多AI模型被簡單數學問題難倒的情況下,DeepSeek第一次就得到正確答案是“一項壯舉”。
DeepSeek(深度求索)官網
中國AI公司能在短時間內達成“壯舉”得益于多重原因。
與許多美國公司不同,大部分中國公司更愿意與其他企業和軟件開發商共享底層代碼。這種共享代碼的行為在AI領域被稱為“開源”。美國《紐約時報》稱,開源一直是計算機軟件、互聯網以及當前AI發展的基石,因為開源的支持者認為,當代碼可供任何人免費檢查、使用和改進時,技術就會進步得更快。
“開源技術是中國的戰略優勢。”美國《科技時報》12月17日稱,中國公司讓任何人都能接觸到模型源代碼,可以在全球范圍內引發創新并建立開發人員社區,這不僅推動了技術的進步,而且使中國的模型出現在全球AI地圖上。
《紐約時報》也注意到了開源模式給中國帶來的優勢。該報稱,2023年年底有人發現,李開復創建的AI公司01.AI(零一萬物)使用了美國公司Meta的開源模型構建其AI系統。但轉折發生在6個月后。當時,01.AI發布了新一代模型,美國斯坦福大學的一個團隊也在那段時間也推出了Llama 3-V開源模型。但隨后,Llama 3-V很快被爆出與中國大模型公司面壁智能的開源成果MiniCPM-Llama3-V 2.5擁有幾乎完全相同的模型架構與代碼,引發“抄襲”質疑。
該報指出,這與01.AI去年面臨的爭議相反:中國開發人員不再在美國技術之上構建,而是美國開發人員在中國技術之上構建。
總部位于紐約的AI公司Hugging Face(抱抱臉)的首席執行官克萊門特·德朗格(Clément Delangue)表示,美國監管機構限制美國的開源項目,中國的開源模型成為黃金標準,此類事情可能會成為常態,“如果這種趨勢繼續下去,美國將面臨越來越大的挑戰”。
為了扼制中國發展AI的能力,美國政府自2022年來一直在限制中國獲得世界上最先進的AI芯片。今年12月,臨卸任的拜登政府再次收緊了對中國出口AI芯片的途徑。
但是,《華爾街日報》稱,中國開發人員已經找到了解決方法。Moonshot AI創始人楊植麟稱,該公司專注于強化學習(Reinforcement Learning,一種機器學習方法),模仿人類的試錯。報道稱,這種方法在提高性能時,可能會減少算力的使用強度。
《華爾街日報》報道稱,自去年年底以來,AI開發人員越來越多地使用一種稱為“混合專家模型”(MoE)的技術。該技術將問題引導到專門的子模型(即“專家”)處去解決問題,就像主廚將意大利面訂單定向到廚房的意大利廚師處那樣。這個過程也減輕了對芯片的要求。
騰訊的混合專家模型于今年11月發布。據稱,該模型的性能與Meta今年7月推出的Llama 3.1模型相當。審查了兩家公司論文的研究人員表示,騰訊的模型可能僅用了Meta約1/10的算力訓練的。
DeepSeek在2021年用1萬個英偉達A100芯片構建了一個用于AI訓練的Fire-Flyer 2集群。今年8月,DeepSeek在一篇論文中表示,Fire-Flyer 2的性能接近于英偉達的一個包含類似芯片的系統,但DeepSeek的系統成本更低,能耗更低。
美國AI初創公司Anthropic聯合創始人杰克·克拉克(Jack Clark)在他的博客中寫道,“中國繞過出口管制的一種方式是,利用他可以訪問的硬件構建非常好的軟件和硬件訓練堆棧”,“就像電動汽車、無人機和其他技術一樣,中國制造將在AI模型中占據一席之地”。
《華爾街日報》指出,缺乏尖端芯片、籌資難等問題仍是中國AI公司面臨的幾大挑戰。但接受該報采訪的中國AI公司高管將這比作帶著鐐銬跳舞,他表示“專注于我們擅長的事情是生存的唯一機會,而且可能是獲勝”。
《科技時報》稱,美國和中國在AI生態系統上的競爭,與過去windows和iOS操作系統的競爭類似,贏家可能會主導數字行業,影響未來幾年全球市場和用戶的行為。雖然美國制裁很難突破,但中國更加專注于開源模型和國內創新,這使它成為世界上最大的AI大國之一。“全世界都在等著看,中國是否會超越西方競爭對手。”
本文系觀察者網獨家稿件,未經授權,不得轉載。
- 責任編輯: 賴家琪 
-
“特朗普:加拿大、格陵蘭、巴拿馬,全都要,買買買”
2024-12-25 11:55 特朗普 -
“如果我是特朗普,就再搞‘尼克松訪華’行動”
2024-12-25 11:40 中美關系 -
國臺辦正告臺當局:膽敢鋌而走險,必將自取滅亡
2024-12-25 11:37 臺灣 -
全國人大外事委員會:強烈不滿、堅決反對
2024-12-25 11:28 中美關系 -
手機都要搭載AI了,智能眼鏡為何沒有大突破?
2024-12-25 11:24 -
中方反制后加拿大再次顛倒黑白,我使館發聲
2024-12-25 10:54 -
巖屋毅今訪華:不能重蹈錯誤國策
2024-12-25 10:39 日本 -
特朗普懟拜登:我一就職,就要大力推死刑!
2024-12-25 10:32 美國一夢 -
“中國人學習能力強又勤奮,美國卡不住脖子”
2024-12-25 10:20 -
美政府審查最后一刻仍無共識,球踢給拜登
2024-12-25 08:40 美國一夢 -
克林頓已出院,病因公布
2024-12-25 08:18 美國政治 -
敘利亞各方達成協議:解散所有武裝派別
2024-12-25 07:56 -
阿富汗臨時政府稱巴基斯坦轟炸該國一地
2024-12-25 07:13 阿富汗 -
“特朗普的當代美國‘天命論’霸凌,只會把盟友推向中國”
2024-12-24 23:18 應對特朗普沖擊波 -
俄貨船爆炸沉沒,正執行敘利亞撤離任務?
2024-12-24 22:54 俄羅斯之聲 -
也門胡塞武裝稱使用高超音速彈道導彈打擊以色列軍事目標
2024-12-24 22:50 -
涉華條款全被刪,與他有關?
2024-12-24 22:35 美國政治 -
他如何讓敘利亞超越“1400年恩怨”?世界都在看
2024-12-24 22:21 敘利亞內戰 -
王毅:中國奉行不干涉內政原則,相信韓國人民有能力妥善處理
2024-12-24 21:24 中國外交
相關推薦 -
征訂教輔就看哪本回扣多,教輔緣何變“教腐”? 評論 127超一半被中國掌握,美媒慌了:北約危 評論 158特朗普想“開疆拓土”,這也能扯上中國? 評論 84美國盯上非洲,最害怕中俄戳穿... 評論 78“如果我是特朗普,就再搞‘尼克松訪華’行動” 評論 272最新聞 Hot
-
埃爾多安最新警告:放下武器,否則將被埋葬
-
距離導彈30米!差點打下第二架...
-
“他們對自己國家都沒辦法,就別說‘自由世界’了”
-
美情報官員聲稱:派兵援俄是朝鮮主動提出的
-
超一半被中國掌握,美媒慌了:北約危
-
效仿特斯拉,豐田欲在華獨資建廠?
-
“中國衛星給美國帶來一場壯觀的燈光秀”
-
又污蔑!特朗普內閣人選:就是停止資助中國
-
特朗普話音剛落,丹麥:北極國防開支得加大
-
美國盯上非洲,最害怕中俄戳穿...
-
“如果我是特朗普,就再搞‘尼克松訪華’行動”
-
“君主制廢除50年了,還有人鼓吹高貴血統…”
-
他將被引渡至美國,曾因訓練中國飛行員遭“誘捕”
-
中國AI幾個月就弄通了,“我們很驚訝”
-
“特朗普:加拿大、格陵蘭、巴拿馬,全都要,買買買”
-
美政府審查最后一刻仍無共識,球踢給拜登
-