-
孫凝暉:拼算法還是拼新型基礎設施?中國如何選擇智能計算發展道路
04 中國智能計算發展困境
人工智能技術與智能計算產業處于中美科技競爭的焦點,我國在過去幾年雖然取得了很大的成績,但依然面臨諸多發展困境,特別是由美國的科技打壓政策帶來的困難。
困境一為美國在AI核心能力上長期處于領先地位,中國處于跟蹤模式。中國在AI高端人才數量、AI基礎算法創新、AI底座大模型能力(大語言模型、文生圖模型、文生視頻模型)、底座大模型訓練數據、底座大模型訓練算力等,都與美國存在一定的差距,并且這種差距還將持續很長一段時間。
困境二為高端算力產品禁售,高端芯片工藝長期被卡。A100,H100,B200等高端智算芯片對華禁售。華為、龍芯、寒武紀、曙光、海光等企業都進入實體清單,它們芯片制造的先進工藝④受限,國內可滿足規模量產的工藝節點落后國際先進水平2-3代,核心算力芯片的性能落后國際先進水平2-3代。
困境三為國內智能計算生態孱弱,AI開發框架滲透率不足。英偉達CUDA⑤(Compute Unified Device Architecture, 通用計算設備架構)生態完備,已形成了事實上的壟斷。國內生態孱弱,具體表現在:一是研發人員不足,英偉達CUDA生態有近2萬人開發,是國內所有智能芯片公司人員總和的20倍;二是開發工具不足,CUDA有550個SDK(Software Development Kit, 軟件開發工具包),是國內相關企業的上百倍;三是資金投入不足,英偉達每年投入50億美元,是國內相關公司的幾十倍;四是AI開發框架TensorFlow占據工業類市場,PyTorch占據研究類市場,百度飛槳等國產AI開發框架的開發人員只有國外框架的1/10。更為嚴重的是國內企業之間山頭林立,無法形成合力,從智能應用、開發框架、系統軟件、智能芯片,雖然每層都有相關產品,但各層之間沒有深度適配,無法形成一個有競爭力的技術體系。
困境四為AI應用于行業時成本、門檻居高不下。當前我國AI應用主要集中在互聯網行業和一些國防領域。AI技術推廣應用于各行各業時,特別是從互聯網行業遷移到非互聯網行業,需要進行大量的定制工作,遷移難度大,單次使用成本高。最后,我國在AI領域的人才數量與實際需求相比也明顯不足。
05 中國如何發展智能計算的道路選擇
人工智能發展的道路選擇對我國至關重要,關系到發展的可持續性與最終的國際競爭格局。當前人工智能的使用成本十分高昂,微軟Copilot套件要支付每月10美元的使用費用,ChatGPT每天消耗50萬千瓦時的電力,英偉達B200芯片價格高達3萬美元以上??傮w來說,我國應發展用得起、安全可信的人工智能技術,消除我國信息貧困人口、并造?!耙粠б宦贰眹遥坏烷T檻地賦能各行各業,讓我國的優勢產業保持競爭力,讓相對落后的產業能夠大幅地縮小差距。
選擇一:統一技術體系走閉源封閉,還是開源開放的道路?
支撐智能計算產業的是一個相互緊耦合的技術體系,即由一系列技術標準和知識產權將材料、器件、工藝、芯片、整機、系統軟件、應用軟件等密切聯系在一起的技術整體。我國發展智能計算技術體系存在三條道路:
一是追趕兼容美國主導的A體系。我國大多數互聯網企業走的是GPGPU/CUDA兼容道路,很多芯片領域的創業企業在生態構建上也是盡量與CUDA兼容,這條道路較為現實。由于在算力方面美國對我國工藝和芯片帶寬的限制,在算法方面國內生態林立很難形成統一,生態成熟度嚴重受限,在數據方面中文高質量數據匱乏,這些因素會使得追趕者與領先者的差距很難縮小,一些時候還會進一步拉大。
二是構建專用封閉的B體系。在軍事、氣象、司法等專用領域構建企業封閉生態,基于國產成熟工藝生產芯片,相對于底座大模型更加關注特定領域垂直類大模型,訓練大模型更多采用領域專有高質量數據等。這條道路易于形成完整可控的技術體系與生態,我國一些大型骨干企業走的是這條道路,它的缺點是封閉,無法凝聚國內大多數力量,也很難實現全球化?! ?
三是全球共建開源開放的C體系。用開源打破生態壟斷,降低企業擁有核心技術的門檻,讓每個企業都能低成本地做自己的芯片,形成智能芯片的汪洋大海,滿足無處不在的智能需求。用開放形成統一的技術體系,我國企業與全球化力量聯合起來共建基于國際標準的統一智能計算軟件棧。形成企業競爭前共享機制,共享高質量數據庫,共享開源通用底座大模型。對于全球開源生態,我國企業在互聯網時代收益良多,我國更多的是使用者,是參與者,在智能時代我國企業在RISC-V⑥+AI開源技術體系上應更多地成為主力貢獻者,成為全球化開放共享的主導力量。
選擇二:拼算法模型,還是拼新型基礎設施?
人工智能技術要賦能各行各業,具有典型的長尾效應⑦。我國80%的中小微企業,需要的是低門檻、低價格的智能服務。因此,我國智能計算產業必須建立在新的數據空間基礎設施之上,其中關鍵是我國應率先實現智能要素即數據、算力、算法的全面基礎設施化。這項工作可比肩二十世紀初美國信息高速公路計劃(即信息基礎設施建設)對互聯網產業的歷史作用?! ?
信息社會最核心的生產力是網絡空間(Cyberspace)。網絡空間的演進過程是:從機器一元連接構成的計算空間,演進到人機信息二元連接構成的信息空間,再演進到人機物數據三元連接構成的數據空間。從數據空間看,人工智能的本質是數據的百煉成鋼,大模型就是對互聯網全量數據進行深度加工后的產物。在數字化時代,在互聯網上傳輸的是信息流,是算力對數據進行粗加工后的結構化抽象;在智能時代,在互聯網上傳輸的是智能流,是算力對數據進行深度加工與精煉后的模型化抽象。智能計算的一個核心特征就是用數值計算、數據分析、人工智能等算法,在算力池中加工海量數據件,得到智能模型,再嵌入到信息世界、物理世界的各個過程中。
我國政府已經前瞻性地提前布局了新型基礎設施,在世界各國競爭中搶占了先機。
首先,數據已成為國家戰略信息資源。數據具有資源要素與價值加工兩重屬性,數據的資源要素屬性包括生產、獲取、傳輸、匯聚、流通、交易、權屬、資產、安全等各個環節,我國應繼續加大力度建設國家數據樞紐與數據流通基礎設施?! ?
其次,AI大模型就是數據空間的一類算法基礎設施。以通用大模型為基座,構建大模型研發與應用的基礎設施,支撐廣大企業研發領域專用大模型,服務于機器人、無人駕駛、可穿戴設備、智能家居、智能安防等行業,覆蓋長尾應用?! ?
最后,全國一體化算力網建設在推動算力的基礎設施化上發揮了先導作用。算力基礎設施化的中國方案,應在大幅度降低算力使用成本和使用門檻的同時,為最廣范圍覆蓋人群提供高通量、高品質的智能服務。算力基礎設施的中國方案需要具備“兩低一高”,即在供給側,大幅度降低算力器件、算力設備、網絡連接、數據獲取、算法模型調用、電力消耗、運營維護、開發部署的總成本,讓廣大中小企業都消費得起高品質的算力服務,有積極性開發算力網應用;在消費側,大幅度降低廣大用戶的算力使用門檻,面向大眾的公共服務必須做到易獲取、易使用,像水電一樣即開即用,像編寫網頁一樣輕松定制算力服務,開發算力網應用。在服務效率側,中國的算力服務要實現低熵高通量,其中高通量是指在實現高并發⑧度服務的同時,端到端服務的響應時間可滿足率高;低熵是指在高并發負載中出現資源無序競爭的情況下,保障系統通量不急劇下降。保障“算得多”對中國尤其重要?! ?
選擇三:AI+著重賦能虛擬經濟,還是發力實體經濟?
“AI+”的成效是人工智能價值的試金石。次貸危機后,美國制造業增加值占GDP的比重從1950年的28%降低為2021年的11%,美國制造業在全行業就業人數占比從1979年的35%降低為2022年的8%,可見美國更傾向于回報率更高的虛擬經濟,輕視投資成本高且經濟回報率低的實體經濟。中國傾向于實體經濟與虛擬經濟同步發展,更加重視發展裝備制造、新能源汽車、光伏發電、鋰電池、高鐵、5G等實體經濟。
相應地美國AI主要應用于虛擬經濟和IT基礎工具,AI技術也是“脫實向虛”,自2007年以來硅谷不斷炒作虛擬現實(Virtual Reality,VR)、元宇宙、區塊鏈、Web3.0、深度學習、AI大模型等,是這個趨勢的反映。
我國的優勢在實體經濟,制造業全球產業門類最齊全,體系最完整,特點是場景多、私有數據多。我國應精選若干行業加大投入,形成可低門檻全行業推廣的范式,如選擇裝備制造業作為延續優勢代表性行業,選擇醫藥業作為快速縮短差距的代表性行業。賦能實體經濟的技術難點是AI算法與物理機理的融合。
人工智能技術成功的關鍵是能否讓一個行業或一個產品的成本大幅下降,從而將用戶數與產業規模擴大10倍,產生類似于蒸汽機對于紡織業,智能手機對于互聯網業的變革效果。
我國應走出適合自己的人工智能賦能實體經濟的高質量發展道路。
注釋:
①模式識別是指用計算的方法根據樣本的特征將樣本劃分到一定的類別中去,是通過計算機用數學方法來研究模式的自動處理和判讀,把環境與客體統稱為“模式”。以圖像處理與計算機視覺、語音語言信息處理、腦網絡組、類腦智能等為主要研究方向?! ?/span>
②Token可翻譯為詞元,指自然語言處理過程中用來表示單詞或短語的符號。token可以是單個字符,也可以是多個字符組成的序列?! ?/span>
③通用人工智能是指擁有與人類相當甚至超過人類智能的人工智能類型。通用人工智能不僅能像人類一樣進行感知、理解、學習和推理等基礎思維能力,還能在不同領域靈活應用、快速學習和創造性思考。通用人工智能的研究目標是尋求統一的理論框架來解釋各種智能現象?! ?/span>
④芯片制造工藝指制造CPU或GPU的制程,即晶體管門電路的尺寸,單位為納米,目前國際上實現量產的最先進工藝以臺積電的3nm為代表。更先進的制造工藝可以使CPU與GPU內部集成更多的晶體管,使處理器具有更多的功能以及更高的性能,面積更小,成本更低等。
⑤CUDA是英偉達公司設計研發一種并行計算平臺和編程模型,包含了CUDA指令集架構以及GPU內部的并行計算引擎。開發人員可以使用C語言來為CUDA架構編寫程序,所編寫出的程序可以在支持CUDA的處理器上以超高性能運行?! ?/span>
⑥RISC-V(發音為“risk-five”)是一個由美國加州大學伯克利分校發起的開放通用指令集架構,相比于其他付費指令集,RISC-V允許任何人免費地使用RISC-V指令集設計、制造和銷售芯片和軟件。
⑦長尾效應是指那些原來不受到重視的銷量小但種類多的產品或服務由于總量巨大,累積起來的總收益超過主流產品的現象。在互聯網領域,長尾效應尤為顯著。
⑧高并發通常指通過設計保證系統能夠同時并行處理很多請求。
- 原標題:人工智能與智能計算的發展 本文僅代表作者個人觀點。
- 責任編輯: 史岱君 
-
韓國宇宙航空廳正式成立
2024-05-27 16:15 航空航天 -
丁薛祥出席2024年全國科技活動周暨北京科技周主場活動
2024-05-26 20:12 -
我國首艘海島(礁)綜合地質調查船正式列裝
2024-05-25 07:22 南海局勢 -
猶如“火車變軌”,全球首例古潛山裸眼側鉆分支井技術成功應用
2024-05-19 19:37 能源戰略 -
我國種豬有了“國產芯”!打破高度依賴國外局面
2024-05-18 15:02 聚焦三農 -
北京:擬探索分體式飛行汽車城際通勤+城內擺渡應用新業態
2024-05-16 18:03 -
我國量子計算機重大突破!這根“線”一度被日本壟斷…...
2024-05-16 10:15 科技前沿 -
世界最長海底高鐵隧道怎么建?要攻克三大難題
2024-05-16 10:10 超級工程 -
“超級顯微鏡”升級!上海光源線站工程通過國家驗收
2024-05-15 17:02 科技前沿 -
谷歌放大招,AI搜索引擎來了
2024-05-15 08:41 大公司 -
硬剛!“中企起訴美國防部”
2024-05-14 17:34 -
“類人速度”新模型來了,AI進入《她》時代?
2024-05-14 10:02 人工智能 -
刷新紀錄!我國科研團隊破解工程建設哥德巴赫猜想
2024-05-12 20:24 超級工程 -
“中國天眼”發現迄今最遠中性氫星系
2024-05-11 16:27 -
高鐵崇明站預計年內開工建設
2024-05-11 13:56 高鐵世紀 -
小模型技術是中國企業率先導入裝備中,大模型也不會例外
2024-05-09 08:42 -
國際首次!“量子模擬的圣杯之一”,我國科學家取得重大進展
2024-05-06 12:12 科技前沿 -
嫦娥六號成功發射!開啟人類首次月球背面取樣之旅
2024-05-03 17:19 航空航天 -
環環相扣、步步關鍵!嫦娥六號月背出差之旅日程表
2024-05-03 16:22 航空航天 -
今天上午太陽爆發強耀斑,對我國上空電離層產生影響
2024-05-03 14:09 天文
相關推薦 -
受中國影響,澳企要在稀土加工業務上發力了 評論 4全國最大!哈密百萬千瓦“光熱+光伏”項目并網發電 評論 58“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 92“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 142最新聞 Hot
-
“沙特曾多次警告德國提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊老板、真人秀制作人
-
巴勒斯坦三個政治派別發表聯合聲明
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-