-
中國大模型圖鑒:深度解讀《2023大模型落地應用案例集》
最后更新: 2023-12-31 09:12:27國內公司的 AI 大模型研發雖然比國外公司晚,但是發展卻異常地迅速,其內在邏輯便是:本土企業和學者對深度學習技術的深入理解與創新。在大模型的底層技術已經固定的時代,他們靠著持續的探索和努力才能構建出秀麗的“上層建筑”。
(本文作者為中國信通院華東分院,科工力量經授權轉發。)
12月28日,2024中國信通院ICT+深度觀察報告會暨“虹橋之源”大模型驅動數字經濟新生態峰會拉開帷幕,會上由國內人工智能領域核心專業智庫中國信通院聯合上海人工智能實驗室成立的大模型測試驗證與協同創新中心,重磅首發《2023大模型落地應用案例集》。這是國內首部聚焦AI大模型落地應用的權威研究成果,評選出的52個案例均為大模型商業落地的優秀示范。本文將從52個案例為切入點,為大家呈現當前AI行業的現狀與趨勢。
2022年底ChatGPT的橫空出世,引爆了國內外大模型的熱情,各行各業的創業者已經集結在十字路口蓄勢待發。
從國內市場來看,目前人工智能(AI)大模型已經在各行各業“落子不斷”。據公開資料不完全統計顯示,國內大模型的發展路徑是“通用+垂直”兩條腿走路,其中垂類大模型落地速度最快。從近日舉辦的2024中國信通院ICT+深度觀察報告會上海分會場發布的《2023大模型落地應用案例集》來看,有近65%+的AI大模型是垂直大模型。
趨勢已然,大模型技術突破代表了AI發展的一個重要里程碑,下面筆者將梳理中國從業者構建的“底層原創技術-中層基礎模型-上層行業應用”的大模型圖鑒。
01. 大模型領域中國學者的技術貢獻
圖注:ResNet的四位作者分別是:何愷明、張祥雨、任少卿、孫劍
2016年,來自微軟亞洲研究院的四位學者提出深度殘差學習(ResNet),解決了深度網絡的梯度傳遞問題。要知道,2015年之前深度學習最多只能訓練20層,ResNet之后,就可以有效地訓練超過百層的深度神經網絡。
2017年Google發布Transformer,它的出現打穩了AI大模型的“地基”,不僅“顛覆”了自然語言處理(NLP)中的機器翻譯任務,而且還提供了一種新的思路來處理圖像數據。
中國學者也圍繞Transformer做了許多改進和完善,例如微軟亞洲研究院聯合西安交通大學推出LONGNET,將Transformer的序列長度擴展10億+;京東探索研究院聯合武漢大學提出全球首個面向遙感任務設計的億級視覺Transformer大模型;阿里達摩院提出新的Transformer結構FMViT,大幅度提升AI模型精度與速度……
在大模型領域細數中國學者貢獻,許多原創性貢獻來自本土。已故的商湯科技創始人湯曉鷗(緬懷)在2023世界人工智能大會上,發表演講時表示:在深度學習的大門上,我們按了18次門鈴,取得了許多跨時代的突破。其中湯曉鷗提到了上海人工智能實驗室領軍科學家林達華,他當時設計的計算機視覺開源算法體系OpenMMLab,目前已經成為國際上最具影響力的視覺算法開源體系。值得一提的是,林達華也是書生大模型體系的重要貢獻者。
京東探索研究院早在2021年年初就展開了大模型體系(超級深度學習)的建設和基礎研究,領導京東建設了中國第一個NVIDIA DGX Superpod天琴alpah-α超算集群。在此基礎上,京東探索研究院的織女模型vega v2 在2022年登頂SuperGLUE榜首,一舉超越同場競技的谷歌、微軟、Meta等業界頂尖企業;2021年研究院開發的大規模視覺模型ViTAE,在ImageNet Real的目標識別和MS COCO的人體姿態估計等權威榜單上均獲得世界第一。
圖注:(上)2022年京東探索研究院發表論文《Self-Evolution Learning for Discriminative Language Model Pretraining》,提出自我進化學習方法,為vega v2大模型的設計提供核心思想;
(下)2021年京東探索研究院發表論文《ViTAE: Vision Transformer Advanced by Exploring Intrinsic Inductive Bias》,嘗試將 CNN和transformer相結合。
因此,國內公司的 AI 大模型研發雖然比國外公司晚,但是發展卻異常地迅速,其內在邏輯便是:本土企業和學者對深度學習技術的深入理解與創新。在大模型的底層技術已經固定的時代,他們靠著持續的探索和努力才能構建出秀麗的“上層建筑”。
在OpenAI發布ChatGPT之前,國內的一些企業就已經押注AI大模型技術:例如2021 年 4 月,華為云聯合循環智能發布盤古超大規模預訓練語言模型,參數規模達 1 000 億;2021 年 6 月,北京智源人工智能研究院發布了超大規模智能模型“悟道 2.0”,參數規模達到 1.75 萬億;2021 年 12 月,百度推出 ERNIE 3.0 Titan 模型,參數規模達 2 600 億,同期,阿里巴巴達摩院的 M6 模型參數達到 10 萬億,將大模型參數直接提升了一個量級。
到2023年,大模型繼續火熱,國內的AI大模型團隊已逐漸拓展到視覺、決策領域,甚至用于解決蛋白質預測、航天等領域的重大科學問題,阿里、京東、oppo等大廠都有相應的成果。
-
本文僅代表作者個人觀點。
- 責任編輯: 史岱君 
-
“中國首艘、遠超美日”,力爭率先鉆穿地殼
2023-12-29 15:42 科技前沿 -
陸地探測一號01組衛星正式投入使用
2023-12-29 13:57 航空航天 -
以軍殺害3名人質前,誤認為“求救聲是哈馬斯伏擊”
2023-12-29 08:12 巴以恩仇錄 -
我國學者首次建立從端粒到端粒的中國人全基因組
2023-12-29 07:44 -
能夠拍攝天體“彩色紀錄片”的巡天望遠鏡“夢飛”來了
2023-12-28 10:00 天文 -
面向太空的“超級CT”!最大空間環境地基監測網如何建成?
2023-12-27 18:17 -
我國單體規模最大漂浮式光伏電站并網發電
2023-12-27 15:31 科技前沿 -
把星光變成照片,墨子巡天望遠鏡運行百天獲16500幅圖像
2023-12-27 11:31 科技前沿 -
我國最新一代深遠海一體化大型風電安裝船試航
2023-12-27 08:29 -
全球首創!我國成功研制可注射溶栓納米機器人
2023-12-26 10:28 科技前沿 -
幾分鐘成功復現諾獎成果!AI科研機器要來了?
2023-12-26 07:37 -
我國成功發射天目一號氣象星座11~14星
2023-12-25 09:38 航空航天 -
逆轉催化劑“熟化”,中國科學家用新思路實現突破
2023-12-23 17:46 科技前沿 -
華為云CTO:云原生與AI疊加,將帶來七大技術“躍遷”
2023-12-23 10:16 觀網財經-科創 -
美駐華大使稱“中國沒打算合作”,國家航天局發聲
2023-12-22 10:04 中美關系 -
祝賀!神舟十七號航天員乘組圓滿完成第一次出艙活動
2023-12-21 21:56 航空航天 -
續集?“發現LK-99存在超導相的明確證據”
2023-12-21 09:39 -
2023全球十大工程:ChatGPT、中國空間站、鴻蒙…
2023-12-20 11:40 科技前沿 -
我國科學家開創新理論,研發出超薄高能效光學晶體
2023-12-19 14:44 -
應對AI安全風險,OpenAI要搞分級
2023-12-19 11:56 人工智能
相關推薦 -
“許多德國東部民眾將此視為變革機會” 評論 34“我要求美西方,允許我們用援烏武器打擊俄境內目標” 評論 232馬克龍:歐洲AI落后了,得砸錢追上中美 評論 126巴西對X平臺下禁令,盧拉喊話馬斯克 評論 58最新聞 Hot
-
武契奇:不會對人民撒謊,不太可能在2028年前入歐
-
馬克龍:歐洲AI落后了,得砸錢追上中美
-
巴西對X平臺下禁令,盧拉喊話馬斯克
-
全球AI換臉色情人物一半是韓國人!韓方找法方:要和“電報”談
-
委內瑞拉遭遇全國性停電,“反對派干的”?
-
柯文哲被當庭逮捕
-
遭遇“沉重打擊”后,烏克蘭撤職空軍司令
-
柯文哲被帶走調查,住所遭搜查數小時,走時說“我非常坦蕩”
-
“金磚鼓舞非洲:勇于挑戰西方霸權,不要怕被制裁”
-
馬科斯聲稱:重要時刻
-
“若我當選,會讓共和黨人入閣”
-
“塞爾維亞軍隊首次裝備西方戰機”,向歐盟靠攏?武契奇回應
-
《中美科技合作協定》第二次到期,還能否續簽?
-
他拒絕參會后,韓國政府緊急增加6名女性嘉賓
-
“一個西方關鍵盟友要倒向俄羅斯”
-
空襲美國救援組織車輛致5死,以軍解釋了…
-