-
訊飛劉慶峰:今天,中國的大模型底座能力到底怎么樣?
6月27日,北京,科大訊飛舉行訊飛星火升級發(fā)布會,星火大模型V4.0亮相。
科大訊飛董事長劉慶峰全程演講,科大訊飛研究院院長劉聰真機實測,回答兩個關(guān)鍵問題:
今天,中國的大模型底座能力到底怎么樣?
今天,風起云涌的大模型究竟如何應用落地?
以下是劉慶峰演講(節(jié)選):
尊敬的各位領(lǐng)導、各位合作伙伴、各位院士專家、各位媒體朋友、線上的朋友們,大家好!熱烈歡迎大家蒞臨訊飛星火V4.0的發(fā)布會現(xiàn)場。
科大訊飛董事長劉慶峰
這一年多來,以大模型為主要帶動的通用人工智能浪潮在全球風起云涌、高潮迭起。隨著大模型技術(shù)研發(fā)和產(chǎn)業(yè)應用的不斷深入,大家越來越關(guān)注兩個非常關(guān)鍵的核心問題。
第一,今天中國大模型的底座能力到底怎么樣?在中美科技日益激烈的人工智能領(lǐng)域博弈下,去年10月17日,英偉達因為美國商務部的要求,對中國所有能訓練大模型的智能算力全面斷供。就在6月25日,OpenAI也正式通知將從7月9日開始終止所有來自中國的API申請。在這個背景下,熱熱鬧鬧、風起云涌的通用人工智能浪潮,到底有沒有自主可控的國產(chǎn)底座能力做支撐,這決定了我們在這條路上到底能走多遠,決定了通用人工智能這一波浪潮;相當于PC和互聯(lián)網(wǎng)的誕生,在人類歷史上有深刻的意義,而我們能不能享受這波紅利,能不能成為美國之后全球智慧涌現(xiàn)的第二極?
第二,大模型將會改變信息分發(fā)獲取的方式,改變?nèi)藱C交互方式,改變內(nèi)容生產(chǎn)方式,也會改變我們的整個產(chǎn)業(yè)形態(tài)和競爭格局,改變科研范式,這是大家都能看到的大趨勢和未來。Gartner預測,到2026年現(xiàn)在80%的企業(yè)都要用到通用人工智能,而今天這個數(shù)字是5%左右。
大模型在今天風起云涌、如此大的投入下,究竟怎么落地?美好的未來擺在這里,當前第一步該怎么以科學合理投入,才能讓大模型真正的剛需價值能夠落地,能夠看得見、摸得著,能夠用統(tǒng)計數(shù)據(jù)來證明應用成效。我想關(guān)于底座技術(shù)、關(guān)于應用落地,是今天所有的關(guān)心大模型、關(guān)心通用人工智能的研究機構(gòu)、企業(yè)、高校、科研院所以及政府部門共同關(guān)心的話題。今天訊飛星火V4.0的發(fā)布,我特別想跟大家分享我們這兩方面的看法,給出科大訊飛對這兩個問題的答案。
訊飛星火APP的使用高峰期不是周末,而是工作日
實際上,從去年5月6日訊飛星火V1.0發(fā)布之后,大模型的各項能力都在快速提升,我們幾乎每個月都會有一次非常重要的升級。以大家特別關(guān)注的文本寫作為例,今天星火大模型寫出來的東西已經(jīng)不僅僅能讓我們覺得不錯,很多時候還會給我們很大的觸動,給我們帶來驚喜,甚至是感動。
今年6月7日上午,高考語文作文題新鮮出爐,當天中午就有很多人,包括機構(gòu)、老師、投資人等,從各個角度來測星火在高考作文中的寫作能力如何。非常自豪的是,大家都給了訊飛星火很高的評價。在“重慶日報新重慶客戶端”上發(fā)布這篇文章,是6月7日12:10讓大模型寫的,在人工智能圈一個大佬云集的微信群里,被大家專門拿出來作為一個經(jīng)典案例點贊。
大家可以看到,星火寫的內(nèi)容非常專業(yè),很好地運用了排比、引用、論證等寫作手法。當時有很多人給了評分,在滿分是60分的情況下,最低的給了52分。大家讀一下就會看到,在這中間有思辨的想法,引經(jīng)據(jù)典也都寫得非常好。這是沒有任何人工干預生成的結(jié)果,是大模型自己寫出來的,它的能力確實越來越強了。
當然,大家還會關(guān)心說今天大模型寫作、寫詩、作畫能力在不斷提升,而要真正地解決人類剛需的一個非常重要的標志就是科研,究竟大模型在賦能科研方面到底有沒有成效?
以我們和中國科學技術(shù)大學生命學院劉海燕教授團隊的合作為例,我們用大模型中基于條件擴散模型的蛋白質(zhì)主鏈設計算法SCUBA-D,能夠從頭生成自然界不存在的蛋白質(zhì)。實踐證明這種生成的蛋白質(zhì)在我們醫(yī)學特別需要的領(lǐng)域中,它的結(jié)合親和力與天然的蛋白質(zhì)相當,甚至更強。最重要的是,我們把設計成功率從原來的0.1%提升到64%,提升了640倍,原來需要6個月做的設計,現(xiàn)在1天就做完了。這個已經(jīng)不是在簡單的科研驗證階段了,目前已經(jīng)成功地設計了48個蛋白質(zhì),還在批量生產(chǎn)。這篇文章也在今年5月正式被《Nature》子刊接收,證明了我們在業(yè)界的領(lǐng)先地位。
我想說的是,大模型不僅可以寫詩、作畫,在改變工業(yè)、改變科研范式等方面已經(jīng)實實在在發(fā)揮作用,包括我們和中國科學技術(shù)大學做的合成類的科學創(chuàng)新,比如說化學;還有與合肥綜合性國家科學中心能源研究院合作,在推進大模型賦能核聚變整個過程中更快地預測、更好地應對各種各樣的異常情況,這些都在快速推進之中,這是我們在科研上面的各種進展。
訊飛星火APP的使用高峰期不是周末,而是工作日;不是晚上,而是工作日的上午9:30和下午3:30。這說明大家真正用星火來解決工作中的剛需問題。我們一直說大模型應該是解放生產(chǎn)力、釋放每個人想象力的,從這些數(shù)據(jù)就可以看到。
基于全國產(chǎn)算力平臺,全面對標GPT-4 Turbo
從去年5月6日的訊飛星火V1.0一路走到今天的訊飛星火V4.0的發(fā)布,有一點非常令我們自豪——訊飛星火大模型是基于全國產(chǎn)算力平臺訓練出來的。
去年10月24日,我們與華為聯(lián)合軟硬件一體化,科大訊飛提供了大量的算子庫和算法資源,聯(lián)合在安徽發(fā)布了中國首個國產(chǎn)萬卡算力集群,這是中國第一個能訓千億以上浮點參數(shù)大模型的硬件平臺。在這個硬件平臺上,訊飛星火是中國第一個基于國產(chǎn)算力訓練出來的全民開放的大模型。
什么叫全民開放大模型?就是國家網(wǎng)信辦等八個部委聯(lián)合認證,老百姓可以隨即下載使用的大模型。當時是唯一的,今天訊飛星火V4.0發(fā)布還是唯一的,在全國產(chǎn)算力平臺上訓練的大模型,所有算法都是我們自主可控的,每一行碼、每一個數(shù)據(jù)都是我們自己編寫、自己清洗出來的大模型。一定程度上,今天星火大模型V4.0的發(fā)布對完全自主可控的大模型究竟走到了什么樣的發(fā)展階段,具有非常重要的標志意義。
那么在這個基礎(chǔ)上,訊飛星火V4.0到底到了什么水平?
這是基于認知智能全國重點實驗室和中國科學院人工智能產(chǎn)學研創(chuàng)新聯(lián)盟、長三角人工智能產(chǎn)業(yè)鏈聯(lián)盟,在去年6月份聯(lián)合發(fā)布的國產(chǎn)通用認知智能大模型測評體系。這個體系一共有7個主要方面,涵蓋了481個測試項,所有數(shù)據(jù)都是“背靠背”測試,數(shù)據(jù)都是隨機動態(tài)產(chǎn)生的。非常高興的是,訊飛星火V4.0已經(jīng)實現(xiàn)了(大家公認最好的通用認知大模型)GPT-4 Turbo的對標,我們在文本生成、語言理解、知識問答、邏輯推理、數(shù)學這些能力上都已經(jīng)實現(xiàn)超越,在代碼和多模態(tài)能力上還有差距。
代碼能力是我們非常關(guān)注的能力之一,因為它涉及未來的產(chǎn)業(yè)信息化和信息產(chǎn)業(yè)化的核心,而ChatGPT去年2月份通過谷歌二級程序員測試,當時的GPT-3.5用這個測試集只獲得了60多分,GPT-4 Turbo今年1月份測試大概在80分,現(xiàn)在到86分,也在快速迭代和進步。我們預計在今年8月份,訊飛星火會達到現(xiàn)在86分以上的水平。
多模態(tài)能力還有所差距,是因為我們當前在文生視頻上還沒有算力,也不是下一步的核心重點,但是有生態(tài)伙伴一起做。
但在多模態(tài)方面,有一個非常重要的應用,就是圖文識別。無論是醫(yī)療領(lǐng)域,能不能看懂電子病歷、看懂體檢報告;還是教育領(lǐng)域,能不能看懂筆記、看懂考卷;以及在司法、金融、科研、辦公等各個領(lǐng)域的應用,圖文識別能力都是至關(guān)重要的。
科大訊飛的圖文大模型以及星火大模型中的圖文能力,在國際上現(xiàn)在是先進的。我們與GPT-4o做了對比,因為GPT-4o在多模態(tài)方面,特別是圖文上面比GPT-4 Turbo要強。所以,我們與5月14日OpenAI發(fā)布的GPT-4o最新版本相比,各個專門領(lǐng)域訊飛星火V4.0的效果都比它好,不僅僅在OCR直接識別上,關(guān)于版面的自動理解、更合理的版式認知結(jié)構(gòu)等方面,我們都做得更強,從而使得今天要給大家看到的很多應用,它的落地更能夠解決剛需。
在中文領(lǐng)域,訊飛星火V4.0實現(xiàn)了對標GPT-4 Turbo,那么在英文領(lǐng)域怎么樣?這是國際各種主流機構(gòu)給出來的,最主流的中英文測試集,絕大部分是英文,中間有理解推理、綜合考試、數(shù)學科學和代碼等維度的測試。大家可以看到,一共12項主流測試集,絕大部分是英文的,訊飛星火V4.0有8項實現(xiàn)了超越。這個數(shù)據(jù)大家可以直接調(diào)用我們的API自己去測,這是很令我們自豪的進展。
- 責任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對中國提供API服務,周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國科學家實現(xiàn)獼猴全腦尺度神經(jīng)活動監(jiān)測
2024-06-25 18:20 科技前沿 -
習近平代表黨中央、國務院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國國會為何瞄準這家中國企業(yè)
2024-06-25 09:54 -
2023年度國家科學技術(shù)獎勵名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國家最高科技獎
2024-06-24 10:32 科技前沿 -
我國科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國重復使用運載火箭首次10公里級垂直起降飛行試驗成功
2024-06-23 14:58 航空航天 -
純度達99.9%!中國團隊實現(xiàn)海上風電驅(qū)動海水制氫
2024-06-23 08:07 觀察者頭條 -
全球首臺!這一重要裝備研制成功
2024-06-22 13:09 中國精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國科學家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會7月4日開幕,特色亮點搶先看!
2024-06-20 16:00 2024世界人工智能大會 -
我國首個工業(yè)用途核能供汽項目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國精造 -
全球首臺全高溫超導托卡馬克裝置在上海建成運行
2024-06-19 08:15 -
“美國在核電技術(shù)上落后中國10-15年”
2024-06-18 16:42
相關(guān)推薦 -
刺激消費,全民“發(fā)錢”這招可行嗎? 評論 240美國申訴后奪銅,羅馬尼亞徹底怒了 評論 258“去過中國30次,反對中美敵對”,共和黨猛攻他親華 評論 191“阿克薩洪水策劃人”辛瓦爾被選為哈馬斯領(lǐng)導人 評論 338“中國為我們所做的一切,都是美國做不到的” 評論 157最新聞 Hot
-
韓國教練哭了:20年了,每次都輸給中國隊
-
美議員聲稱擔心中企當“間諜”,密歇根州州長已讀不回
-
澳大利亞奧運選手涉嫌在巴黎購買可卡因被捕
-
馬杜羅:WhatsApp見鬼去吧,建議改用微信…
-
日本長崎拒絕邀請以色列,G7另外六國不干了
-
美國申訴后奪銅,羅馬尼亞徹底怒了
-
他欲召集拉美17國開會討論委局勢,還請求美國支持
-
共和黨人一看,覺得自己又行了
-
“他建議我主修中文,這真的改變了我的生活”
-
他遭美司法部逮捕,被控受伊朗指使欲雇兇刺殺特朗普
-
“去過中國30次,反對中美敵對”,共和黨猛攻他親華
-
“跟隨歐洲盟友步伐,他計劃訪華”
-
烏軍突入俄境內(nèi)7公里,俄稱擊退進攻
-
“中巴合作不應滿足于現(xiàn)狀,加入‘一帶一路’是根本措施”
-
員工曝波音工廠亂象,“換問題艙門像換內(nèi)褲一樣頻繁”
-
“阿克薩洪水策劃人”辛瓦爾被選為哈馬斯領(lǐng)導人
-