-
中國(guó)工程院院士高文:什么時(shí)候中國(guó)算力超越美國(guó),GDP也就有望超越美國(guó)了
-
呂棟lvdong@guancha.cn
最后更新: 2023-07-09 10:49:38各位專家、各位領(lǐng)導(dǎo),大家下午好!
前面的領(lǐng)導(dǎo)都講的很好,算力是非常重要的一件事,今天上午陳書(shū)記也講到,上海要抓三件大事,人工智能領(lǐng)域,算力建設(shè)是非常重要的一方面,就像電力一樣,原來(lái)李克強(qiáng)總理抓經(jīng)濟(jì)的時(shí)候,有一個(gè)很重要的指數(shù)就是“克強(qiáng)指數(shù)”,是靠電力消耗看整個(gè)經(jīng)濟(jì)發(fā)展順不順利,或者是正常不正常。
從現(xiàn)在開(kāi)始,算力也是數(shù)字經(jīng)濟(jì)發(fā)展的一個(gè)指數(shù)。算力夠,數(shù)字經(jīng)濟(jì)就能發(fā)展好,不夠就發(fā)展不好。所以,算力建設(shè)尤其是智能算力建設(shè)就非常關(guān)鍵。我在這里,跟大家分享關(guān)于鵬城云腦的智算平臺(tái),另外是分享一下,在這個(gè)平臺(tái)上做的鵬城腦海大模型。
首先算力很重要,但重要到什么程度呢?清華大學(xué)一個(gè)2022年的咨詢報(bào)告提到,經(jīng)過(guò)統(tǒng)計(jì),算力指數(shù)和GDP是正相關(guān)的,一個(gè)國(guó)家算力越強(qiáng),GDP就越強(qiáng)。美國(guó)現(xiàn)在算力指數(shù)排第一,比我們大概多了20%-30%的算力,GDP也比我們多20%-30%,什么時(shí)候我們的算力超越美國(guó),咱們的GDP也就有望超越美國(guó)了。
正是因?yàn)樗懔@么重要,所以發(fā)展人工智能和數(shù)字經(jīng)濟(jì),沒(méi)有匹配的算力是不可能的。要有算力,就要有芯片,芯片做成機(jī)器,才能用這個(gè)機(jī)器訓(xùn)練模型。
為了做這件事,我們2020年在深圳做了一臺(tái)機(jī)器叫鵬城云腦Ⅱ。在2020年,這臺(tái)機(jī)器的算力是全世界做人工智能訓(xùn)練最強(qiáng)的,比當(dāng)時(shí)微軟、谷歌的機(jī)器都要強(qiáng),相當(dāng)于4000塊英偉達(dá)A100 GPU的算力,而且這臺(tái)機(jī)器是用全光網(wǎng)絡(luò)連接的,節(jié)點(diǎn)之間延遲非常低。
因?yàn)橛辛诉@臺(tái)機(jī)器,我們就可以做很多事,包括做科學(xué)研究、產(chǎn)業(yè)應(yīng)用還有關(guān)鍵技術(shù)的研發(fā)。這臺(tái)機(jī)器剛剛我說(shuō)有4000塊卡,其中一方面是鯤鵬CPU,另外是昇騰NPU,都是華為的。
圖源:觀察者網(wǎng)
那么這臺(tái)機(jī)器的性能行不行呢?我們就參加世界TOP500的超算打榜,整個(gè)超算打榜也有其他的賽道,我們參加的是IO500的賽道,是一條考驗(yàn)輸出和輸入能力的賽道,從2020年10月份這臺(tái)機(jī)器做出來(lái)以后,我們11月份就參加打榜,連續(xù)6次第一,每半年有一次打榜,全節(jié)點(diǎn)連續(xù)兩次第一。
所以做人工智能訓(xùn)練這件事,別人沒(méi)辦法和這臺(tái)機(jī)器比。這臺(tái)機(jī)器不僅硬件強(qiáng),接口能力和網(wǎng)絡(luò)也非常強(qiáng),同時(shí)上面的軟件也配備得比較完備,包括怎么樣做分布式計(jì)算,怎么樣做命令調(diào)優(yōu)、自研調(diào)度規(guī)劃等等。
也許有的專家聽(tīng)到過(guò),有人說(shuō)全世界能在1000塊卡上同時(shí)訓(xùn)練一個(gè)模型的只有幾千人,能在4000塊卡上訓(xùn)練的不超過(guò)100個(gè)人,在10000塊卡上訓(xùn)練模型的人數(shù)更少了。在大規(guī)模的卡上一起做事,對(duì)于軟件規(guī)劃、資源調(diào)度挑戰(zhàn)非常大。
我們不僅是把鵬城云腦Ⅱ用好,同時(shí)也承擔(dān)了國(guó)家發(fā)改委的任務(wù),把華為生態(tài)包括昇騰AI集群的算力,不論是100P或900P的算力結(jié)點(diǎn),用網(wǎng)絡(luò)把資源連起來(lái),可以向外界提供。同時(shí)按照發(fā)改委的要求,希望這是異構(gòu)的算力網(wǎng)平臺(tái),我們?cè)谌A為生態(tài)以外,也選擇了部分其他廠商的算力,在2022年6月這個(gè)項(xiàng)目驗(yàn)收的時(shí)候,已經(jīng)聚合的智能算力達(dá)到2300P,鵬城云腦Ⅱ只是1000P,而這個(gè)系統(tǒng)已經(jīng)聚集了2300P的智能算力。
有了鵬城云腦Ⅱ可以訓(xùn)練大模型了,但訓(xùn)練大模型還是很費(fèi)算力的,即使可以訓(xùn)練大模型,現(xiàn)在的算力供給根本不夠用,因此我們正在規(guī)劃做鵬城云腦Ⅲ。
下面我說(shuō)說(shuō)大模型。
鵬城實(shí)驗(yàn)室正在做一個(gè)2000億參數(shù)的大模型,也就是200B的參數(shù),為什么做這件事呢?因?yàn)橛蠧hatGPT和類ChatGPT大模型在不停涌現(xiàn),同時(shí)現(xiàn)在很多公司都用這個(gè)東西做產(chǎn)業(yè)應(yīng)用,去做服務(wù)。所以現(xiàn)在模型變得很重要了,但現(xiàn)在有錢的公司可以砸?guī)讉€(gè)億做這樣的機(jī)器,甚至十幾個(gè)億和幾十個(gè)億,而大多數(shù)公司是做不了的。
圖源:觀察者網(wǎng)
這個(gè)領(lǐng)域需求這么大,怎么辦?鵬城實(shí)驗(yàn)室可以做一個(gè)底座,把模型訓(xùn)練完開(kāi)放出去,大家在這個(gè)底座上做垂直應(yīng)用。按照這樣的思路,我們首先有鵬城云腦Ⅱ的算力,前一階段我們積累了很多數(shù)據(jù),這一段時(shí)間我們通過(guò)各個(gè)渠道,包括購(gòu)買,拿到數(shù)據(jù)先做清洗,清洗數(shù)據(jù)的工作很重,可能拿到100個(gè)數(shù)據(jù),清洗完就剩幾個(gè)了,因?yàn)橛泻芏嗍侵貜?fù)和不規(guī)范的數(shù)據(jù),這些東西拿掉后,數(shù)據(jù)量就變得很小。雖然拿了很多數(shù)據(jù),但是真正用來(lái)做訓(xùn)練的數(shù)據(jù)只有1%-5%。有了這些數(shù)據(jù),我們就可以做大模型底座。
這個(gè)大模型底座用的就是生成式預(yù)訓(xùn)練模型,也就是和GPT完全類似的底層。現(xiàn)在這個(gè)2000億參數(shù)規(guī)模的大模型訓(xùn)練出來(lái)以后,我們希望把它給到合作伙伴那里,而且提供相應(yīng)的指令微調(diào)和相應(yīng)的人工增強(qiáng)學(xué)習(xí)的工具,甚至在一兩個(gè)垂直領(lǐng)域作為垂直應(yīng)用樣板。因?yàn)槿A為在這方面很有經(jīng)驗(yàn),我們建議誰(shuí)想做垂直應(yīng)用,可以找華為獲得一些咨詢。
我們希望能快速把這個(gè)模型做完推向社會(huì),讓業(yè)界在這個(gè)模型上,開(kāi)發(fā)中國(guó)自己的人工智能大模型應(yīng)用系統(tǒng)。現(xiàn)在我們正在緊鑼密鼓地往前推,應(yīng)該是8月底第一次訓(xùn)練就完成了,9月份就會(huì)把模型開(kāi)放出去。
現(xiàn)在訓(xùn)練的數(shù)據(jù)有多大呢?我們說(shuō)的是喂數(shù)據(jù),每天喂10個(gè)B,但是最重要的是喂一個(gè)T的數(shù)據(jù),而一個(gè)T是由幾百個(gè)T清洗來(lái)的,現(xiàn)在數(shù)據(jù)都是中文和代碼數(shù)據(jù),4000多塊卡的機(jī)器每天可以吃掉10個(gè)B,100天就能吃掉1000個(gè)B,也就是一個(gè)T,因此訓(xùn)練2000億參數(shù)的模型,需要4000塊卡訓(xùn)練100天。
這就是算力的重要性,如果算力不足的話,做一個(gè)模型還是很辛苦的,而且現(xiàn)在這個(gè)模型才訓(xùn)練一個(gè)T的數(shù)據(jù),如果訓(xùn)練兩到三個(gè)T的話,還要加兩到三個(gè)100天,沒(méi)有大算力做大模型就是天方夜譚。實(shí)際上這就和電力是一樣的,想靠省電做出什么產(chǎn)品來(lái),真正懂行的人聽(tīng)了都不信,一定要有算力作為基礎(chǔ)。
圖源:觀察者網(wǎng)
怎么樣把數(shù)據(jù)做好、訓(xùn)練的快,我們有一套體系。
有個(gè)開(kāi)源社區(qū)叫啟智開(kāi)源社區(qū),這里有很多工程師在做飛輪數(shù)據(jù)工程,可以使清洗數(shù)據(jù)做得非常快,有很多自動(dòng)和半自動(dòng)的清洗數(shù)據(jù)。同時(shí)我們要考慮應(yīng)用的時(shí)候有隱私數(shù)據(jù),有一些數(shù)據(jù)應(yīng)用者,希望到這個(gè)模型應(yīng)用一下,但是不希望自己的數(shù)據(jù)被丟掉或者是被看到,我們也提供了隱私數(shù)據(jù)保護(hù)的模塊。
我們希望鵬城腦海大模型訓(xùn)練出來(lái)以后,可以快速向社會(huì)賦能,可以讓大家做數(shù)字政府、一帶一路、智能制造、智慧金融、智慧醫(yī)療等各種各樣的應(yīng)用。而且我們還有完整的教育計(jì)劃、人才計(jì)劃,希望通過(guò)高校和合作伙伴培養(yǎng)更多AI人才,能讓中國(guó)的大模型應(yīng)用快速啟動(dòng)。
總結(jié)一下,鵬城實(shí)驗(yàn)室在鵬城云腦Ⅱ硬件平臺(tái)和鵬城腦海大模型這兩件事上,都在和華為合作往前推進(jìn),希望可以對(duì)中國(guó)人工智能大模型的應(yīng)用貢獻(xiàn)一點(diǎn)力量。作為一個(gè)基石,希望大家多關(guān)心、多參與。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
|舉報(bào)-
違反法律法規(guī) -
垃圾信息、廣告 -
色情、淫穢信息 -
人身攻擊 -
謠言、不實(shí)信息 -
冒充,冒用信息 -
破壞社區(qū)秩序 -
其他 -
涉未成年人有害信息
- 責(zé)任編輯: 呂棟 
-
“法國(guó)人殖民了我們132年,現(xiàn)在該輪到我們殖民他們了”
2023-07-08 15:00 法國(guó)見(jiàn)聞 -
華為盤古大模型3.0,“沒(méi)時(shí)間作詩(shī)”
2023-07-07 17:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
這家IPO公司主營(yíng)豬飼料,一年收入超百億
2023-07-07 17:33 觀網(wǎng)財(cái)經(jīng)-金融 -
歐盟加塞烏克蘭議程,“被拉美國(guó)家刪光了...”
2023-07-07 14:11 烏克蘭之殤 -
李強(qiáng)主持召開(kāi)經(jīng)濟(jì)形勢(shì)專家座談會(huì)
2023-07-06 19:54 觀網(wǎng)財(cái)經(jīng)-宏觀 -
唱空中國(guó)銀行股?高盛回應(yīng)
2023-07-06 18:25 觀網(wǎng)財(cái)經(jīng)-金融 -
美國(guó)就業(yè)一片大好?美聯(lián)儲(chǔ)暗示數(shù)據(jù)失真
2023-07-06 18:11 觀網(wǎng)財(cái)經(jīng)-宏觀 -
廈門國(guó)際投資擬港股上市:在港澳均有銀行,凈利潤(rùn)同比下降34.55%
2023-07-06 16:51 觀網(wǎng)財(cái)經(jīng)-金融 -
馬云現(xiàn)身巴基斯坦,下一站是這個(gè)國(guó)家
2023-07-06 15:48 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
斷開(kāi)社交媒體?馬克龍這個(gè)提議激起軒然大波
2023-07-06 10:24 法國(guó)見(jiàn)聞 -
國(guó)有銀行將向城投發(fā)放25年期貸款?或?yàn)椴粚?shí)消息
2023-07-05 17:59 觀網(wǎng)財(cái)經(jīng)-金融 -
鋰電池企業(yè)瑞浦蘭鈞IPO:毛利率遠(yuǎn)低于寧德時(shí)代,近三年皆虧損
2023-07-05 17:00 觀網(wǎng)財(cái)經(jīng)-金融 -
多家銀行下調(diào)美元存款利率,有何影響?
2023-07-05 15:58 觀網(wǎng)財(cái)經(jīng)-金融 -
小米再對(duì)華為專利提無(wú)效宣告請(qǐng)求
2023-07-04 20:59 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
專利戰(zhàn):OPPO與諾基亞隔空互嗆
2023-07-04 17:53 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
被當(dāng)面打臉,日鐵急了 評(píng)論 9受中國(guó)影響,澳企要在稀土加工業(yè)務(wù)上發(fā)力了 評(píng)論 43挪用學(xué)生餐補(bǔ)、欠薪欠保…審計(jì)署發(fā)布報(bào)告涉5380多億 評(píng)論 57“中國(guó)在非洲真正贏得了民心,就連斯威士蘭…” 評(píng)論 97最新聞 Hot
-
“沙特曾多次警告德國(guó)提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊(duì)老板、真人秀制作人
-
巴勒斯坦三個(gè)政治派別發(fā)表聯(lián)合聲明
-
“中國(guó)在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團(tuán)是絕望之舉,中國(guó)工廠效率質(zhì)量都是第一”
-
“中國(guó)有能力讓夢(mèng)想照進(jìn)現(xiàn)實(shí),將贏得史詩(shī)般競(jìng)爭(zhēng)”
-
被災(zāi)民暴罵到當(dāng)場(chǎng)破防,馬克龍發(fā)飆:你該慶幸你在法國(guó)!
-
美高校敦促國(guó)際學(xué)生抓緊回來(lái):萬(wàn)一把中印拉黑名單呢
-
美國(guó)政府“逃過(guò)一劫”
-
“澤連斯基要求歐盟新外長(zhǎng):對(duì)華批評(píng)要降調(diào)”
-
澳大利亞來(lái)了,中國(guó)就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國(guó)剛公布新任大使,特朗普顧問(wèn)就痛罵:傻X
-
“來(lái)自中國(guó)的老大哥能確保我們…”
-
俄羅斯的報(bào)復(fù)來(lái)了
-
澤連斯基罵普京“傻子”,俄方怒斥
-