-
科工力量:性能接近國際巨頭后,龍芯將迎來什么?
【文/科工力量專欄作者 鐵流】
日前,龍芯發布了用于服務器市場的的3D5000系列芯片,引發關注。
3D5000與3C5000屬于同一代CPU,是采用Chiplet技術把兩片3C5000芯片互聯和封裝在一起,進而獲得一片32核CPU,這種方式也被稱為“膠水32核”。就性能而言,龍芯3D5000的IPC接近AMD Zen2的水平,全芯片性能與同主頻下的32核AMD Zen2架構CPU接近,對于大部分應用已經是夠用了。
在2023年,性能更強的龍芯6000系列CPU將要問世,龍芯在IPC上與英特爾、AMD的差距將會進一步縮小,真正阻礙龍芯在市場上推廣的要素將不再是CPU性能,而是軟件生態。
龍芯5000系列是自主CPU里程碑
2019年,龍芯3A4000四核處理器亮相。龍芯3A4000是繼3A3000之后的新一代處理器。3A4000既升級了新內核GS464V,IPC大幅提升;又通過在原有28nm工藝上深入磨合優化,改進電路和物理設計方法,在制造工藝與3A3000相同的情況下,將性能提升了一倍。就3A4000的IPC而言,已經從3A3000的7/G達到了9.8/G,AMD的Zen大致也就在10/G水平,龍芯3A4000的GS464V是一款可以與第一代Zen匹敵的內核。
3A5000的內核是基于GS464V進行小改,IPC為10.6/G,采用12nm工藝,主頻為2.2G至2.5G,后期流片的有2.7G主頻版本,SPEC06定點成績超過26(GCC,@2.5Ghz),這對于自主CPU而言已經是非常不錯了,即便和引進的CPU相比,其定點和浮點性能僅次于海光,超過其他引進的X86和ARM CPU。
龍芯3A5000與龍芯3C5000、3D5000屬于同一代CPU,3C5000采用LoongArch指令集,16核心單芯片unixbench分值9500以上,雙精度計算能力達560GFlops,16核處理器峰值性能與典型ARM 64核處理器的峰值性能相當,并支持最高16路互連,搭配新一代龍芯7A2000橋片,PCIe吞吐帶寬比上一代提升400%以上。就SPEC2006測試來看,單核定點浮點Base分均大于10/G,單芯片分值超過200。可滿足通用計算、大型數據中心、云計算中心的計算需求。該處理器通過芯片級安全機制可為等保2.0、可信計算、國密算法替代、網絡安全漏洞防護等提供CPU級內生支持。
3C5000最大特點是單核性能強,特別是unixbench這種看重單核和內存性能,多核加速比很低的測試,龍芯只用16核就能跑到9500,某ARM CPU即便有64核也跑不到這個成績。從公開的數據來看,3C5000的性能在信創市場足夠用了,而且16核的核心是使其部署比較靈活。
龍芯3D5000則是把兩個3C5000封裝到一起的膠水32核芯片,集成了64MB的L3 Cache,支持最多8個DDR4-3200 DRAM,可以通過HyperTransport接口構建至多四路處理器,因此單機可以支持多達128核。在性能方面,龍芯3D5000單路和雙路服務器的SPEC CPU2006 Base實測可以超過400分和800分,預計四路服務器的分值可以達到1600分。可以說,龍芯3D5000主要針對一些對性能有更高要求的場景,只要軟件生態跟得上,完全可以替換掉英特爾至強CPU。
龍芯6000性能將再次飛躍
相對于一些技術引進CPU在引進海外技術后CPU IPC增長緩慢,性能提高基本依靠購買更好的EDA工具和買臺積電更好的工藝。龍芯一直致力于提升CPU微結構設計水平來提升CPU的性能,沒有盲目去堆核心數量。這種穩扎穩打的做法使龍芯在過去10年中IPC提升了3-4倍,在桌面CPU上成效立竿見影。
CPU的IPC在過去10年中提升了3-4倍,這使龍芯可以在制造工藝上落后技術引進的某ARM CPU一代的情況下,依然可以依靠CPU微結構設計水平做到性能持平或略優于技術引進的某ARM CPU。當龍芯與引進的某ARM CPU采用相同工藝時,龍芯可以憑借其IPC上的優勢在性能上領先某ARM CPU。
龍芯3A5000
3A6000和3A5000采用相同制造工藝,龍芯依靠其設計能力把CPU性能大幅提升,主要是拉大框架,比如把4發射改成6發射等等。從此前公布的仿真成績看,定點相對于3A5000提升30%,浮點相對于3A5000提升60%,這種提升是非常駭人的——如果仿真成績與最終成績相當,那么,3A6000 SPEC06單核定點Base分大于13/G,浮點Base分大于16/G,基本達到AMD Zen2水平。如果3A5000為2.5G至2.8G,那么,3A6000的 SPEC06單核定點Base分大于35,浮點將大于45。
從公開信息看,在使用相同工藝的情況下,3A6000性能比3A5000提升40%—60%,芯片面積縮小20%,12nm的3A6000對標7nm的AMD Zen2。做最保守估算,3A6000 SPEC06單核定點Base分為32分(@2.5G)至35分(@2.8G)。這個性能對于信創和日常使用而言都已經明顯過剩了。
必須說明的是,仿真往往是不準確的,有的公司會高估,有的公司會低估,從龍芯這幾年發布的信息看,龍芯是偏保守的,實測成績只會比仿真成績好,以最近流片回來的2K2000來看,實測成績比龍芯仿真成績高了20%至30%,這大大超乎龍芯的預期。龍芯2k2000的LA364性能基本追平ARM A76,充分展示了自主路線的發展潛力和發展活力。
3C6000是16核服務器芯片,內核是LA664,與3A6000相同。3D6000則是兩片3C6000封裝在一起構成32核服務器CPU,可以匹敵搭載Zen2核心的AMD EPIC。只要軟件能跟上,商業市場已經沒有性能短板了。
龍芯下一代7000系列CPU,進一步提升CPU核性能,IPC瞄準Zen3和12代酷睿,計劃采用7nm工藝,SPEC06定點Base最保守估算是40分,屆時,會有24-32核的3D7000(7nm)和48-64核3E7000(兩片封裝)。
-
本文僅代表作者個人觀點。
- 責任編輯: 一鳴 
-
英特爾推出多次延期的處理器,中國“五朵云”到場支持
2023-01-12 23:59 觀網財經-科創 -
“芯片卡脖子要緊,軟件卡脖子一樣要緊”
2023-01-11 15:29 觀網財經-科創 -
我國空間新技術試驗衛星第二批科學與技術成果發布
2023-01-11 14:19 航空航天 -
“最薄”非線性量子光源首次實現
2023-01-10 07:45 科技前沿 -
“人造太陽”基礎物理研究取得新進展
2023-01-07 07:38 能源戰略 -
中興通訊:目前沒有造車計劃,定位是汽車核心技術提供方
2023-01-05 16:58 TMT觀察 -
首個國產ECMO套包獲批上市
2023-01-05 09:16 醫學 -
激光退火儀在國內首條量子芯片生產線上投入使用
2023-01-04 11:12 科技前沿 -
如何在月球上建造基地?最新研究提出可利用月球這種特殊地貌
2023-01-03 15:36 航空航天 -
日均通關量翻一倍,數智化如何為中老磨憨公路口岸“解堵”?
2023-01-03 12:19 人工智能 -
“文昌發射場將建設載人登月工位、重型火箭工位”
2022-12-31 16:18 航空航天 -
倪光南:openEuler在支持RISC-V方面,已進入世界先進行列
2022-12-30 11:15 觀網財經-科創 -
54戰54捷!中國航天2022年度發射任務正式收官
2022-12-29 15:00 航空航天 -
鄉村教師40歲從零自學代碼,帶出全國大獎學生
2022-12-29 13:47 中西教育 -
全球最大規模“沙戈荒”風電光伏基地項目在庫布其沙漠開工建設
2022-12-29 07:59 能源戰略 -
“相信中國人一定能做出全世界最好的屏幕”
2022-12-28 18:28 觀網財經-科創 -
一款國產新冠口服藥完成三期臨床,預計最快明年2月上市
2022-12-28 09:32 醫學 -
榮耀趙明:平板與蘋果仍存較大差距,有信心逐步拿回國內份額
2022-12-27 19:02 手機 -
我國成功發射高分十一號04星
2022-12-27 16:59 航空航天 -
2023年首批國際項目將入駐中國空間站
2022-12-24 13:11 航空航天
相關推薦 -
布林肯承認“開打前就給了”,俄方回應 評論 131央行宣布將擇機降準降息,“擇機”以何為標志? 評論 156被逼急了,格陵蘭島總理:是時候獨立了 評論 189美媒直呼:啥都能威脅國家安全,美國完全走偏了 評論 164司機留信曝光:同胞們醒醒吧,美國快病死了! 評論 296最新聞 Hot
-
被逼急了,格陵蘭島總理:是時候獨立了
-
美媒直呼:啥都能威脅國家安全,美國完全走偏了
-
“到2030年,中國本土數學家將能引領世界”
-
密謀推翻馬爾代夫總統?印度回應
-
域外調查惹惱國際奧委會,“2034鹽湖城冬奧會有點懸”
-
欲爭奪歐洲最大電動車市場,但英國國內阻力不小
-
土耳其喊話歐盟:他不干,我干
-
“沒想到拜登竟會如此對待盟友!”
-
司機留信曝光:同胞們醒醒吧,美國快病死了!
-
特朗普炮轟:英國犯下了大錯!
-
盧卡申科:計劃訪華,事關未來
-
特朗普“封口費”案將于1月10日宣判,“但不會入獄”
-
“美國沒能改變中國”,布林肯一聽急了…
-
事關中國FK-3,塞爾維亞:這是一個“里程碑”
-
“中國真出手怎么辦?企業緊張研判…”
-
以己度人?“中方為了談判籌碼”
-