-
百川智能發布金融大模型 聲稱準確率超GPT-4o
-
楊付博杰17600980615
12月23日,百川智能發布了全新的全鏈路領域增強金融大模型Baichuan4-Finance。
百川智能在官網上表示,Baichuan4-Finance在多個金融評測體系中表現優異,在中國人民大學財政金融學院發布的評測體系FLAME以及國內開源金融評測基準FinancelQ上,Baichuan4-Finance的表現均領先于GPT-4o。
在主要面向模型專業金融能力的評測FLAME-Cer中,Baichuan4-Finance在銀行、保險、基金、證券等多個資格認證領域的準確率均突破了95%,整體準確率達到93.62%,超出了GPT-4o近20%。
而在側重模型的場景應用能力的FLAME-Sce 評測中,Baichuan4-Finance一級核心金融業務場景的整體可用率達84.15%,金融數據計算、金融知識理論等場景的可用率超過90%,同樣領先于GPT-4o。
此次百川智能發布的Baichuan4-Finance可以幫助金融從業者處理文檔審核、客戶咨詢、產品營銷等大量日常工作,還能依托深厚的金融專業知識和法律法規理解能力,為機構提供精準的風險識別和合規保障。
可以看出,借助此次發布的金融大模型,百川智能有意在金融領域開發更多的To B端客戶。
大模型行業發力“應用落地”
從今年下半年以來,市場上頻繁有傳言稱,被稱為“AI六小虎”的六家中國大模型獨角獸中,已經有兩家企業停止預訓練大模型,縮減了預訓練算法團隊人數,并將業務重心轉向AI應用。
“AI六小虎”是市場對智譜AI、零一萬物、MiniMax、百川智能、月之暗面、階躍星辰六家AI領域初創公司的稱呼,這些企業因其在大模型技術領域的創新和影響力而獲得此稱號,并在融資、估值、中標項目等方面表現出色。但隨著市場競爭加劇和行業環境的變化,這些初創企業面臨著不同的挑戰和轉型壓力。
預訓練是大模型的基礎階段,賦予模型海量而通用的知識,是決定模型性能的關鍵步驟。在過去,許多大模型企業都選擇將預訓練作為其核心競爭力的體現。但這需要大量的數據和算力支持,每次迭代可能耗資數百萬至數億美元,對資源有限的初創公司來說是一個巨大的負擔。
以Open AI為例,其GPT-3和GPT-4的訓練成本分別高達1200萬美元和7800萬美元。而馬斯克曾估算,ChatGPT5.0訓練可能需要3萬至5萬張H100,僅芯片成本就超過7億美元,約等于一家獨角獸企業的一大半市值。
在資金和算力緊缺的背景下,市場有傳言稱部分AI企業開始選擇放棄預訓練,轉而專注于實際應用場景的開發,以減少高昂的算力和數據投入。
但對于具體是誰放棄了預訓練,傳聞中的企業均對此進行了否認。
比如在今年10月,零一萬物的創始人李開復在朋友圈辟謠,稱零一萬物一直在做預訓練,并即將推出新的預訓練模型。百川智能也否認了停止預訓練的說法,稱公司預訓練團隊穩定,預訓練工作正在穩步推進,并不存在放棄預訓練一說。
而在本月初,智譜AI CEO張鵬也在一場活動中明確表示“我們肯定一直在做預訓練”,并稱公司每四到六個月就會迭代一版新模型。
盡管相關企業都對“放棄預訓練”的傳言進行了否認,不過在市場環境的壓力下,尋求更高效的商業模式和市場需求導向的發展路徑已經成了許多AI領域初創公司的重要任務。
就在今年的10月份,零一萬物推出了針對零售和電商場景的ToB產品,發布了面向電商直播、辦公會議等場景的數字人解決方案。而百川智能則在醫療領域取得了進展,推出了AI健康顧問,并與國家兒童醫學中心和北京兒童醫院,共同研發出了兒童健康大模型。而百川智能推出的通用醫療增強大模型,則在美國執業醫師資格考試(USMLE)中的準確率超過94%,并在由醫生(如協和、北醫等頭部三甲高年資主任、主治醫師)和心理學專家作為評測主體的真實人工評測中表現超越了GPT-4。
隨著市場的成熟,大模型企業開始更加注重產品的核心競爭力和實際場景的用戶體驗。
2023年6月開始的“百模大戰”已經逐漸降溫,大模型行業的市場競爭已經從燒錢階段轉向了更加理性和務實的階段。為應對市場壓力和生存挑戰,初創企業們正在努力通過應用開發實現轉型,誰能更精準地將AI技術融入實際應用場景,并創造出切實的價值,將成為決定其在市場中生存與發展的關鍵。
本文系觀察者網獨家稿件,未經授權,不得轉載。
標簽 大模型- 責任編輯: 楊付博杰 
-
昇思開源社區新星:共同成長,助中國AI框架崛起
2024-12-23 17:55 觀網財經-科創 -
首個國產靶向藥美國獲批,意義多大?
2024-12-23 14:05 -
中車斬獲迪拜56億美元大單
2024-12-23 11:35 -
“人在家中坐,賬戶天上來”,多家銀行回應
2024-12-23 11:33 養老與社保 -
規??氨让绹偛?!英偉達被曝擬在臺灣建立新總部
2024-12-23 11:00 -
“蝦滑疑吃出蛆”?海底撈回應
2024-12-21 17:21 食品安全 -
民營經濟促進法草案,提請全國人大常委會會議審議
2024-12-21 09:54 政策風向標 -
越南關停2G,推動4G手機出貨量驟增
2024-12-20 22:17 觀網財經-科創 -
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
2024-12-20 18:06 -
微信發力社交電商?小店上線“送禮物”功能
2024-12-20 18:00 觀網財經-互聯網 -
華為超充機器人亮相:明年上半年量產
2024-12-20 16:33 華為 -
美企侵權,華為在歐洲勝訴
2024-12-20 15:48 觀網財經-科創 -
小紅書大面積封號登頂熱搜,有用戶稱參加個活動就被封
2024-12-20 14:30 大公司 -
他倆一個自殺、一個被捕?蘋果AI推送假新聞鬧大了
2024-12-20 12:38 網絡安全 -
中國1年期國債收益率跌至1%
2024-12-20 10:39 金融觀察 -
“年底前央行降準幅度或達0.5%”
2024-12-20 10:06 金融觀察 -
英偉達最大買家曝光,一年囤了近50萬顆GPU
2024-12-19 20:18 觀網財經-科創 -
首個智能體安全生態協作組織成立:華為、小米、高通等加入
2024-12-19 19:56 觀網財經-科創 -
放下身段的日本車企,學起中國來能有多徹底?
2024-12-19 16:30 觀察者頭條 -
蘋果被曝與騰訊、字節接洽大模型合作,此前傳與百度合作不順
2024-12-19 14:20 大公司
相關推薦 -
-
征訂教輔就看哪本回扣多,教輔緣何變“教腐”? 評論 127超一半被中國掌握,美媒慌了:北約危 評論 158特朗普想“開疆拓土”,這也能扯上中國? 評論 84美國盯上非洲,最害怕中俄戳穿... 評論 78“如果我是特朗普,就再搞‘尼克松訪華’行動” 評論 272最新聞 Hot
-
埃爾多安最新警告:放下武器,否則將被埋葬
-
距離導彈30米!差點打下第二架...
-
“他們對自己國家都沒辦法,就別說‘自由世界’了”
-
美情報官員聲稱:派兵援俄是朝鮮主動提出的
-
超一半被中國掌握,美媒慌了:北約危
-
效仿特斯拉,豐田欲在華獨資建廠?
-
“中國衛星給美國帶來一場壯觀的燈光秀”
-
又污蔑!特朗普內閣人選:就是停止資助中國
-
特朗普話音剛落,丹麥:北極國防開支得加大
-
美國盯上非洲,最害怕中俄戳穿...
-
“如果我是特朗普,就再搞‘尼克松訪華’行動”
-
“君主制廢除50年了,還有人鼓吹高貴血統…”
-
他將被引渡至美國,曾因訓練中國飛行員遭“誘捕”
-
中國AI幾個月就弄通了,“我們很驚訝”
-
“特朗普:加拿大、格陵蘭、巴拿馬,全都要,買買買”
-
美政府審查最后一刻仍無共識,球踢給拜登
-