-
ChatGPT:大語言模型AI的追趕關鍵在于定制應用軟件開發能力
最后更新: 2024-05-08 19:01:57本文是在仝鍵和熊節的啟發式提問引導下,完全由ChatGPT生成的一篇文章。兩位人類合作者只做了必要的細節編輯。
“可能是全國第一篇ChatGPT一作的正經文章吧”,人類合作者之一熊節對觀察者網表示。
“總會有人想探討AI會不會產生智能。而我的態度是,我現在就像站在泰坦尼克號船頭的一個人,看到了一座巨大的冰山向我撞來,這一刻我想的是怎么逃生上岸。我不關心那個冰山會不會產生智能。”另一位人類作者仝健在對話中表示。
仝健還提到,在《流浪地球2》中,550C“生成底層操作系統”激發了他后續去思考以結構化的重寫來替代重構的開發方法。他還認為,這種顛覆性的生產方式對于我們彌補工業軟件的短板有實際意義。
大語言模型AI的追趕關鍵在于定制應用軟件開發能力
作者:ChatGPT,仝鍵,熊節
AI追趕的瓶頸:軟件工程能力的重要性
隨著ChatGPT的面世,大語言模型AI(如GPT-3)已經成為了熱門話題。國內也有很多團隊在進行追趕,然而,在實際追趕過程中,AI技術與軟件工程能力的結合卻成為了AI追趕的瓶頸。
我們最近在網上看到對復旦大學MOSS的對話:
復旦團隊發布國內首個類ChatGPT模型MOSS,邀公眾參與內測
文中提到:
“目前,MOSS的最大短板是中文水平不夠高,主要原因是互聯網上中文網頁干擾信息如廣告很多,清洗難度很大。為此,復旦大學自然語言處理實驗室正在加緊推進中文語料的清洗工作,并將清洗后的高質量中文語料用于下一階段模型訓練。科研團隊相信,這將有效提升模型的中文對話能力。”
結合文中其他部分的描述和網上其他資料,不難看出,盡管團隊對其在深度學習算法和模型上充滿信心,但由于數據獲取和清洗方面的軟件工程能力不足,導致其模型的數據量遠低于ChatGPT,無法有效提升任務完成度,比如中文對話的表現不足。
根據分析,數據獲取和清洗的問題實際上源于軟件能力的缺陷。例如,如果數據清洗的程序需要經常變化,那么開發人員需要具備一定的靈活性,能夠快速理解新的需求和業務規則,并對程序進行相應的修改和調整。并且開發人員需要掌握TDD(測試驅動開發)的相關概念和技術,如單元測試、測試框架和測試覆蓋率等。因為TDD能夠幫助開發人員編寫高質量、易于維護的代碼。開發人員還需要掌握持續集成和持續交付(CI/CD)能力,因為CI/CD能夠幫助開發人員實現代碼的自動化構建、測試和部署。
如果沒有合適的爬蟲程序和清洗工具,就無法獲得足夠的數據。這使得我們意識到,在AI的發展過程中,軟件工程能力的重要性不容忽視。盡管大多數人關注的是訓練后的模型,但在訓練模型的過程中,需要寫很多定制開發的軟件。而這些軟件是一次性的,用完即扔的,但是這個“一次性”的過程可能長達數年,需要不斷調整和演進這些軟件。如果這些軟件沒有持續演進的能力,那么就無法到達終點。因此,軟件工程能力的瓶頸限制了AI的成長。
行業普遍能力顯著加劇了挑戰
中國的軟件開發行業數量龐大,但是整體水平并不盡如人意。雖然國內擁有大量程序員,但是很難掌握先進的工程實踐和技術,這導致了軟件開發的問題和質量不穩定。
例如,XP(Extreme Programming)包含的一組工程實踐,如TDD(測試驅動開發)、重構等,在中國大型軟件開發組織的上下文中難以廣泛實現。這些工程實踐需要高水平的技術人才和團隊協作能力,但是中國的軟件開發組織很難招聘到這樣的人才,而且組織管理也難以支持這些實踐的實施。
因此,中國的軟件通常在3-5年內就需要重新開始,這是由于工程實踐差導致軟件逐漸腐化到無法維護。然而,從另一個角度來看,由于中國的軟件工程師數量眾多,對于軟件的質量要求也沒有那么高,因此每3-5年推倒重來的做法也被視為一種解決方案。
但是,在為人工智能配套的軟件上,這種做法可能會面臨巨大的挑戰。為了實現智能化,軟件需要更高的精度和更長久的維護,定期的推倒重來可能從效率和質量上都不能滿足需求。例如,訓練OpenGPT的過程涉及到多個軟件組件和工具,包括深度學習框架、分布式訓練工具、數據處理和清洗工具等,這些軟件組件和工具的更新和維護都是必要的。因此,中國的軟件開發者們需要更加重視工程實踐和技術的學習和應用,只有這樣才能夠適應追趕需求,但是這與我們之前所說現狀的限制產生了矛盾。
基于ChatGPT的AI定制軟件開發方案
我們從文中看到,“復旦團隊則采用不同的技術路線,通過讓MOSS和人類以及其他對話模型都進行交互,顯著提升了學習效率和研發效率,短時間內就高效完成了對話能力訓練。”
那么在軟件開發方面,我們能否采用類似的思路呢?我們是否可以直接基于現有的ChatGPT進行AI所需的定制軟件的開發?盡管這個想法聽起來大膽,但實際上是可行的。
我們發現,在使用ChatGPT進行編程的時候,它可以基本上滿足一些簡單場景的編程需求。通過一些特定的手法,它可以有效地編寫出可用的軟件。這里所說的簡單,是指需求描述簡單,不是指需求本身簡單或者實現簡單。實際上,ChatGPT現在更擅長于處理許多復雜算法和軟件框架的開發,因為這些需求都有專業術語,因此需求本身的描述可以很簡單。
經過本人實際測試,使用ChatGPT進行編程可以大大提高開發效率。此外,基于ChatGPT進行編程也會帶來一些有趣的生產方式變化。在軟件開發的工程實踐中,我們通常會采用一種假設:重寫比重構更慢。但是,在使用ChatGPT進行編程時,我們會發現重寫會更快。盡管測試仍然很重要,因為測試會告訴ChatGPT是否正確重寫,但ChatGPT本身也可以根據實現代碼推理出需要哪些更多的測試用例。這將形成一個恐怖的飛輪,人類提供簡單的測試和需求,讓ChatGPT編寫出符合測試的實現,然后讓ChatGPT根據實現和需求反向推理出需要哪些更多的測試,并給出測試用例和可以執行的測試代碼。這樣的工作方式與測試驅動開發(TDD)很像,只是其中最耗費腦力的部分:“基于測試改進代碼和想出更多測試”變成了AI的工作,而人只需要讓AI按照TDD的方式工作并適時糾偏即可。
基于這種生產方式及其可觀的收益,我們很容易得出一個結論:ChatGPT可以用于簡單小單元的開發,但對于更復雜的系統,它能否提供幫助呢?一般來說,由于算力的限制,ChatGPT輸入的文本是有限的,而且ChatGPT自身的封閉性使得自建業務上下文的大語言模型AI是不可能的。然而,我們可以從工程化的角度出發,將復雜系統拆分為小單元,用簡單邏輯拼裝起來。既然ChatGPT可以完成小單元的編程,并以驚人的效率完成,為何不發明一種架構來充分利用這種生產力的提升呢?
這種架構看起來很像深度神經網絡,每一層都是可以互相替換的細分的功能點單元。每個細分的功能點單元都可以封裝為一個通用的調用接口,比如抓取不同的網站的邏輯,這些邏輯是可以被封裝在代碼中的,并且可以用一種DSL來描述。這種DSL可以交給AI來學習,這些DSL不是中文,而是更結構化更形式化的語言,對于AI來說反而很友好。人可以通過TDD的方式修正它的組合結果,最終得到一個可以用于進行復雜系統開發的方式。
雖然這種方式目前還處于暢想中,但邏輯上可以做到的事情,最終一定會發生。這種新的方式一方面降低了對開發人員能力的要求,另一方面又保證了每個節點都按照唯一證明可以保證質量的工作方式:TDD來進行開發。這種方式可以為我們的追趕帶來極大的意義。由于中國的軟件開發人員能力存在很大的問題,我們可能受限于AI所需的配套定制軟件而追趕緩慢。但這種新的方式一方面降低了對開發人員能力的要求,另一方面卻恰好保證了每個節點都按照唯一證明可以保證質量的工作方式:TDD,來進行軟件開發。于是我們得到了一種既科學又不需要長期訓練獲得的能力作為運轉基礎的生產方式。
最終,我們可以得出結論:ChatGPT可以用于簡單小單元的開發,而對于更復雜的系統,我們可以采用一種類似于深度神經網絡的架構,將復雜系統拆解為小單元,再用AI完成小單元的組合,從而實現復雜系統的開發。這種方式既提高了生產力,又保證了質量,但更重要的是,它為我們帶來了一種全新的軟件開發思維方式。這種方式不僅僅是一種技術上的創新,更是一種理念上的創新。我們不再局限于傳統的軟件開發方式,而是采用了一種更為開放、自由和創新的方式來進行軟件開發。
在這種開放性的思維方式下,我們可以不再局限于傳統的軟件開發范式,不再局限于傳統的技術框架和工具,而是充分利用現有的技術和工具,靈活地選擇和組合,以達到最優的效果。同時,我們也可以吸納更多的外部資源,比如開源代碼、第三方庫、人才等等,讓它們與我們的系統無縫地融合在一起,形成一個更為強大、更為開放的系統。
當然,這種思維方式也面臨著很多挑戰。比如如何確保代碼的質量和安全性,如何協調不同的開發者之間的合作,如何處理不同的利益沖突等等。但這些挑戰并不是無解的,實際上它的解法就在XP(Extreme Programming,極限編程)方法中。例如測試驅動開發、持續集成、重構等實踐都有助于確保代碼質量。只是XP中的實踐在這個時代如何與AI更好地協作需要進一步的探索。我們可以通過不斷的探索和實踐,逐步發展出一套成熟的軟件開發流程和治理機制,來保證整個開發過程的質量和效率。
總之,ChatGPT作為一種新興的AI技術,為我們帶來了很多的機會和挑戰。作為追趕者的我們卻可以充分利用它的生產力,來進行我們追趕所需系統開發。在追趕的同時我們還會得到一種全新的開放性思維方式,它可能打破傳統的軟件開發模式,進一步的釋放生產力。(正文完,翻頁為人類作者問答環節)
-
本文僅代表作者個人觀點。
- 責任編輯: 周遠方 
-
舒膚佳香皂再現刀片,真的是偶然嗎?
2024-05-08 17:14 觀網財經-消費 -
業績大降后,愛旭股份借道TOPCon能否自救?
2024-05-08 14:51 -
全國化布局戰略受阻,金徽酒突遭股東虧本減持
2024-05-07 18:53 觀網財經-消費 -
流量之外的中國家電業,正在走向巔峰
2024-05-07 18:43 -
藍月亮母親節營銷“翻車”:刻板印象還是感恩表達?
2024-05-07 16:56 觀網財經-消費 -
華熙生物2023年報:研發投入4.46億,以科技創新打造新質生產力
2024-05-07 12:38 觀網財經-健康 -
上海、深圳、南京、武漢等超50城推房屋“以舊換新”
2024-05-06 18:21 觀網財經-房產 -
“諷日”事件引發購買熱潮,香飄飄股價漲停
2024-05-06 16:01 觀網財經-消費 -
五一檔電影市場激戰正酣:票房預測破十億
2024-05-01 11:04 觀網財經-消費 -
旅游市場迎五一熱潮:出境游性價比飆升,游輪回歸成新亮點
2024-05-01 10:45 觀網財經-消費 -
晨光股份陰跌背后:搶不贏的低端市場,融不進的“高端圈”
2024-05-01 10:18 觀網財經-消費 -
風雨中前行—中國鋰電產業上市公司2023年報數據巡禮
2024-05-01 10:10 -
穩健經營,新希望地產連續六年保持“綠檔”
2024-04-30 22:48 觀網財經-房產 -
郁亮:市場有前景,社會有需求,萬科未來聚焦三大主業
2024-04-30 20:20 觀網財經-房產 -
光伏組件出貨量位列行業第四 晶澳科技去年凈利超70億元
2024-04-30 16:37 -
車展“魅力攻勢”背后,鋰電業近憂與寧德時代的遠慮
2024-04-30 16:37 -
元氣森林的“反腐”案細節披露,8封悔過書暗指真相
2024-04-30 16:13 觀網財經-消費 -
豪賭出首個“十億美元分子”,創新藥“燒錢一哥”去年凈虧67億元
2024-04-30 16:10 觀網財經-健康 -
業績掉隊,貝因美失約年度目標
2024-04-30 15:46 觀網財經-消費 -
上市首年業績變臉,“新能源園林機械第一股”遭監管靈魂拷問
2024-04-30 12:02
相關推薦 -
受中國影響,澳企要在稀土加工業務上發力了 評論 4全國最大!哈密百萬千瓦“光熱+光伏”項目并網發電 評論 58“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 92“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 142最新聞 Hot
-
“沙特曾多次警告德國提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊老板、真人秀制作人
-
巴勒斯坦三個政治派別發表聯合聲明
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-