-
人工智能往事:大模型的理論基礎,曾一度被判死刑
【編者按:人工智能技術的飛速發展,在短短一兩年內徹底改變了人類對于未來的想象。例如,近期蘿卜快跑刷屏,讓不少人驚呼無人駕駛已經近在眼前,并擔憂AI給社會造成的沖擊。大語言模型也仿佛在一夜之間就產生了神奇的涌現。甚至在2023年初,有人認為“歷史已經終結”,OpenAI在大模型領域已經不可動搖。然而,在很多從業者看來,大模型從來不是突然出現的,AI的發展也經歷了漫長的起起伏伏。不久前,各大模型分不清9.11和9.9哪個大的新聞,證明目前的大模型能力尚有巨大缺陷。OpenAI也被曝出,正在開發不同于ChatGPT的、更側重推理能力的新模型。事實上,人類期待的通用人工智能(AGI)目前還遠遠沒有出現,甚至大模型是不是通向AGI的正確道路,在學術界都充滿了爭議。縱觀人工智能發展史,作為大模型理論基礎的“聯結主義”學派,曾經還一度被判死刑,被譏諷為“煉金術”。如今,聯結主義開始占據絕對話語權,但誰又能保證,未來不會再次反轉?我們可以對AI技術的未來心懷樂觀,但以史為鑒,也無需過早地認為,人類已經找到了人工智能的終極答案。】
回顧人工智能的發展歷史,有三個主要的人工智能學派,分別是機器模擬人類心智(mind)的符號主義、機器模擬人類大腦(brain)的聯結主義以及機器模擬人類行動(action)的行為主義(見表 1-1)。由于行為主義的研究主要和機器人學高度相關,往往被視為相對獨立的分支,且其主要觀點已經融入聯結主義的方法論,因此本書主要介紹符號主義與聯結主義這兩個觀點相對的人工智能學派。
表 1-1 人工智能學派主要思想和典型應用
稱霸早期人工智能的符號主義
從 1956 年達特茅斯會議第一次提出“人工智能”一詞到 20 世紀 90 年代末,符號主義統治了早期的人工智能。如果用一句話來描述符號主義的思想,那就是將現實世界抽象為可被機器識別和計算的符號,利用運算模仿人腦思考,通過邏輯推理來認知世界。簡言之,符號主義認為智能就是計算。由于邏輯和計算是人類典型的心智活動,因此符號主義也常常被稱為心智派。
追根溯源,符號主義直接脫胎于艾倫 · 麥席森 · 圖靈的思想。圖靈定義了什么是人工智能,以及人工智能應該具備什么樣的能力。20 世紀 40 年代,二戰帶來的計算科學和半導體技術的大爆發,讓人們越來越多地在現實層面討論機器智能的可能。但在那個約翰 · 馮 · 諾依曼還沒提出計算機架構的年代,學術界根本無法對人工智能的定義達成一致,更不用說形成一門嚴謹的學科了。
此時圖靈的天才盡顯無遺,他另辟蹊徑,先假定機器可以具有類似人類的智能,然后給出一個判斷方法:人與一臺機器和另一人進行對話,通過提問與回答,分辨與之對話的是機器還是人類。如果人無法區分機器和人類,則代表機器通過了測試,是具備智能的。
這就是大名鼎鼎的“圖靈測試”,起初它只是在論文中的一個思維實驗。圖靈沒有想到的是,圖靈測試會成為判斷人工智能水平的重要標準。到 2024 年的今天,每隔幾年就會有研究團隊帶著自己的人工智能向圖靈測試發起挑戰,但還沒有一個可以成功,即便是今天最強大的生成式 AI 模型也沒有完成圖靈的愿景。
1950 年,圖靈發表了題為《計算機器與智能》的重要論文,探討“機器能否思考”這一問題。圖靈的明智之處,是他沒有糾結于機器如何思考的問題,而是開創性地提出用計算和推理達到智能的效果,并提出了用圖靈機的計算架構去實現這種智能,以及用圖靈測試來驗證智能效果。可以說他一個人定義了什么是人工智能(計算)、如何實現智能(圖靈機)以及人工智能的標準(圖靈測試),因此被公認為“人工智能之父”。
回看歷史,如果我們承認圖靈是人工智能的奠基人,那我們可以說早期的人工智能就是符號主義的。顧名思義,符號主義得名于符號,其思想主要繼承于圖靈,認為智能等同于計算。為了實現智能,就要用各種方法將現實世界的各種物體抽象成符號,然后利用邏輯和計算替代人類大腦的思考。
在圖靈、馬文 · 明斯基和赫伯特 · 西蒙等代表人物的引領下,符號主義學說在人工智能領域的統治地位維持了半個多世紀,直到杰弗里 · 辛頓等學者引領的機器學習潮流出現。然而由于時代和相關技術的局限性,符號主義 AI 取得的兩大主要成就是符號表達和專家系統。
將知識符號化的過程又被稱為符號表達,也是實現符號主義 AI 的基礎步驟,其中應用最廣的一個系統就是語義網絡。語義網絡可以直觀地呈現信息,并且能進行復雜的語義推理。進入互聯網時代,谷歌在 2012 年提出了知識圖譜的概念,語義網絡的相關研究和應用又迎來了一個小高潮。在知識圖譜的幫助下,搜索引擎能夠確定 Apple(品牌)和 apple (水果)之間的區別。語義網絡在自然語言處理(NLP)和知識圖譜等領域至今仍廣泛應用,是符號主義在今天仍然在發揮作用的為數不多的重要遺產。
符號主義的另一個主要成就是專家系統。顧名思義,專家系統是一套回答人們特定問題的計算機系統。20 世紀 70 年代,計算機的硬件發展讓大規模的知識存儲成為可能,專家系統應運而生,這些系統基于特定行業的知識收集存儲,并利用編程規則解決特定的專業問題,如醫療診斷、金融分析等。專家系統的概念,第一次讓社會看到了人工智能在商業應用中的前景。
人們對人工智能首次在商業世界中的大規模應用充滿期待。然而后來的歷史證明,符號主義正在走入一條沒有出路的死胡同。符號主義相信,邏輯是認知世界的唯一途徑,因為這是人類認知世界的方式,因此他們不辭辛勞地為計算機所做的每一個決定進行編程。然而問題是,現實世界往往充滿了定義不清和難以描述規則的事件,一個由工程師精心打造、像鐘表一樣精密的專家系統根本無法應對這樣的情況。
專家系統未能達到預期,讓人們對人工智能產業再次失望,直接引發了人工智能第二個冬天的到來(見圖 1-1)。盡管深藍計算機應用最新的統計學方法戰勝了人類,但這種勝利也展現了符號主義的局限性—— IBM 花費了多年時間和數百萬美元開發一臺能下國際象棋的計算機,但僅此而已,深藍在其他領域毫無建樹。
到此為止,符號主義 AI 看似已經進入瓶頸,無法解決通用性和隨機性問題的弊端讓 AI 難以實現可觀的商業價值。由于發展沒有達到外界預期,符號主義 AI 兩次陷入低谷,外部投資、政府支持和相關學術研究大量減少,史稱 AI 寒冬。浙江大學人工智能研究所所長吳飛認為:“將人類所有知識收集起來且形式化的任務根本無法完成。人工智能需要模擬大腦而非追求嚴密的推導功能,即對推理的嚴格約束進行松綁。”看來人工智能要實現破局,需要我們擁有一種完全不同的思維方式。
命途多舛的聯結主義
如果說符號主義試圖模擬人類的心智,那么聯結主義則試圖模擬人類的大腦。與稱霸主流的符號主義相比,聯結主義的發展更加一波三折,甚至有點像武俠小說的情節——主人公遭遇重大打擊卻矢志不渝,后來的一番奇遇讓他修得神功,最終一統江湖。聯結主義的主要思想——模擬人腦的神經網絡理論,在人工智能發展早期就已經出現,和符號主義分庭抗禮,但卻因為種種限制長期被壓制,并沒有得到長足發展。神經網絡的創始人沃爾特 · 皮茨(Walter Pitts)英年早逝,第一個將神經網絡投入應用的學者弗蘭克 · 羅森布拉特(Frank Rosenblatt)甚至被很多人認為是間接死于學派理論之爭,直到辛頓攜深度學習出世,神經網絡才成為人工智能研究的主流。
符號主義稱霸了早期人工智能領域,以神經網絡為基礎的聯結主義則統治了今天的人工智能領域。1943 年,神經學家沃倫 · 麥卡洛克(Warren McCulloch)和數學家皮茨提出了首個人工神經網絡模型,從而開創了人工神經網絡模擬人類大腦研究的時代,這就是聯結主義的起源。后來人們根據麥卡洛克和皮茨的名字將神經元模型命名為“M-P 神經元模型”。神經元模型的發布并沒有造成太大的影響力,因為它實在太簡單,人們不知道它能做什么。直到 1957 年,羅森布拉特在一臺 IBM 704 計算機上模擬實現了一個叫作“感知機”(perceptron)的神經網絡模型“Mark Ⅰ”(見圖 1-2),號稱可以對手寫數字進行視覺識別和分類。
簡單來說,最初的神經網絡就像一個超級大的參數方程,每個參數對應手寫數字的一個像素。通過研究大量的手寫體數字,研究人員就可以設定每個參數的賦值——在今天的大語言模型中稱之為權重,神經網絡就可以分辨數字了。
圖片來源:https://transbordeur.ch/en/2019/conversations/圖 1-2 羅森布拉特和他的感知機“Mark Ⅰ”
盡管感知機的功能簡單,卻有著重大意義。這是人類第一次只需要通過預先的參數調整,不依靠編程,僅靠機器學習以完成某項智能任務,這就展現了一條獨立于圖靈機和符號主義的實現人工智能的全新道路。至今所有以神經網絡為基礎的人工智能模型在最基本的工作原理上都與感知機并無二致。
更重要的是,它和主流的符號主義思想完全背道而馳,形成了一種學術路線之爭,自然會引發學術同行的質疑和論戰。聯結主義的代表馬文 · 明斯基和西摩爾 · 派普特(Seymour Papert)在 1969 年出版的《感知機》這本書中指出了感知機神經網絡的一個致命問題:神經網絡可以很好地完成“與”“或”“非”的邏輯運算,卻無法完成異或(exclusive-OR, 縮寫成 XOR)這一人類可以簡單處理的邏輯運算,這是由于像感知機這樣單層的神經網絡(只有一層輸入層和一層輸出層)無法解決非線性分割問題。
要解決這一問題,只能通過多層神經網絡,也就是深度學習的方法,但由于當時計算能力有限,根本無法解決多層神經網絡造成計算量激增的問題。
作為人工智能的先驅,明斯基的著作在該領域有巨大的影響力,且他對單層神經網絡缺點的論證幾乎無懈可擊,這在當時人們的頭腦中烙下思想鋼印:“神經網絡連最基本的邏輯運算都無法完成,更不可能具有智能。” 從此之后,研究者對神經網絡研究的熱情大減,甚至視之為人工智能研究的“異端”。由于在學術論戰中落敗,羅森布拉特從此一蹶不振,并在《感知機》出版不久后的 1971 年,不幸在自己 43 歲生日當天溺水身亡。而在該書出版的同一年,年僅 46 歲的皮茨在收容所孤獨死去。4 個月之后,麥卡洛克也在醫院過世。
短短兩年間,幾位領軍人物相繼離世,這對整個聯結主義學派乃至人工智能領域來說都是沉重的打擊,有關神經網絡的研究進入了一個長達幾十年的低潮期,直到辛頓引領的深度學習潮流出現,才上演了王者歸來的大戲。
可以看到,符號主義和聯結主義思潮在 20 世紀 60 年代相繼出現,但各自都遭遇了挑戰和挫折。盡管符號主義是當時的“顯學”,但也遇到了研究的瓶頸,無法滿足人們對人工智能不切實際的預期。而聯結主義則在路線斗爭中落于下風,被譏諷為“煉金術”,難以獲得資金和人才的支持。當然,受限于時代,計算技術、數據存儲技術的發展都剛剛萌芽,人工智能的研究者們很難將他們的設想化為現實,這也是人工智能屢屢遭遇寒冬的客觀原因。
(本文節選自《云上的中國3》 作者:吳曉波 / 安健 / 劉斌)
本文系觀察者網獨家稿件,未經授權,不得轉載。
標簽 人工智能- 責任編輯: 賀喜格 
-
中央金融紀監工委,首次亮相
2024-07-22 16:49 高層人事 -
對美加征關稅商品第十五次排除延期清單公布
2024-07-22 16:27 中美關系 -
央行:下調常備借貸便利利率10個基點
2024-07-22 14:21 -
日本車企高管:對中國電動汽車快速發展“非常害怕”
2024-07-22 09:08 -
新一輪財稅改革任務清單公開,涉及個稅等20項重大改革
2024-07-21 19:09 觀網財經-宏觀 -
今夏冰杯火了,杯子卻要進口?
2024-07-20 11:54 觀網財經-消費 -
雷軍:周受資離職是當頭一棒
2024-07-20 07:55 觀網財經-科創 -
“很有含金量”,旅客帶1.805千克黃金首飾入境被海關查獲
2024-07-19 17:36 黃金游戲 -
當萬斯崛起時:PayPal黑幫如何改變了美國政治
2024-07-19 16:31 -
遭遇史上最激烈罷工,三星如何走出“中年危機”?
2024-07-19 16:11 -
OpenAI推出GPT-4o mini,號稱“最具成本效益的小模型”
2024-07-19 11:42 觀網財經-科創 -
被歐盟法院裁定為“守門人”,字節跳動:失望
2024-07-18 17:54 觀網財經-互聯網 -
去年虧損近40億元,東風汽車集團仍難回歸A股
2024-07-18 17:22 觀出行 產業新聞 -
開售3個月,華為Pura70官宣降價
2024-07-18 13:32 觀網財經-科創 -
20多座高鐵站“閑置”,還有救嗎?
2024-07-18 13:28 高鐵世紀 -
“實現中國式現代化,需要三大區域共挑大梁”
2024-07-18 11:36 中國經濟 -
陳文玲:開放就是最大的改革
2024-07-18 10:33 2024中國經濟季度觀察 -
陳文玲:這是中國在大國競爭博弈中的底氣
2024-07-18 10:33 2024中國經濟季度觀察 -
香港消委會就農夫山泉事件致歉
2024-07-18 09:22 觀網財經-消費 -
飲用水跌回“1元時代”
2024-07-18 07:34 觀網財經-消費
相關推薦 -
“美國急著找替代,卻發現印度越來越依賴中國” 評論 16史上首次!大眾汽車考慮關閉德國工廠,與中國有關? 評論 154“現在,以色列處于重大轉折點邊緣” 評論 88孟臨時外長:或將重新審查孟印諒解備忘錄 評論 43歐盟進口天然氣單季總量,俄羅斯反超美國了 評論 104最新聞 Hot
-
“美國急著找替代,卻發現印度越來越依賴中國”
-
中國鐵路扭虧為盈!負債率回落至10年來最低水平
-
韓國要吃不上泡菜了,還得靠中國?
-
委內瑞拉發出逮捕令,馬杜羅:他竟敢說不承認法律
-
史上首次!大眾汽車考慮關閉德國工廠,與中國有關?
-
美國大兵在土耳其被套頭胖揍:滾回家去
-
哈里斯首度發聲:不能賣!
-
“現在,以色列處于重大轉折點邊緣”
-
“唯一能結束俄烏沖突的國家”?他竟這樣強扯中國…
-
聞所未聞!美國把馬杜羅“專機”扣了
-
波音“星際客機”發出異響,NASA回應
-
她宣稱:歐洲應吸取過度依賴俄油氣的教訓,減少對華技術依賴
-
“日本敢這么干,中國有狠招等它”
-
惡臭無比!以色列本國抗議者也被用上這東西了
-
歐盟進口天然氣單季總量,俄羅斯反超美國了
-
韓高官:想讓我們對付中國,美國得“加錢”
-