-
潘禺:在這迷人又壯美的科學領域,“中國玩家”能奮起直追嗎?
最后更新: 2024-10-10 08:34:47為了搞清楚這些問題,至少必須先用實驗確定蛋白質的結構。科學家將蛋白質培育成晶體,用X射線轟擊它們,并測量射線的彎曲,這就是X射線晶體學。20世紀60年代,生物學家馬克斯·佩魯茨和約翰·肯德魯用這種方法確定了血紅蛋白和肌紅蛋白的3D結構,又一項獲得諾貝爾獎的工作產生了。
隨著更多蛋白質結構被發現,科學家們在1971年建立了蛋白質結構的免費檔案庫——蛋白質數據銀行。最初,只包含了七種蛋白質的結構。近50年后,谷歌DeepMind使用它來訓練AlphaFold時,已經包含了超過140000種。
因為方法的繁瑣,為蛋白質銀行添磚加瓦的過程,曾經是非常艱難痛苦的。科學家們先要創建蛋白質電子密度圖,在電子聚集的區域可能包含一個原子。將電子密度圖打印到塑料片上,一個個堆疊起來,就創建了蛋白質地理的“等高線圖”。然后,科學家們要將地圖轉換為物理模型,將塑料地圖放入理查茲盒中,這個設備以發明者牛津大學生物物理學家理查茲的名字命名,在理查茲盒內,一定角度的鏡子將地圖反射到工作區,使科學家能準確看到每個原子的相對位置。然后,科學家們就用球和棍子物理構建他們的模型。
為了研究并模擬磷酸化酶,科學家不得不爬上梯子進入一個特別建造的、有兩層樓高的理查茲盒中。這種蛋白質擁有842個氨基酸,是當時人們研究過的最大的蛋白質。由于進展的煎熬和緩慢,蛋白質銀行成立的20年后,有信心確定而被提交的蛋白質結構也不過七百多種。
實驗主義與計算主義
主張計算方法的科學家,已經厭倦了實驗派的做法,他們希望另辟蹊徑。
正如安芬森的教條,蛋白質的結構應該能從其氨基酸序列中預測出來。計算生物學家編寫計算機算法,希望可以給程序輸入一串氨基酸,生成正確的蛋白質結構。對計算方法來說,蛋白質的三維結構預測問題,可以看成這樣一個問題,輸入是一個字符串,輸出是每個字符(殘基)對應的三個扭轉角?、ψ和ω,看起來簡潔漂亮。注意,這看起來和AI處理的一些經典問題,如序列標注、機器翻譯等問題很像。
計算派的做法是在虛擬世界構建自己的模型,設計自己的算法,比如假定原子以某種方式粘在一起,蛋白質總是這樣向右或向左折疊,但這些模型逐漸遠離現實。
實驗主義者工作精確但速度慢;計算主義者工作迅速,但與生物物理現實脫節,常常出錯。兩種方法的優點,必須結合起來。實驗派和計算派的科學家,必須牽手合作。
物理學家普朗克有過一句名言:“一個新的科學真理的成功,并不是因為它征服了那些反對者并使他們頓悟,它的成功是因為它的那些反對者最終逝去,而心向新理論的新生代最終成長起來。”
普朗克說的應該是科學理論,是有哲學高度的理論解釋。或許正因為理論還難以建立,在蛋白質生物學的發展歷程中,我們看到的并不是這樣殘酷的規律,而是反對派之間的合作共進。在20世紀90年代,科學家們組成了社區,實驗主義者提供最新的蛋白質氨基酸序列清單,計算主義者則盡其所能,用他們想要的任何方法來預測蛋白質的結構。一個獨立的科學家小組,通過將計算派的模型與實驗確認的結構進行比較,來評估模型。
這個名為CASP的社區,成了解決蛋白質折疊問題各種計算方法的試驗場,最后實際上已經變成了一場競賽。在美國加州的一座老教堂里,計算主義者可以在會議中談論他們的方法,組織者鼓勵與會者,如果不喜歡他們聽到的內容就在木地板上跺腳。據一位生物學家回憶:“一開始,有很多跺腳,幾乎就像打鼓一樣。”
一些方法的表現比預期好,比如“同源建模”,比較已知蛋白質的結構來推斷未知蛋白質的結構。其他的則完全沒有用。在1998年的比賽中,大衛·貝克用他的算法羅塞塔(Rosetta)大放異彩,羅塞塔算法模擬了氨基酸分子間原子的相互作用,以預測它們將如何折疊。盡管還不夠準確,無法實用,但人們看到了計算預測蛋白質結構的曙光。
2008年,貝克創建了一個名為Foldit的免費在線電腦游戲,也就是本文開頭所說的那個游戲。在當時,人類玩家模擬蛋白質超過了羅塞塔,但人類的領先優勢不會持續太久。
如果兩個氨基酸一起突變,它們可能有某種聯系,可能在空間上很接近,這一概念被稱為共同進化。在清除了統計方法引入的錯誤后,科學家提高了對哪些氨基酸共同進化的預測準確度,基于此,羅塞塔算法能更準確預測蛋白質結構,這可能是深度學習之前推動該領域進步的最大里程碑之一。但共同進化需要大量相似的蛋白質進行比較,而實驗主義者解析蛋白質結構的速度不足以滿足計算主義者的需求。
新玩家上場
2016年,谷歌DeepMind的人工智能團隊以深度學習算法在圍棋中擊敗了人類冠軍,轟動了世界。
深度學習本身就是計算機科學受到生物學啟發的范例。在大腦皮層中,分子信息被發送到神經元相互連接的網絡中。神經元有叫作突觸的小臂,它們抓住鄰近神經元發出的分子,這些分子告訴接收神經元要么發射并傳播信號,要么不發射。
將電子位連接起來創建“神經網絡”的想法,早在20世紀50年代就已經在計算機科學中產生。神經網絡中的每個單元是一個節點,可以比作神經元:一個神經元從其他神經元接收信息,然后計算是否向接下來的神經元發射。在神經網絡中,信息在多層神經元中傳播,以產生特定的結果,比如圖像識別。神經元層數越多,可以執行的計算就越復雜。
這一靈感正是來自大腦。神經科學發現,我們的大腦會通過逐步抽象的方式來分析眼睛所看到的事物。在AI應用中,輸入數據的傳感器可以是鏡頭、麥克風或者其他測量儀器。而我們人類眼睛中的傳感器又被稱為視錐細胞和視桿細胞,它們會探測那些令其進入激發狀態的光線,得到光線的亮度和顏色。這相當于計算機圖像中每一個像素的亮度和顏色。人類的第二層神經元會連接著眼睛的視錐細胞和視桿細胞,一般會衡量相鄰像素之間的相關度,根據上一層神經元的激活情況來計算。下一層神經元可以在眼睛看到的圖像中找出明顯的線條,再下一層,會將線條結合起來,得知圖像中的基本對象,比如綿羊的耳朵。再之后的層次,繼而將這些基本對象結合起來,確定更深層次的結構,比如圖像中是否存在綿羊。
2010年代初,計算機科學家已經能更好構建神經網絡,允許更多層的可靠訓練。網絡深度從之前的兩三層,躍升到數千層。為了區分過去淺層的做法,人們開始用“深度學習”這個更時髦的名字來稱呼。深度學習改變了人工智能,算法不僅在圖像和聲音的識別上表現出色,在圍棋這樣的游戲中也能擊敗人類。近年來,基于深度學習的自然語言處理模型GPT,則在文本生成上又一次震撼了世界。
這里多說幾句題外話,當前的人工智能革命,還與一種概率論思想——貝葉斯方法(Bayesian methods)有關。貝葉斯方法的核心思想是根據觀測數據更新先驗概率,得到后驗概率分布。貝葉斯方法將不確定性視為概率分布,能夠量化模型的不確定性。在深度學習中,許多問題涉及到對不確定性的建模,例如參數估計、預測的置信度等。用貝葉斯方法,能夠更加靈活地處理這些問題。
一些科學家甚至相信,我們的大腦就是一個能對貝葉斯公式進行各種各樣近似計算的計算器,也就是貝葉斯大腦,貝葉斯公式很可能在人類認知中處于核心位置。貝葉斯主義者的信念也深刻影響了當前人工智能的發展。總之,“生物學太重要了,不能只留給生物學家”,為了努力理解不同的蛋白質如何折疊,人們不僅要研究生物,還要研究數學、物理、化學、統計學、計算機科學……
百圖生科首席AI科學家宋樂在談到其大模型時就說過:“不單單需要AI人才,也有工程人才的參與,此外還需要一些很了解生物知識、對生物數據分析很有經驗的人才。這種團隊的內部合作不容易,但如果成功也會收效頗豐。”
隨著谷歌DeepMind進入蛋白質結構預測領域,受生物學啟發的深度學習,現在要來解決生物學中的難題了。
AlphaFold的小小震撼
DeepMind的這個項目稱為AlphaFold,來自統計學、結構生物學、計算化學、軟件工程等領域的專家,在DeepMind共同研究蛋白質折疊問題。在學術界,專家們通常相互隔離,各自獨立進行項目,很少有這樣的合作,更沒有谷歌龐大的財務和計算資源支持。2017年,蛋白質數據銀行已經擁有超過140000種結構,DeepMind團隊用這些數據訓練他們的算法。
其領導者約翰·賈姆珀(John Jumper)正是在物理、化學、生物學和計算機方面有著多樣化的背景。賈姆珀從小自學了編程,本科學習數學和物理,先攻讀凝聚態物理學博士,后來退學在紐約的一家公司用超級計算機從事蛋白質的模擬,通過理解蛋白質的運動和變化,希望更好地理解各種疾病,如肺癌的機制。此后又在芝加哥大學學習理論化學,完成了博士學位。
約翰·賈姆珀(John Jumper)
2018年春天,AlphaFold已經準備好參加CASP,人工智能要與真正的蛋白質科學家競爭了。CASP組織者最終帶來的消息是,AlphaFold表現得非常好,在預測蛋白質結構方面,比第二名的團隊好大約2.5倍。但這離解決蛋白質折疊問題還很遠。
標簽 心智觀察所- 原標題:在這迷人又壯美的科學領域,“中國玩家”能奮起直追嗎? 本文僅代表作者個人觀點。
- 責任編輯: 袁以衡 
-
我國科技成果轉化問題到了必須要解決的地步
2024-10-08 16:58 心智觀察所 -
2024年諾貝爾生理學或醫學獎揭曉
2024-10-07 17:45 諾貝爾獎 -
跨越7公里!我科學家研究分布式光量子計算獲重要進展
2024-10-07 10:00 科技前沿 -
潘建偉:明年計劃發射2-3顆低軌衛星,10年內建成量子星座
2024-10-04 09:43 科技前沿 -
國際首次!我國科研團隊完成超導太赫茲通信實驗
2024-10-03 19:57 科技前沿 -
突破!我科研人員在高溫超導研究領域取得新進展
2024-10-03 10:23 科技前沿 -
打破國外壟斷!全球最大,成功下線
2024-09-30 11:26 中國精造 -
新突破!自主可控,首試成功
2024-09-27 20:41 科技前沿 -
2024全球創新指數發布:中國居第11
2024-09-27 07:11 -
重要突破!我國科研人員發現能強效抑制艾滋病病毒的納米抗體
2024-09-26 08:06 科技前沿 -
全球首座!我國海上稠油熱采關鍵技術取得重大突破
2024-09-25 08:34 能源戰略 -
一箭五星!力箭一號遙四商業運載火箭發射成功
2024-09-25 08:04 航空航天 -
“蛟龍號”首次搭載外籍科學家進行下潛作業
2024-09-25 07:41 科技前沿 -
中國將在月球上建無線網
2024-09-24 19:44 嫦娥奔月 -
為了美國的“新質生產力”,雷蒙多操碎了心
2024-09-24 12:01 心智觀察所 -
月背“土特產”將開放申請!先發給國內科學家研究
2024-09-24 09:06 科技前沿 -
可用上千年!效率最高的輻光伏核電池在我國面世
2024-09-24 07:22 能源戰略 -
42.02萬高斯!我國打破美國創造的世界紀錄
2024-09-22 17:00 科技前沿 -
美國開始重新審視量子計算機,這對中國很重要
2024-09-20 08:45 心智觀察所 -
俄羅斯擁抱西方的舊夢:“瓦森納協定”正走向歷史垃圾堆
2024-09-18 07:45 心智觀察所
相關推薦 -
“中國在非洲真正贏得了民心,就連斯威士蘭…” 評論 48“日企抱團是絕望之舉,中國工廠效率質量都是第一” 評論 101“她下月訪華,盡管特朗普團隊表達了擔憂” 評論 50“中國有能力讓夢想照進現實,將贏得史詩般競爭” 評論 116美國政府“逃過一劫” 評論 126最新聞 Hot
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團是絕望之舉,中國工廠效率質量都是第一”
-
“中國有能力讓夢想照進現實,將贏得史詩般競爭”
-
被災民暴罵到當場破防,馬克龍發飆:你該慶幸你在法國!
-
美高校敦促國際學生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調”
-
澳大利亞來了,中國就得走人?澳總理這么回應
-
美媒感慨:基建狂魔發力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-
還在扯皮中國,“涉華條款全刪了”
-
中國“光伏OPEC”發文嚴厲質問央企,怎么回事?
-
“最后一道貿易障礙,中國解除了!”
-