|
專家解讀諾貝爾化學(xué)獎,化學(xué)家還不會“失業”時間:2024-10-17 “生命的奧秘不是純粹的生物(wù)學(xué)問題,它不是孤立的。要研究這樣一個複雜生命過程,需要用(yòng)到生物(wù)、化學(xué)、物(wù)理(lǐ)、數學(xué)、計算機等等。” 人類研究者在對問題的敏銳上是目前AI比不上的,也能(néng)夠很(hěn)快地擁抱新(xīn)技(jì )術助力研究 北京時間10月9日下午,2024年諾貝爾化學(xué)獎在瑞典揭曉。獎項授予大衛·貝克(David Baker)、德(dé)米斯·哈薩比斯(Demis Hassabis)和約翰·詹珀(John Jumper),以表彰他(tā)們在使用(yòng)機器算法解讀蛋白質(zhì)結構方面所作(zuò)出的巨大貢獻。解析蛋白質(zhì)結構是困擾了科(kē)學(xué)家50年的難題。蛋白質(zhì)是生命的基石,不僅組成了我們身體(tǐ)的器官組織等基本結構,還作(zuò)為(wèi)荷爾蒙、生物(wù)信号傳遞物(wù)質(zhì)、抗體(tǐ)等廣泛參與各種生命過程。蛋白質(zhì)由20個氨基酸排列組合成的長(cháng)鏈折疊而成,就像同樣的紙能(néng)折成紙鶴也能(néng)折成盒子,不同的折疊方式所形成的結構決定了蛋白質(zhì)的功能(néng)。 氨基酸鏈條在被細胞生産(chǎn)出來之後,會迅速自發折疊成具(jù)有(yǒu)特定結構的蛋白質(zhì)。科(kē)學(xué)家們後來發現,指導折疊的“命令”就藏在氨基酸鏈條的序列之中(zhōng),自此開啓了對氨基酸序列和蛋白質(zhì)結構之間關系的科(kē)學(xué)探索。 與這個領域差不多(duō)同時開始發展的是計算機科(kē)學(xué)中(zhōng)神經網絡的研究。這種算法的設想是建立類似大腦的計算系統,其中(zhōng)每個神經元節點能(néng)夠接收來自其他(tā)節點的信号,并計算是否向下一個節點發送信息。在這樣的網絡中(zhōng),信息通過多(duō)層次的神經元加權計算,就能(néng)最終形成對輸入信息模式的識别。科(kē)學(xué)家們早已嘗試通過這種技(jì )術來計算氨基酸序列和蛋白質(zhì)結構之間的關系,但這兩個領域都進展緩慢。 在2010年之後,神經網絡技(jì )術得到了重大突破,神經元的層數從2層增加到了成百上千層,從淺層網絡變成“深度學(xué)習”和“人工(gōng)智能(néng)”(AI),并能(néng)夠完成對話、圖像識别和生成等複雜任務(wù)。與此同時,通過實驗生物(wù)學(xué)家的不斷努力和冷凍電(diàn)鏡等觀測技(jì )術的發明,被解析出來的蛋白質(zhì)結構從幾種暴漲到14萬種,為(wèi)深度學(xué)習提供了數據基礎。 複雜的蛋白質(zhì)結構問題最終迎來“人工(gōng)智能(néng)”時刻。來自谷歌公(gōng)司的哈薩比斯和詹珀創造了AlphaFold系列算法,通過不斷叠代,2020年誕生的AlphaFold2已經能(néng)夠以超過90%的正确率通過氨基酸序列預測人類所知的2億種蛋白質(zhì)結構。而蛋白質(zhì)計算領域的先驅者貝克除了創造多(duō)種預測算法外,更加開創了在沒有(yǒu)現存蛋白質(zhì)結構參考的情況下“從頭設計”蛋白質(zhì)的先河,為(wèi)藥物(wù)設計等領域作(zuò)出了巨大貢獻。 今年是諾貝爾獎的“AI年”,物(wù)理(lǐ)學(xué)獎與化學(xué)獎都頒給了AI相關的工(gōng)作(zuò)。這是否意味着AI已經能(néng)夠取代科(kē)學(xué)家的工(gōng)作(zuò)?本屆得主為(wèi)何獲得化學(xué)獎而非生理(lǐ)學(xué)或醫(yī)學(xué)獎?蛋白質(zhì)結構問題已經被解決了嗎?為(wèi)了解答(dá)這些問題,澎湃科(kē)技(jì )采訪了上海交通大學(xué)化學(xué)化工(gōng)學(xué)院長(cháng)聘教軌副教授沈琦。 頒給蛋白質(zhì)結構問題,更是頒給AI 為(wèi)何蛋白質(zhì)研究沒有(yǒu)獲得生理(lǐ)學(xué)獎或醫(yī)學(xué)獎而是獲化學(xué)獎,而AI又(yòu)能(néng)獲得化學(xué)獎?對此,沈琦表示,生命的問題本質(zhì)上就涉及到交叉學(xué)科(kē),而像AI這樣的強力工(gōng)具(jù)能(néng)幫助人們進行探索。 “生命的奧秘不是純粹的生物(wù)學(xué)問題,它不是孤立的。要研究這樣一個複雜生命過程,需要用(yòng)到生物(wù)、化學(xué)、物(wù)理(lǐ)、數學(xué)、計算機等等。”他(tā)說。以蛋白質(zhì)為(wèi)例。組成蛋白質(zhì)的基本單元氨基酸是由一個氨基、一個羧基、一個氫原子和一個側鏈基團組成。不同氨基酸的區(qū)别在于它們的側鏈基團不同,這影響了它們在蛋白質(zhì)結構中(zhōng)的相互作(zuò)用(yòng)和功能(néng)。當兩個氨基酸相遇時,其中(zhōng)一個的羧基結構會和另一個的氨基發生反應,形成肽鍵将它們連接在一起,如此形成多(duō)肽鏈。這便是蛋白質(zhì)的“一級結構”。多(duō)肽鏈會以螺旋或折疊的方式形成特定的“二級結構”,這些二級結構又(yòu)能(néng)通過連接結構形成更複雜的三級結構。正如在折紙時涉及到紙張硬度、施力大小(xiǎo)等多(duō)種物(wù)理(lǐ)、材料規律,多(duō)肽鏈的折疊也是由氨基酸序列中(zhōng)原子和分(fēn)子的相互作(zuò)用(yòng)決定的,如氫鍵、疏水作(zuò)用(yòng)、離子鍵、範德(dé)華力等。 沈琦說,要研究這個過程,就涉及到微觀層面的物(wù)理(lǐ)化學(xué)知識,如力場等。“能(néng)量最小(xiǎo)化”是研究蛋白質(zhì)折疊的一個重要線(xiàn)索。就像“水往低處流”一樣,蛋白質(zhì)折疊也傾向于形成能(néng)量最小(xiǎo)的狀态,科(kē)學(xué)家們因此可(kě)以通過計算分(fēn)子間的相互作(zuò)用(yòng)力,模拟蛋白質(zhì)的折疊和動态行為(wèi)。從這個角度上來說,“蛋白質(zhì)結構問題的研究頒生命科(kē)學(xué)、化學(xué)甚至物(wù)理(lǐ)獎,都是可(kě)以的。”而随着AI的出現,蛋白質(zhì)預測的準确率和效率都得到了前所未有(yǒu)的提高,解決了困擾化學(xué)家多(duō)年的重大科(kē)學(xué)難題,并成為(wèi)廣大科(kē)研人員手中(zhōng)的得力工(gōng)具(jù),獲獎實至名(míng)歸。 沈琦告訴澎湃科(kē)技(jì ),有(yǒu)了這些預測工(gōng)具(jù)之後,科(kē)學(xué)家們能(néng)夠根據氨基酸序列快速計算出蛋白質(zhì)的精(jīng)細結構,大大提高工(gōng)作(zuò)效率。另外,通過AI也能(néng)高效設計和驗證新(xīn)的蛋白結構,幫助新(xīn)藥開發和人工(gōng)生命體(tǐ)的構建。“從蛋白質(zhì)一級結構預測高級結構是化學(xué)生物(wù)學(xué)家、結構生物(wù)學(xué)家和物(wù)理(lǐ)化學(xué)家都非常關心的一個重要問題。”他(tā)說,“AI确實在某種程度上解決了它。” AI隻是工(gōng)具(jù):生物(wù)化學(xué)家還不會“失業” “自己辛辛苦苦花(huā)費數年解析出來的蛋白質(zhì)結構被AI很(hěn)快精(jīng)準預測了,很(hěn)多(duō)結構生物(wù)學(xué)家心裏确實會不舒服。”沈琦說。不過在他(tā)看來,AI在蛋白質(zhì)結構預測領域還有(yǒu)很(hěn)長(cháng)的路要走。他(tā)認為(wèi),蛋白質(zhì)結構預測的終極問題還未被解決,AI算法對我們徹底理(lǐ)解底層生物(wù)規律的幫助有(yǒu)限。AlphaFold一類的大模型本質(zhì)是通過對已有(yǒu)的大量氨基酸序列和蛋白質(zhì)結構數據的比對而形成概率預測,發現更有(yǒu)可(kě)能(néng)的結構,對于蛋白折疊過程背後的科(kē)學(xué)規律的認識還很(hěn)有(yǒu)限。 雖然目前AI預測蛋白質(zhì)結構的準确率很(hěn)高,但也不是完全精(jīng)确。“對于蛋白質(zhì)來說,序列上百分(fēn)之幾的差異可(kě)能(néng)就是完全不同的功能(néng)。現在的AI還做不到那麽精(jīng)确,仍然需要依靠實驗觀測去解析。”沈琦說。此外,對于蛋白質(zhì)的動态結構以及蛋白質(zhì)的相互作(zuò)用(yòng),AI的表現也差強人意。“蛋白質(zhì)在溶液中(zhōng)是動态的,彼此之間還會進行複雜的相互作(zuò)用(yòng)。另外,細胞中(zhōng)存在大量沒有(yǒu)正常結構的‘天然無序蛋白’,但卻發揮着重要的作(zuò)用(yòng)。這些AI都還不能(néng)很(hěn)好地預測。”沈琦認為(wèi),AI的成就是以傳統結構生物(wù)學(xué)家數十年的努力作(zuò)為(wèi)基礎的。“沒有(yǒu)他(tā)們通過實驗解析所得到的結構數據,AI是無法訓練的。” 此外,人類研究者在對問題的敏銳上是目前AI比不上的,也能(néng)夠很(hěn)快地擁抱新(xīn)技(jì )術助力研究。“從X射線(xiàn)晶體(tǐ)學(xué),到冷凍電(diàn)鏡,再到現在的AI,仔細觀察的話優秀的學(xué)者并沒有(yǒu)被技(jì )術的更新(xīn)所淘汰,而是能(néng)夠很(hěn)快地擁抱新(xīn)技(jì )術。”他(tā)說。對于人類來說,知識背後的邏輯和直覺或許是最大的優勢。“讓一個生物(wù)學(xué)家去學(xué)AI,或許比讓AI工(gōng)程師更容易在生命科(kē)學(xué)領域出成果”。另外,沈琦表示,“一個好的技(jì )術最終是要做到普及性,讓大家可(kě)以比較快地去學(xué)習。以後用(yòng)AI去預測蛋白,就像查手機地圖那樣簡單。” (原标題:2024化學(xué)諾獎專家解讀:頒給蛋白質(zhì)預測和AI實至名(míng)歸,化學(xué)家還不會“失業”) 轉載鏈接:專家解讀諾貝爾化學(xué)獎,化學(xué)家還不會“失業”—新(xīn)聞—科(kē)學(xué)網 (sciencenet.cn) 如有(yǒu)侵權請聯系我們,我們将會删除。 |