7月20日,國際頂級學術期刊Nature子刊Nature Machine Intelligence(Nature旗下專注于機器學習領域的頂級期刊)在線發(fā)表了華大智造(93.130, 0.00, 0.00%)楊夢團隊研究成果《Self-play reinforcement learning guides protein engineering》,發(fā)布了一款名為EvoPlay的算法模型。這也是華大智造團隊在該雜志發(fā)表單細胞對比學習自監(jiān)督Concerto算法后,時隔一年再度發(fā)表AI算法相關文章。
EvoPlay由“Evo”、“Play”兩個英文單詞組合而成,前者意為進化,指蛋白質分子的功能進化;Play指的是博弈類搜索算法。EvoPlay算法模型就是借鑒圍棋自博弈的方式搜索海量蛋白質突變空間,通過結合不同的功能或結構預測模擬器,像自動駕駛一樣訓練智能體完成指定功能增強的蛋白進化。
據悉,蛋白質的工程化設計和改造是基因測序儀的底層基礎,基因測序儀的迭代升級離不開蛋白工程技術的突破??茖W家們通過改造各種各樣的蛋白質操縱DNA分子、讀取酶催化的信號從而識別堿基序列。從華大智造測序儀試劑里用到的聚合酶、熒光素酶等各種工具酶,到更廣范圍的生物催化劑、生物傳感器、治療類抗體到生物燃料,都離不開對蛋白質的設計和改造。
從AI到BI,EvoPlay模型實現AI智能體訓練
近期,人工智能再一次成為全球矚目的焦點,今天,現代詞典將人工智能定義為計算科學的分支,及機器如何模仿人類智能?!洞笥倏迫珪分赋觯骸叭斯ぶ悄埽笖底钟嬎銠C或計算機控制的機器人(13.490, 0.00, 0.00%)執(zhí)行通常與智能生物相關的任務的能力。”簡言之,AI是技術性的模擬與推理,是“技術驅動”模式,目標是用機器代替部分人工勞動。
大眾熟知的AlphaGo是DeepMind最重要的AI模型之一。它是一個基于深度學習和強化學習的人工智能圍棋程序,2016年,AlphaGo與世界圍棋冠軍李世石進行五局三勝的對弈,并以4比1的總比分獲勝,引起了廣泛的關注和震動。這一勝利標志著人工智能首次在高度復雜的游戲中超越人類頂尖選手。
而AlphaZero是DeepMind后續(xù)進一步發(fā)展的AI模型。它不需要任何人類的經驗知識,只需要知道游戲規(guī)則便能通過自我對弈和強化學習從零開始學習并掌握多種棋類游戲,包括圍棋、國際象棋和日本象棋,它以驚人的速度超越了世界上最強大的棋類引擎,并展示了一種通用的自學習方法,能夠適應不同的領域和問題。
而華大智造發(fā)布的EvoPlay模型便是借鑒了這種方法,并將其運用到了蛋白質設計領域當中,研究團隊將蛋白質序列上每一個位點的突變當作是圍棋中的每一次落子,將優(yōu)化的最終序列當作是一局圍棋的結束,通過自我對弈和蒙特卡洛樹搜索在蛋白質序列空間中不斷的搜索和優(yōu)化序列,同時作者使用一個代理模型來為每一次位點突變進行獎勵,最終成功生成了大量的具有特定功能的序列。
從人工智能(AI)到生物智能(BI),EvoPlay算法把經典的強化學習應用到了蛋白質設計框架中,不僅能夠增強傳統(tǒng)MLDE的采樣效率,并能夠結合最新的蛋白質結構解析模型(AlphaFold2)直接設計出帶目標結構的氨基酸序列。EvoPlay既能夠用于傳統(tǒng)定向進化,也能夠被納入“從頭設計”的理性設計框架中。
文章的通訊作者,來自華大智造研發(fā)團隊的楊夢表示:“我們有理由相信在更多的理性機制分析以及更精密的結構代理模型的幫助下,EvoPlay的蒙特卡洛樹搜索+神經網絡可以更好地結合‘從頭設計’框架,從而為蛋白設計領域提供新的思路,也可以用來進一步優(yōu)化基因測序儀里用到的各種工具酶。
此外,EvoPlay模型已經進行了一些實踐,比如說研究者已經利用EvoPlay前瞻性地設計了36個熒光素酶突變體,其中的29個變體已申請專利,發(fā)現。EvoPlay在尋找起始庫之外更高適應性突變體方面非常有效,并且可以與現有的工程流程相集成。
同時,實踐也證實了EvoPlay展示了其在高效設計高質量多肽上的性能,將適用于蛋白質-蛋白質相互作用、酶設計和藥物發(fā)現等多種應用領域。
AI推動生命真智能:EvoPlay模型的展望與未來
伴隨著自動化生物實驗室的蓬勃發(fā)展,以及微流控技術廣泛用于分子篩選和進化實驗室,更多的自動駕駛實驗室(Self-driving Lab)即將出現。在生命科學和技術實驗室中的各個環(huán)節(jié),包括實驗的執(zhí)行、數據的收集和分析、實驗計劃的制定等, 如Design-Build-Test-Learn (DBTL)的循環(huán)的自主執(zhí)行,未來都可以由自動化系統(tǒng)和人工智能來完成,而不需要人類進行主動的干預或操作。智能體還可以通過LLM等工具整合外部知識,多輪迭代探索,連續(xù)學習,創(chuàng)造出滿足人類需求的酶、抗體、小分子、基因序列甚至人造細胞。
EvoPlay模型的誕生無疑驗證了這種可能性,在人類不斷升級認知極限的過程中,人工智能和機器人有巨大的潛力去幫助人類科學進一步探索未知的邊界,從認知生命到掌控生命,期待能夠實現人工智能和生物智能的和諧共生,最終實現真智能。