<small id="gugpb"></small>

<td id="gugpb"><strong id="gugpb"></strong></td>

<pre id="gugpb"></pre>

<small id="gugpb"></small>

首頁(yè) 新聞 > 產(chǎn)業(yè) > 正文

深勢(shì)科技推出蛋白結(jié)構(gòu)預(yù)測(cè)工具Uni-Fold：開(kāi)源訓(xùn)練代碼提供測(cè)試接口

2021-12-08 16:27:46 來(lái)源: 榕城網(wǎng)

12月8日，來(lái)自深勢(shì)科技的團(tuán)隊(duì)推出了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具Uni-Fold，并開(kāi)源訓(xùn)練、推理代碼。Uni-Fold成功復(fù)現(xiàn)了曾引起生物學(xué)界轟動(dòng)的Alphafold2的全規(guī)模訓(xùn)練，相應(yīng)解決方案已集成至深勢(shì)科技自主研發(fā)的藥物設(shè)計(jì)平臺(tái)Hermite，供廣大用戶(hù)測(cè)試使用。Uni-Fold克服了Alphafold2未開(kāi)源訓(xùn)練代碼、硬件支持單一、模型不可商用等局限性，在訓(xùn)練與推理環(huán)節(jié)進(jìn)行了GPU上的適配、性能優(yōu)化、功能完善等工作，為更多人參與推動(dòng)領(lǐng)域進(jìn)一步發(fā)展提供了基礎(chǔ)。

圖1 Uni-Fold預(yù)測(cè)的蛋白結(jié)構(gòu)

蛋白質(zhì)是組成生命體的重要物質(zhì)基礎(chǔ)。不同的蛋白質(zhì)通過(guò)折疊形成不同的三維結(jié)構(gòu)，執(zhí)行多種多樣的生理功能。從氨基酸序列到對(duì)應(yīng)蛋白質(zhì)三維結(jié)構(gòu)的預(yù)測(cè)問(wèn)題被認(rèn)為是生物學(xué)領(lǐng)域最具有挑戰(zhàn)性的問(wèn)題之一。在過(guò)去幾十年的研究中，科學(xué)家們?yōu)樘綔y(cè)蛋白質(zhì)結(jié)構(gòu)發(fā)展出三大實(shí)驗(yàn)手段：X射線(xiàn)晶體學(xué)、核磁共振和冷凍電鏡。但實(shí)驗(yàn)方法成本高、周期長(zhǎng)。目前人類(lèi)已知有數(shù)十億氨基酸序列，但還原出結(jié)構(gòu)的只有十幾萬(wàn)。生物學(xué)發(fā)展因此頗受掣肘。

近年來(lái)AI的發(fā)展為這一問(wèn)題帶來(lái)了新的可能。在2020年的國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)頂級(jí)競(jìng)賽CASP14（Critical Assessment of protein Structure Prediction 14）上，Google DeepMind推出的AlphaFold2預(yù)測(cè)的大部分結(jié)構(gòu)準(zhǔn)確度均與實(shí)驗(yàn)足夠接近，遠(yuǎn)超此前所有方法。這一結(jié)果也標(biāo)志著蛋白質(zhì)單體的結(jié)構(gòu)問(wèn)題在一定意義上得到了解決。

不過(guò)，盡管DeepMind在半年后開(kāi)源了AlphaFold2模型的推理代碼，其訓(xùn)練代碼并未被公布，且模型不可商用。研究者難以通過(guò)訓(xùn)練或調(diào)整模型進(jìn)一步提升AlphaFold2的表現(xiàn)，或遷移至更多應(yīng)用場(chǎng)景，如蛋白質(zhì)復(fù)合物結(jié)構(gòu)預(yù)測(cè)、蛋白質(zhì)與小分子相互作用、與電鏡實(shí)驗(yàn)結(jié)合等。此外，該代碼基于Google自研的可微分計(jì)算框架JAX及TPU硬件平臺(tái)開(kāi)發(fā)，高度依賴(lài)Google生態(tài)系統(tǒng)。

Uni-Fold打破了這些限制。目前已開(kāi)源的Uni-Fold訓(xùn)練代碼，經(jīng)過(guò)MPI并行、數(shù)據(jù)異步讀取、混合精度訓(xùn)練等優(yōu)化工作，支持高效GPU訓(xùn)練?；趦?yōu)化后的訓(xùn)練代碼，深勢(shì)科技團(tuán)隊(duì)實(shí)現(xiàn)在128塊NVIDIA GPU上進(jìn)行AlphaFold2模型的全規(guī)模訓(xùn)練，并將持續(xù)優(yōu)化所得模型。Uni-Fold的推理代碼更加輕量、高效，在相同硬件環(huán)境下，可獲得與公布的Alphafold2代碼相比2-3倍的效率提升。

在相同的測(cè)試條件下，Uni-Fold的預(yù)測(cè)精度超越了華盛頓大學(xué)蛋白設(shè)計(jì)研究所David Baker教授課題組研發(fā)的RoseTTAFold，與DeepMind官方發(fā)布的AlphaFold2模型接近。深勢(shì)科技團(tuán)隊(duì)使用Uni-Fold對(duì)CASP14蛋白預(yù)測(cè)任務(wù)中的序列數(shù)據(jù)集進(jìn)行了直接測(cè)試，平均Cα-lDDT達(dá)到82.6。可以說(shuō)，Uni-Fold是“訓(xùn)練公開(kāi)版的AlphaFold2”，而且硬件適配與效率更加優(yōu)化。

中科院院士、北京大學(xué)教授、深勢(shì)科技首席科學(xué)顧問(wèn)鄂維南評(píng)價(jià)道：“盡管DeepMind開(kāi)源了推理代碼，但模型的訓(xùn)練技術(shù)才是核心競(jìng)爭(zhēng)力。在資源比較匱乏的情況下，深勢(shì)科技團(tuán)隊(duì)在較短時(shí)間內(nèi)實(shí)現(xiàn)模型訓(xùn)練、開(kāi)源訓(xùn)練代碼，這是很不容易的。深勢(shì)科技在物理模型方面具備豐富的經(jīng)驗(yàn)，Uni-Fold進(jìn)一步彌補(bǔ)了團(tuán)隊(duì)在數(shù)據(jù)驅(qū)動(dòng)方面的短板。下一步，物理模型和數(shù)據(jù)驅(qū)動(dòng)結(jié)合的解決方案將為蛋白結(jié)構(gòu)和藥物設(shè)計(jì)行業(yè)提供更好的基礎(chǔ)。”

深勢(shì)科技也對(duì)Uni-Fold進(jìn)行了進(jìn)一步的開(kāi)發(fā)和優(yōu)化，集成于旗下自主研發(fā)的一站式計(jì)算輔助藥物設(shè)計(jì)平臺(tái)Hermite中，供用戶(hù)使用。Hermite是根植于云計(jì)算的臨床前藥物設(shè)計(jì)全流程計(jì)算平臺(tái)，致力于為藥物科研工作者提供數(shù)據(jù)、算法、算力三位一體的一站式解決方案。在Uni-Fold前，Hermite上已集成多個(gè)重量級(jí)功能。例如基于Uni-Fold等方法得到蛋白結(jié)構(gòu)后進(jìn)行蛋白的動(dòng)力學(xué)模擬、結(jié)構(gòu)精修或環(huán)區(qū)優(yōu)化的RiD模塊；在藥物優(yōu)化階段比較不同分子與蛋白靶點(diǎn)結(jié)合活性差別的Uni-FEP模塊，等等。

圖2 Uni-Fold在深勢(shì)科技Hermite藥物設(shè)計(jì)平臺(tái)上的使用

在藥物設(shè)計(jì)領(lǐng)域，結(jié)合Uni-Fold、RiD等AI輔助計(jì)算模擬的算法，以及算法與冷凍電鏡等實(shí)驗(yàn)手段的結(jié)合，深勢(shì)科技正在打造出一套模擬—AI—實(shí)驗(yàn)三者驅(qū)動(dòng)的解決方案，賦能藥物設(shè)計(jì)行業(yè)，加速?gòu)臉I(yè)者的藥物研發(fā)進(jìn)程。

芝加哥豐田計(jì)算技術(shù)研究所的許錦波教授主攻機(jī)器學(xué)習(xí)、優(yōu)化方法和計(jì)算生物學(xué)，也是深度學(xué)習(xí)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的先驅(qū)。他評(píng)價(jià)道：“針對(duì)AlphaFold未公開(kāi)訓(xùn)練代碼的局限性，深勢(shì)科技敢于打破現(xiàn)狀，率先公布訓(xùn)練代碼。Uni-Fold的出現(xiàn)，讓每個(gè)研究者都可以訓(xùn)練自己的模型。這無(wú)疑將進(jìn)一步推動(dòng)技術(shù)的發(fā)展。對(duì)整個(gè)蛋白質(zhì)折疊領(lǐng)域來(lái)說(shuō)，都是令人激動(dòng)的消息。”

免責(zé)聲明：市場(chǎng)有風(fēng)險(xiǎn)，選擇需謹(jǐn)慎！此文僅供參考，不作買(mǎi)賣(mài)依據(jù)。

關(guān)鍵詞：

您可能也感興趣:

今日熱點(diǎn)

黑龍江科技招商大會(huì)大慶專(zhuān)場(chǎng)舉行推動(dòng)科技成果落地轉(zhuǎn)化

上海：去年科技信貸授信規(guī)模1583億元，科技保險(xiǎn)助力科研穩(wěn)發(fā)展

蘭州新區(qū)科創(chuàng)能力大幅提升新培育科技型企業(yè)160家

更多

更多

排行

最近更新

今日要聞

關(guān)于本站管理團(tuán)隊(duì) 版權(quán)申明網(wǎng)站地圖聯(lián)系合作招聘信息

Copyright © 2005-2018 創(chuàng)投網(wǎng) - www.mallikadua.com All rights reserved
聯(lián)系我們:33 92 950@qq.com
豫ICP備2020035879號(hào)-12