記者8月27日從中國(guó)農(nóng)業(yè)科學(xué)院獲悉,該院農(nóng)業(yè)基因組研究所農(nóng)業(yè)基因編輯技術(shù)研發(fā)與應(yīng)用創(chuàng)新團(tuán)隊(duì)構(gòu)建了全球規(guī)模最大的實(shí)驗(yàn)驗(yàn)證數(shù)據(jù)集,并基于此開發(fā)出人工智能(AI)大模型AlphaCD。該模型不僅能高效預(yù)測(cè)超過(guò)2萬(wàn)余種胞嘧啶脫氨酶的酶活特征,還能設(shè)計(jì)出新型高性能堿基編輯工具。相關(guān)成果日前發(fā)表于國(guó)際期刊《細(xì)胞研究》。
胞嘧啶堿基編輯器是一種基因編輯工具,廣泛應(yīng)用于疾病治療、動(dòng)植物育種等研究領(lǐng)域。“但傳統(tǒng)胞嘧啶堿基編輯器研發(fā)依賴大量試錯(cuò)實(shí)驗(yàn),成本高、周期長(zhǎng),且難以系統(tǒng)優(yōu)化酶活特征。”論文通訊作者、中國(guó)農(nóng)業(yè)科學(xué)院農(nóng)業(yè)基因組研究所研究員左二偉說(shuō)。
基于該數(shù)據(jù)庫(kù),團(tuán)隊(duì)整合蛋白質(zhì)序列、三維結(jié)構(gòu)、理化性質(zhì)等多模態(tài)數(shù)據(jù),開發(fā)出AlphaCD。經(jīng)嚴(yán)格驗(yàn)證,AlphaCD在預(yù)測(cè)胞嘧啶脫氨酶催化效率、脫靶活性、靶向窗口及基序偏好等關(guān)鍵指標(biāo)時(shí),準(zhǔn)確性顯著優(yōu)于傳統(tǒng)方法。