AI导读:

美国研究人员开发出名为“通用表达转换器”(GET)的新AI模型,能精确预测各种人体细胞内部的基因表达情况,为生物和医学研究带来便利,相关研究成果已发表在《自然》杂志上。

  新华社纽约1月11日电,一项来自美国的科研突破正在改变生物和医学研究的面貌。美国研究人员成功开发出一个名为“通用表达转换器”(GET)的新人工智能模型,该模型经过大量人体细胞基因数据的训练,能够精确预测各种人体细胞内部的基因表达情况,为相关领域的研究提供了前所未有的便利。

  GET模型由美国哥伦比亚大学和卡内基-梅隆大学等机构的研究人员携手打造,其准确性和有效性已在实验中得到了验证,相关研究成果已发表在英国《自然》杂志上。这一创新性的模型有望为生物和医学研究开辟新的道路。

  在基因表达这一复杂过程中,DNA形式的基因“蓝图”被转录成RNA形式的“抄本”,进而指导蛋白质的合成,执行具体的生理功能。然而,由于参与转录调控的生物分子种类繁多且相互作用复杂,此前相关预测模型大多局限于几种特定的细胞类型,尤其是癌细胞,缺乏适用于人体多种细胞类型的通用工具。GET模型的出现填补了这一空白。

  研究人员根据转录调控机制的特点,巧妙地设计出机器学习模型,并利用来自1.3万个人体细胞的基因测序和表达数据对其进行训练。这些细胞涵盖了213种人类胚胎细胞和成体细胞,均来自没有病变的正常人体组织。通过这一训练过程,GET模型能够总结出关于转录调控的“语法”,从而对其未接触过的细胞类型进行基因表达预测。

  GET模型的应用前景广阔。它不仅可以用于揭示致病基因的作用机制,指导癌症和遗传疾病的研究,还可以用于探寻基因组中“暗物质”的作用。蛋白质编码基因序列仅占人类基因组的一小部分,而占比高达98%的非编码区域则像宇宙中的暗物质一样神秘莫测。GET模型有望为我们揭开这些“暗物质”的面纱。

  这一科研成果的发布标志着人工智能技术在生物和医学研究领域的又一重要进展。随着技术的不断进步和应用领域的不断拓展,我们有理由相信GET模型将在未来发挥更加重要的作用。

(文章来源:新华社)