AI导读:

美国研究人员开发出名为“通用表达转换器”(GET)的新人工智能模型,能精确预测各种人体细胞内部的基因表达情况,为生物和医学研究带来便利,其准确性和有效性已得到实验验证。

近期,美国研究人员在人工智能领域取得了新突破,成功开发出一个名为“通用表达转换器”(GET)的人工智能模型。该模型在经过大量人体细胞基因测序和表达数据的训练后,展现出了精确预测各种人体细胞内部基因表达情况的能力,为生物和医学研究开辟了新的道路。

这一创新成果由哥伦比亚大学和卡内基-梅隆大学等机构的研究人员联合研发,其准确性和有效性已在实验中得到了验证,相关论文已在英国《自然》杂志上发表。GET模型的诞生,标志着人工智能技术在基因表达预测领域迈出了重要一步。

基因表达是生物体内的一个复杂过程,其中DNA形式的基因“蓝图”被转录成RNA形式的“抄本”,进而指导蛋白质的合成,执行具体的生理功能。然而,由于参与转录调控的生物分子种类繁多且相互作用复杂,此前的预测模型往往局限于几种特定的细胞类型,尤其是癌细胞,缺乏适用于人体多种细胞类型的通用工具。

为了克服这一难题,研究人员根据转录调控机制的特点,精心设计了GET机器学习模型。他们利用来自1.3万个人体细胞的基因测序和表达数据对模型进行训练,这些细胞涵盖了213种人类胚胎细胞和成体细胞,均来自健康的正常人体组织。通过训练,GET模型能够从这些数据中总结出关于转录调控的“语法”,进而对未接触过的细胞类型进行基因表达预测。

GET模型的应用前景广阔。它不仅可以用于揭示致病基因的作用机制,指导癌症和遗传疾病的研究,还可以帮助科学家们探寻基因组中“暗物质”的作用。据研究人员介绍,蛋白质编码基因序列只占人类基因组的一小部分,而占比高达98%的非编码区域则像宇宙中的暗物质一样,其属性和功能目前仍难以捉摸。GET模型的诞生,为科学家们提供了一种新的工具和方法,有助于揭示这些未知领域的奥秘。

(文章来源:经济参考报,作者:辛华)

研究图示