百亿参数Genos基因组模型发布,引领基因研究新时代
AI导读:
百亿参数人类基因组通用基础模型“Genos”在浙江杭州发布,推动基因组研究迈向智能分析时代,助力临床疾病诊断和个人基因组解读,该模型将全面开源开放,提供不同参数版本。
百亿参数人类基因组通用基础模型“Genos”23日在浙江杭州召开的第二十届国际基因组学大会上正式发布,这一发布标志着基因组研究迈入新阶段,基因分析、基因组研究成为新热点。
Genos基础模型相关论文已于22日晚发表于生物学领域国际期刊《大数据科学》(GigaScience)上。记者了解到,在该基础模型支持下,基因组研究迈向智能分析的时代,推动临床疾病诊断、个人基因组解读及前沿科学研究实现突破,助力人类加速读懂“生命天书”,基因研究效率大幅提升。
该基础模型由杭州华大生命科学研究院与之江实验室联合研发完成。杭州华大生命科学研究院院长刘龙奇表示,基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos基础模型则系统整合了多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少“数据偏见”,更全面地代表人类遗传多样性,为基因研究提供坚实基础。
目前,在科研领域,Genos基础模型能仅凭DNA序列“秒级”预测RNA表达谱,极大提升了生物信息分析流程的速度。在直接面向临床应用的致病性突变解读任务中,Genos基础模型达到了92%的准确性,结合之江实验室021科学基础模型后,准确率能够进一步提升至98.3%,为临床诊断提供了高效工具,凸显基因模型应用价值。
据介绍,为进一步促进全球科研合作,Genos基础模型将全面开源开放,同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程均已公开发布。
(文章来源:新华网)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

