AI导读:

2025年人工智能发展呈现多模态和广泛行业应用两大特点。国产GPU性能提升但生态兼容性不足,全国已有3万余家企业投入研发。大模型训练依赖国产和英伟达GPU,面临价格高涨和供应短缺问题。郑纬民院士建议优化开发者体验和提升硬件性能,构建国产系统基础软件。

  中新网北京5月19日电(记者吴涛)“2025年人工智能发展呈现两大显著特点:第一个是多模态,大模型已具备处理文字、图像、视频的综合能力;第二个就是人工智能正加速渗透至与GDP密切相关的各行各业,中国在推动AI技术落地应用方面具有显著优势。”

  在近日举行的2025搜狐科技年度论坛上,清华大学计算机系教授、中国工程院院士郑纬民指出,当前国产GPU性能虽逐步提升,但核心障碍在于生态兼容性不足,不过“好消息是全国已有超过3万家企业积极投入研发,努力打破这一瓶颈”。

  “当前大模型训练主要依赖于两类系统,除了国产GPU外,还有英伟达的GPU,尽管其硬件性能与生态成熟度领先,但高昂的价格和供应短缺问题日益凸显。”

  针对此,郑纬民院士建议从两方面寻求突破:一方面,通过优化开发者体验,降低学习成本,利用习惯迁移重塑生态;另一方面,持续加大投入,提升国产GPU硬件性能,即便起步晚、进程难,但只要性能基本达标,并辅以生态优化,仍可吸引并留住用户。

  “因此,构建国产系统的基础软件至关重要,需集中资源,打造一批核心软件。”郑纬民院士进一步建议,例如,可以先重点研发并推出10款具有广泛影响力的软件。

  在大模型领域,他强调,可通过微调技术,专门训练一批好用的垂类大模型,以加速生态建设。郑纬民指出,在基础大模型的基础上,利用金融领域的数据进行二次训练,即可得到一个高效的金融大模型。这种模型微调技术,实际上就是在基础大模型的基础上,针对某一特定领域的数据进行第二次训练,从而得到该领域的大模型。

(文章来源:中国新闻网)