AI导读:

DeepSeek发布新模型DeepSeek-OCR,在压缩比小于10倍时解码精度达97%,20倍压缩比下仍保持60%准确率,为长文本压缩和大语言模型优化提供技术突破。

  新京报贝壳财经讯(记者罗亦丹)北京时间10月20日,Deepseek(深度求索)在开源社区Hugging Face上发布了新模型DeepSeek-OCR。据了解,OCR(Optical Character Recognition,文字识别)模型是一种高效技术,主要用于从图像中精准提取文本信息,在数据自动化处理领域展现巨大潜力。

  DeepSeek还上传了与该模型相关的论文,在论文中,DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明,当文本标记数量在视觉标记数量的10倍以内时(即压缩比 < 10倍),该模型可以达到97%的解码(OCR)精度。即使在20倍压缩比下,OCR 准确率仍能保持在约60%的水平。该技术突破为长文本压缩、大语言模型记忆优化等前沿领域提供了关键支撑,预示着人工智能在复杂信息处理方面将迎来新的发展阶段。

 

(文章来源:新京报)