DeepSeek发布OCR新模型 压缩比20倍仍保持60%精度
AI导读:
DeepSeek发布新模型DeepSeek-OCR,在压缩比小于10倍时解码精度达97%,20倍压缩比下仍保持60%准确率,为长文本压缩和大语言模型优化提供技术突破。
新京报贝壳财经讯(记者罗亦丹)北京时间10月20日,Deepseek(深度求索)在开源社区Hugging Face上发布了新模型DeepSeek-OCR。据了解,OCR(Optical Character Recognition,文字识别)模型是一种高效技术,主要用于从图像中精准提取文本信息,在数据自动化处理领域展现巨大潜力。

DeepSeek还上传了与该模型相关的论文,在论文中,DeepSeek-OCR被描述为是“一项关于通过光学二维映射来压缩长上下文可行性的初步研究。”实验表明,当文本标记数量在视觉标记数量的10倍以内时(即压缩比 < 10倍),该模型可以达到97%的解码(OCR)精度。即使在20倍压缩比下,OCR 准确率仍能保持在约60%的水平。该技术突破为长文本压缩、大语言模型记忆优化等前沿领域提供了关键支撑,预示着人工智能在复杂信息处理方面将迎来新的发展阶段。
(文章来源:新京报)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

