DeepSeek 发布 OCR-2 光学字符识别模型

DeepSeek_发布_OCR-2_光学字符识别模型图1
DeepSeek 发布 OCR-2 光学字符识别模型

DeepSeek 在 Hugging Face 平台发布 DeepSeek-OCR-2 光学字符识别模型。该模型支持动态分辨率处理，默认配置为 (0-6)×768×768 + 1×1024×1024 分辨率，可处理文档转换、图像 OCR、图表解析等多种任务。

模型基于 transformers 框架，支持 NVIDIA GPU 推理，要求 Python 3.12.9 和 CUDA 11.8 环境。用户可通过不同提示词实现文档转 Markdown、图像 OCR、图表解析等功能。项目在 GitHub 提供了模型推理加速和 PDF 处理的详细指导。

附件内容

Huggingface

本站提供的一切软件、教程和内容信息仅限用于学习和研究目的；不得将上述内容用于商业或者非法用途。本站所有信息均来自网络，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑或手机中彻底删除上述内容。如果您喜欢该程序，请支持正版，购买注册，得到更好的正版服务。如有侵权不妥之处请致信 E-mail：admin@kongyu.xin 我们会积极处理。敬请谅解

THE END

DeepSeek 发布 OCR-2 光学字符识别模型

请登录后发表评论