66安卓网:绿色免费的软件下载站! 手机游戏| 街机游戏| 新游| 人气手游| 最新更新

百度力压谷歌!PaddleOCR登顶GitHubOCR项目榜首,中国开源迎来里程碑时刻

来源: 66安卓网 日期:2026-05-02 10:57:07
首页热门资讯软件教程 → 百度力压谷歌!PaddleOCR登顶GitHubOCR项目榜首,中国开源迎来里程碑时刻

近日,百度文心的衍生模型PaddleOCR在GitHub平台上的Star数量已突破73.3K,这是它首次超越谷歌旗下的开源OCR标杆产品Tesseract OCR(其Star数为73.2K),从而成为全球范围内Star数最高的OCR项目。

Tesseract OCR于1985年诞生,最初由惠普实验室开发,2005年开源后转由Google负责维护与持续更新,作为OCR领域近四十年的技术典范,长期在GitHub OCR项目的Star数量排名中占据首位。

此次PaddleOCR实现超越,意味着这一行业标杆正被新一代技术体系重塑,同时也是大模型推动下,中国开源项目在OCR领域首次赶超谷歌主导的标杆产品。

PaddleOCR依托文心大模型训练而成,是文心大模型多模态能力体系的关键构成,可支持超100种语言的识别,用户群体遍及160个国家与地区。1月29日,全新一代文档解析模型PaddleOCR-VL-1.5在OmniDocBench V1.5榜单上斩获了全球SOTA成果。

近年来,大模型已成为推动OCR赛道增长的关键力量。据Star History数据显示,PaddleOCR在GitHub上的Star数量自2024年起出现爆发式增长。进入2025年,OCR更是成为各大模型厂商重点布局的领域,DeepseekOCR、HunyuanOCR、GLM OCR等一系列产品陆续推出。

此外,PaddleOCR同步升级了服务能力:官网免费每日解析页数从1万增加到2万,用户还能通过OpenClaw直接调用PaddleOCR Skill,免费获得高精度PDF解析能力。

与此同时,PaddleOCR OCEAN生态联盟宣告正式成立,该联盟面向核心开源贡献者、深度企业用户以及全球平台伙伴开放合作,首批成员涵盖Hugging Face、Dify、RAGFlow、Cherry Studio、Milvus等全球平台伙伴,各方将携手促进OCR技术在更多元场景中的应用与落地。

ps.OCR(Optical Character Recognition,光学字符识别)这项技术,是借助扫描仪、摄像头等光学设备来捕捉图像里的文本信息,接着运用计算机算法把这些信息转换成能够编辑、检索和分析的数字文本。通俗地讲,它的作用就是让计算机能够识别并理解图像中的文字,从而完成“图像文本→数字文本”的准确转换。

相关资讯
相关下载
游戏攻略
更多+