腾讯混元OCR模型宣布开源:参数量1B 支持14种小语种翻译
11月25日,腾讯混元于11月25日推出开源OCR模型HunyuanOCR,该模型参数量为1B,基于混元原生多模态架构构建,在多项OCR应用评测中取得当前最优效果。

该模型采用端到端训练推理范式,通过单次前向推理即可完成多项任务,相比传统级联方案更具效率优势。其架构由原生分辨率视频编码器、自适应视觉适配器与轻量化语言模型三部分组成。
在性能方面,HunyuanOCR在复杂文档解析评测OmniDocBench中获得94.1分,超过谷歌Gemini3-pro等模型;在涵盖文档、街景、手写等九大场景的测试集上,其文字检测与识别能力领先同类开源及商业模型。同时,该模型支持14种小语种翻译,并在ICDAR2025文档翻译比赛中获得小模型赛道冠军。
目前该模型已应用于票据字段抽取、视频字幕识别及拍照翻译等场景,并正式对外开放源代码。
特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1024程序员节京东开放“零帧起手”数字人技术
- 小鹏汽车携手华为,小鹏X9超级增程全球首发华为DriveONE下一代增程发电机
- OpenAI计划下周发布GPT-5.2应对谷歌竞争
- 华为李小龙:BT.2020因过于先进无法显示,直到Mate 80 RS上市
- 小米两大旗舰新机销量曝光:17系列累计超244万台
- 智惠低空 l 历正科技荣膺中国电信“2025年度杰出合作伙伴”称号
- 华为亮相2025数智科技生态大会,以全场景智慧生态“领航”数智新未来
- 聚焦新质生产力系列十一:5G-A赋能无人机“接棒”挑山工
- 留几手征婚要求女方是富婆
- 全国首艘氢电拖轮作业亮点多
- 哈尔滨采冰人零下20度开工
- 梁文锋入选《自然》年度十大科学人物
- 男子钓鱼偶遇“矜持”白鹭
- 美股三大指数集体收跌 特斯拉跌超3%
- 银行网点正消失:今年超9000家关停
- 经典版QQ宣布回归
- “人造太阳”何以照进现实
- 澎湃OS进展通报引热议:十个问题,为何仅修复一项?
- 更多全黑 Vision Pro 原型零件在网上曝光
- 小米智能门锁销量连续5年中国第一!出货量突破800万