大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三
12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。
谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。
此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。
榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。
百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。
国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。

特别声明:以上内容(如有图片或视频亦包括在内)为“我要久久发用户上传并发布”,本平台仅提供信息存储服务。
热门文章
- 1000个官方媒体网站发布广告,每天百万人次曝光,帮您客户覆盖全国,业绩翻倍!
- 终于看到霉豆腐的“前半生”了
- 现身说法!2026年农村老房子如何改造?空气能大受欢迎
- 越来越多的家庭,开始放弃淋浴房了,现在年轻人流行这样装!
- 仅次于印度小叶紫檀的高端木材,质感温润,非常上档次
- 揭示厨房装饰中常见的五大误区,别再犯了!
- 年轻人的“反骨装修”:明装线管!就是要工业风,虽然贵,但酷到没朋友!
- 居然之家马来西亚公司与Senheng签约 共拓马来西亚家居零售新格局
- 预算有限?高性价比现代风全屋定制,颜值与实用并存
- 2026考研成绩&国家线公布时间!(附历年国家线趋势图)
- 评论丨教师期末“负担”与总结活动“初衷”,如何不再错位?
- “取消中考选拔功能,全员升普高”?看这座海岛县城如何跳出“一考定音”
- 关于北京楼真相的40组数据丨数据周报
- 现房启幕|金隅·望京云尚【启元】入市 兑现“第二CBD”高阶生活
- 热点作文素材 | 语文考试救急!连夜为儿子准备的热点素材,娃直呼管用
- 装修插座布局最容易遗漏!这10个位置装了才知道多香
- 24岁男生的40㎡“单间”火了:自己睡客厅,卧室改成“电竞房”!
- 装修翻车能有多离谱?看完这些奇葩设计,我庆幸自己没钱
- 全球每3把转椅就有1把来自这里:浙江安吉,这个产业年入几百亿
- 避开吊顶 / 选灯 / 布线 3 大雷区,无主灯装完不显压抑还实用