智源最新评测：豆包视觉理解模型排名全球第二

发布时间：2024-12-26 10:14:23 作者：玩站小弟

12月19日，智源研究院发布最新一期大模型综合及专项评测结果。在覆盖国内外100余个开源和商业闭源大模型的评测中，豆包通用模型pro获得大语言模型主观评测最高分；在多模态模型评测中，豆包视觉理解模型排。

12月19日，智源最新智源研究院发布最新一期大模型综合及专项评测结果。评测排名在覆盖国内外100余个开源和商业闭源大模型的豆包第评测中，豆包通用模型pro获得大语言模型主观评测最高分；在多模态模型评测中，视觉豆包视觉理解模型排名视觉语言模型第二，理解成绩仅次于GPT-4o；豆包文生图模型、模型豆包视频生成模型（即梦P2.0 pro）也分别在相应测试中获得全球第二。全球

据智源研究院介绍，智源最新大模型评测平台FlagEval联合了全国10余家高校和机构合作共建。评测排名此次公布的豆包第榜单中，大语言模型主观评测重点考察的视觉是模型的中文能力，多模态模型评测榜单中，理解视觉语言模型主要考察的模型是模型在图文理解、长尾视觉知识、全球文字识别以及复杂图文数据分析能力。智源最新FlagEval大模型角斗场则是向用户开放的模型对战评测服务，反映了用户对模型的偏好。

在大语言模型主观评测中，豆包通用模型pro的知识运用和推理能力均获得最高分，简单理解、数学能力、安全等项目也排名前三，最终综合成绩排名第一。在FlagEval大模型角斗场榜单中，基于模型对战的用户投票结果，豆包通用模型pro得分排名第二，仅次于OpenAI的o1-mini。

在多模态模型评测榜单中，GPT-4o在视觉语言模型中排名第一，豆包视觉理解模型获第二。在中文的通用知识、文字识别中，豆包表现突出，相比国外模型有较大优势。在文生图测试中，混元和豆包排名前两位；在文生视频测试中，国产模型更是优势显著，可灵1.5高品质版、即梦P2.0 pro、爱诗科技PixVerse v3和海螺AI排名前列。

据悉，豆包视觉理解模型在不久前的火山引擎Force大会上首次发布，现已对企业客户开放使用。火山引擎方面表示，豆包大模型通过算法、工程、软硬件结合的技术创新，大幅优化使用成本，让每一家企业都能用得起，推动AI技术普惠和应用发展。

Tag：

[流言板]美媒：科、欧、杜、哈、乔约，谁是历史上最强的单打球员
[流言板]美媒：科、欧、杜、哈、乔约，谁是历史上最强的单打球员由篮球资讯发表在篮球资讯 50209月21日讯美媒ClutchPoints分享动态：NBA历史上最强的单打球员是谁？科比、乔-约翰逊、欧
2024-12-26
詹俊：阿利森的复出与表现是亮点这个家不能没有萨拉赫！
12月11日讯欧冠联赛阶段第6轮，利物浦1-0击败赫罗纳，欧冠6连胜领跑。赛后，著名解说詹俊评论道：“一场低耗能的胜利。尽管比赛不好看、努涅斯的低效和后防线上的戈麦斯继续令人不安，但阿利森的复出与表现
2024-12-26
理想汽车自研了高压油箱不锈钢
12月13日消息，昨日，理想汽车首个高强韧不锈钢钢卷在青拓集团顺利下线，理想汽车-青拓集团-尼威动力-宏旺集团联合举行了自研高强韧不锈钢材料UFHS的首发仪式。据介绍，该自研不锈钢强度比传统不锈钢提升
2024-12-26
中国智驾大洗牌关海涛发文：极氪明年大动作、有关L3自动驾驶
12月13日消息，很长一段时间以来，极氪给人的印象就是机械素质顶级、驾控能力强悍、安全能力一流，不过智能驾驶是一块短板，跟不上国内第一梯队的玩家。极氪显然明白自己的缺陷，今年以来疯狂补习，8月份更是壮
2024-12-26
TGA 2024：《双截龙再临》宣布2025年10月23日发售
在刚刚的2024 TGA颁奖典礼上，《双截龙再临》公布了全新预告，并宣布游戏将于2025年10月23日发售，登陆PS5、PS4、Xbox Series X|S、Xbox One和Steam，游戏预购现
2024-12-26
《黑神话：悟空》输给了《宇宙机器人》：Epic发灵魂问号
12月13日消息，今天中午，TGA2024的年度最佳游戏正式揭晓，国产游戏《黑神话：悟空》惜败。最终的获奖者让很多玩家意外——《宇宙机器人》。这是一款索尼亲由Team ASOB
2024-12-26