智源最新评测:豆包视觉理解模型排名全球第二
12月19日,智源最新智源研究院发布最新一期大模型综合及专项评测结果。评测排名在覆盖国内外100余个开源和商业闭源大模型的豆包第评测中,豆包通用模型pro获得大语言模型主观评测最高分;在多模态模型评测中,视觉豆包视觉理解模型排名视觉语言模型第二,理解成绩仅次于GPT-4o;豆包文生图模型、模型豆包视频生成模型(即梦P2.0 pro)也分别在相应测试中获得全球第二。全球
据智源研究院介绍,智源最新大模型评测平台FlagEval联合了全国10余家高校和机构合作共建。评测排名此次公布的豆包第榜单中,大语言模型主观评测重点考察的视觉是模型的中文能力,多模态模型评测榜单中,理解视觉语言模型主要考察的模型是模型在图文理解、长尾视觉知识、全球文字识别以及复杂图文数据分析能力。智源最新FlagEval大模型角斗场则是向用户开放的模型对战评测服务,反映了用户对模型的偏好。
在大语言模型主观评测中,豆包通用模型pro的知识运用和推理能力均获得最高分,简单理解、数学能力、安全等项目也排名前三,最终综合成绩排名第一。在FlagEval大模型角斗场榜单中,基于模型对战的用户投票结果,豆包通用模型pro得分排名第二,仅次于OpenAI的o1-mini。
在多模态模型评测榜单中,GPT-4o在视觉语言模型中排名第一,豆包视觉理解模型获第二。在中文的通用知识、文字识别中,豆包表现突出,相比国外模型有较大优势。在文生图测试中,混元和豆包排名前两位;在文生视频测试中,国产模型更是优势显著,可灵1.5高品质版、即梦P2.0 pro、爱诗科技PixVerse v3和海螺AI排名前列。
据悉,豆包视觉理解模型在不久前的火山引擎Force大会上首次发布,现已对企业客户开放使用。火山引擎方面表示,豆包大模型通过算法、工程、软硬件结合的技术创新,大幅优化使用成本,让每一家企业都能用得起,推动AI技术普惠和应用发展。
相关文章
[流言板]美媒:科、欧、杜、哈、乔约,谁是历史上最强的单打球员
[流言板]美媒:科、欧、杜、哈、乔约,谁是历史上最强的单打球员由篮球资讯发表在篮球资讯 50209月21日讯 美媒ClutchPoints分享动态:NBA历史上最强的单打球员是谁?科比、乔-约翰逊、欧2024-12-26- 12月11日讯欧冠联赛阶段第6轮,利物浦1-0击败赫罗纳,欧冠6连胜领跑。赛后,著名解说詹俊评论道:“一场低耗能的胜利。尽管比赛不好看、努涅斯的低效和后防线上的戈麦斯继续令人不安,但阿利森的复出与表现2024-12-26
- 12月13日消息,昨日,理想汽车首个高强韧不锈钢钢卷在青拓集团顺利下线,理想汽车-青拓集团-尼威动力-宏旺集团联合举行了自研高强韧不锈钢材料UFHS的首发仪式。据介绍,该自研不锈钢强度比传统不锈钢提升2024-12-26
中国智驾大洗牌 关海涛发文:极氪明年大动作、有关L3自动驾驶
12月13日消息,很长一段时间以来,极氪给人的印象就是机械素质顶级、驾控能力强悍、安全能力一流,不过智能驾驶是一块短板,跟不上国内第一梯队的玩家。极氪显然明白自己的缺陷,今年以来疯狂补习,8月份更是壮2024-12-26TGA 2024:《双截龙再临》宣布2025年10月23日发售
在刚刚的2024 TGA颁奖典礼上,《双截龙再临》公布了全新预告,并宣布游戏将于2025年10月23日发售,登陆PS5、PS4、Xbox Series X|S、Xbox One和Steam,游戏预购现2024-12-26- 12月13日消息,今天中午,TGA2024的年度最佳游戏正式揭晓,国产游戏《黑神话:悟空》惜败。最终的获奖者让很多玩家意外——《宇宙机器人》。这是一款索尼亲由Team ASOB2024-12-26
最新评论