快科技3月30日消息,中文大模型基准测评SuperCLUE发布2026年3月最新结果,22款国内外主流模型参与角逐。
字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分拿下国内第一,成功跻身全球第一梯队;小米集团的MiMo-V2系列两款模型均顺利上榜。
本次测评覆盖数学推理、科学推理、代码生成等六大核心任务,全面检验模型综合能力。海外闭源模型依旧占据总分前列,Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。
豆包则紧随其后,总分仅与GPT-5.4相差0.95分,实现全方位追赶,在智能体任务规划维度更是反超部分海外模型,跻身全球前五。
小米此次有两款模型入选测评榜单,其中MiMo-V2-Pro以60.67分位列闭源模型前列,在数学推理任务中取得84.03分的亮眼成绩;开源版本MiMo-V2-Flash虽以49.97分排名靠后,但在代码生成等细分场景中表现出一定潜力。
测评还显示,国产模型整体表现亮眼,开源赛道尤为突出,Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜前三,大幅领先海外同类模型。
元股证券:ygzq.hk
【本文结束】如需转载请务必注明出处:快科技
责任编辑:随心涨跌幅限制
文章内容举报配资网站
]article_adlist-->
声明:新浪网独家稿件,未经授权禁止转载。 -->

汇通财经APP讯——中东局势再度紧张成为近期全球市场波动的核心驱动因素。伊朗宣布重新关闭霍尔木兹海峡,使这一全球最关键的
2026-04-21
配资炒股 炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会! 来源:国资小新 小新说 习近平总书记
2026-03-20
美国与伊朗冲突进一步升级的风险令交易员保持谨慎,市场已再度笃定欧洲央行将进行三次、每次25个基点的加息;相比之下,上周四
2026-04-08
配资网站 今天是世界地球日。日前,“我们的力量,我们的地球——2026地球合伙人领导力峰会”在上海举行。围绕生物多样性保
2026-04-23
汇通财经APP讯——美国总统特朗普于周日(4月12日)下令对霍尔木兹海峡实施海军封锁,这一举措令中东冲突快速结束的希望大
2026-04-15