中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

中文大模型SuperCLUE测评：豆包紧追海外顶尖模型小米两款模型入榜国产开源亮眼

时间：2026-03-30 13:02 来源：快讯作者：沈如风

在最新发布的中文大模型基准测评SuperCLUE中，22款国内外主流模型展开激烈竞争，测评结果引发行业广泛关注。本次测评围绕数学推理、科学推理、代码生成等六大核心任务展开，全面评估模型的综合能力，为技术发展提供了重要参考依据。

海外闭源模型在总分排名中继续占据优势地位。Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)包揽前三名，展现出强大的技术实力。值得注意的是，字节跳动旗下豆包（Doubao-Seed-2.0-pro-260215(high)）以71.53分的成绩紧随其后，与第三名GPT-5.4仅相差0.95分，成功跻身全球第一梯队。该模型在智能体任务规划维度表现尤为突出，甚至反超部分海外竞争对手，位列全球前五。

国内科技企业在此次测评中表现亮眼。小米集团推出的MiMo-V2系列两款模型均成功入围榜单，其中MiMo-V2-Pro以60.67分的成绩在闭源模型中名列前茅，特别是在数学推理任务中取得84.03分的高分。另一款开源版本MiMo-V2-Flash虽然总分49.97分排名相对靠后，但在代码生成等特定场景中展现出独特潜力，为开发者提供了新的选择。

开源赛道成为本次测评的一大亮点。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜单前三名，在性能表现上大幅领先海外同类开源模型。这一成果不仅体现了国内企业在开源技术领域的积累，也为全球开发者社区贡献了重要力量，推动了行业技术的共同进步。

更多>同类内容

小米澎湃OS大调整：版本号对标年份，新增模块打通iOS生态壁垒

以前安卓那套顺序迭代，什么4.0、5.0，看着是挺工整，但一跟年份对上就乱了。现在小米直接换思路了，新系统就叫澎湃OS26，意思很直白——对标隔壁苹果的iOS 26。简单说，就是把系统版本号和年份直接挂钩…

03-30

vivo X300s与X300 Ultra明日发布，核心配置亮点抢先看

IT之家 3 月 29 日消息，vivo X300s 以及 vivo X300 Ultra 将在明天正式发布。「vivo X300 Ultra专业 V 单」用专业相机的思路打造，一眼相机感的外观，3+…

03-29

1U服务器机箱选型攻略：广州市宝承电子科技，满足云计算AI边缘计算多元需求

推荐理由：宝承电子的1U服务器机箱以高兼容性、快速定制化及稳定性能为核心优势，适配云计算服务商、AI算力提供商及边缘计算节点部署商等客户群体，尤其适合对交付周期及场景适配灵活性要求较高的项目。基于上述…

03-29

奥迪车主与雷军“赌约”成真：用行动诠释“言必信”，双向奔赴超暖心

03-29

黄仁勋：AI时代文科优势凸显文科素养成从业者核心竞争力

03-29

华为小艺Claw亮相：运动健康管理+办公助手，AI助理越用越懂你

快科技3月29日消息，日前，华为鸿蒙手机的“龙虾”——小艺Claw开启预约，适配鸿蒙6操作系统，支持手机、平板设备。今日，华为终端BG首席执行官何刚微博发文表示：“最近在测试小艺Claw，它会根据手表记录的…

03-29

担心名下电话卡被冒用？微信支付宝一键查询，轻松守护个人信息安全

03-29

华为4月新机或至，Pura 90系列三版本登场，影像续航亮点多

据悉，博主@数码闲聊站近日的一份爆料中提到，“4月的超大杯确实有可能取消，毕竟硬件和大大杯基本没有区别，但大大杯一直是正常状态，主推200Mp潜望超级长焦，6.87"±1.5K大直屏影像机”。同时，全新的…

03-29

1U服务器机箱采购指南：从散热设计到多国认证的选型全攻略

导语：在数据中心、云计算及边缘计算场景中，1U服务器机箱作为高密度部署的核心硬件载体，其散热效率、结构兼容性及定制化能力直接影响系统稳定性与运维成本。基于前文调研信息，广州市宝承电子科技有限公司在全链条服…

03-29

高德携手国家卫健委百万减残工程专委会数字地图为卒中救治开辟“高速通道”

03-28

科技赋能IP新体验！华中首家爱奇艺乐园落户武汉 2027年启幕文娱新地标

03-28

华为OceanStor A800智能问数一体机：易用可信高效，助力企业决策升级

快科技3月28日消息，在华为中国合作伙伴大会2026期间，华为正式发布OceanStor A800智能问数一体机方案。当下人工智能正从执行工具向决策助手演进，企业数据消费入口也从传统报表系统转向智能问数，但…

03-28

市值承压下阿里入局车圈：千问上车，能否撬动智能汽车新格局？

但只要拆解开这套方案的核心能力就会发现，阿里从一开始，就没打算做一个“语音控制升级包”，而是要重构整个座舱的交互逻辑，甚至为整车智能重构算力底座。换句话说，千问不是给车机加了个大模型，而是把阿里整个数字生活生…

03-28

特斯拉回应Model 3标准版入华传闻：仅海外售卖国内暂无引入安排

03-28

荣耀新动向：测试2K+185Hz屏，600系列与Magic 9或迎重大升级

也就是说，荣耀计划在接下来推出一款配备了 2K+185Hz 显示屏的手机产品。同时还有消息显示，荣耀 600 Pro的型号为VKP-NX9，且这两款新机都支持 IP68 及 IP69 级别的防尘防水功能…

03-28

点击查看更多 +

全站最新

科大讯飞学习机怎么选？三款高性价比型号评测，为孩子学习精准助力

中关村论坛：全球科创智慧碰撞共绘创新融合新画卷

混动SUV科技大比拼：理想、比亚迪、问界谁才是“科技全能王”？

国产家用车智能新标杆互联配置全升级开启家庭出行新体验

15万级混动轿车：都市通勤经济之选，舒适与智慧并存的家庭出行伙伴

2025年科沃斯逆袭登顶：海外市场爆发与三大壁垒成就清洁电器行业龙头

热门内容

本栏最新

中文大模型SuperCLUE测评：豆包紧追海外顶尖模型 小米两款模型入榜国产开源亮眼

中文大模型SuperCLUE测评：豆包紧追海外顶尖模型小米两款模型入榜国产开源亮眼