中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

阿里云峰会重磅发布Qwen3.7-Max，国产大模型性能跃升开启智能体新纪元

时间：2026-05-20 13:16 来源：互联网作者：顾雨柔

在2026阿里云峰会上，阿里巴巴正式推出新一代千问旗舰大模型Qwen3.7-Max，引发行业高度关注。这款模型在第三方机构Arena全球大模型盲测中表现卓越，不仅超越Kimi-K2.6、DeepSeek-v4-pro等国产模型，更与GPT、Claude、Gemini等国际顶尖模型比肩，稳居国产模型榜首位置。

Qwen3.7-Max的突破性进展体现在多个维度。在编程能力方面，该模型在SWE-Pro、SWE-Multilingual等权威测评中取得领先成绩，Terminal Bench 2.0-Terminus得分达69.7，超越DeepSeek-v4-pro-Max、Claude-Opus4.6等模型。其编程能力覆盖从前端原型开发到复杂多文件工程的全流程，在SWE-bench系列测评和SciCode编程测评中较前代模型实现显著提升，展现出资深工程师级的代码编写与自我纠错能力。

通用智能体性能同样表现亮眼。在MCP-Atlas、MCP-Mark等现实能力测试中，Qwen3.7-Max超越GLM5.1、Kimi-K2.6等模型，创下国产新高。该模型在Kernel Bench L3测试中展现出强大的GPU内核优化能力，在GPQA Diamond、HLE等推理核心测评中均超越Claude-Opus4.6及所有国产模型。多语言能力方面，其在指令遵循IFBench评测中取得79.1分突破性成绩，在WMT24++、MAXIFE等翻译评测中保持领先优势。

最引人注目的是Qwen3.7-Max在长程复杂任务中的自主迭代能力。在平头哥真武M890芯片这一全新硬件平台上，该模型通过持续35小时的自主编程，完成1158次工具调用和432次内核评估，最终实现推理内核10倍加速。测试轨迹显示，模型在运行超30小时后仍能发现优化点，甚至主动发起架构重设计，这种长周期自主迭代能力为AI模型进化开辟了新路径。

在企业级应用场景中，Qwen3.7-Max通过MCP集成和多智能体协作，在SpreadSheetBench-v1办公自动化基准测试中斩获87分。以往需要专业团队耗时1-2周的复杂项目，现在由该模型驱动的智能体可在数小时内完成端到端交付。这种效率提升得益于其跨框架泛化能力，能在Claude Code、OpenClaw、Qwen Code等多种智能体框架下稳定运行。

阿里云同步宣布技术体系全面升级，推出"芯-云-模型-推理"一体化解决方案。Qwen3.7-Max模型API即将登陆阿里云百炼平台，同时将推出具备多模态推理和视觉理解能力的Qwen3.7-Plus等版本，构建覆盖编程智能体与视觉智能体的全能基座，为Agentic时代提供核心技术支持。

更多>同类内容

石头科技技术迭代加速：从平面到立体，智能清洁新品重塑家居生活新图景

智能扫地机器人凭借其精准导航与自适应清洁技术，已在市场上占据优势；洗地机则通过活水循环系统实现深度清洁，提供更高效的清洁体验；而智能割草机搭载的边界识别算法，使其能够自主规划草坪修剪路径，进一步提升了用户的便…

05-20

长安智能化转型加速：从L3到L4，携手百度共建智算中心布局未来出行

长安这家有164年历史的百年车企，很清楚真正的变革得从底层能力重构开始。它的智能化转型不只是做车机AI交互，更是构建从智能座舱到智能驾驶的核心竞争力。早在三年前，长安就和百度共建智算中心，算力达到每秒142亿…

05-20

小米YU7 GT刷新纽北SUV圈速纪录雷军点赞车手任周灿实力

快科技5月19日消息，小米汽车官方宣布，小米YU7GT以7分34秒931的成绩成功刷新纽博格林北环SUV圈速纪录，小米汽车首席测试车手任周灿成为首个获得纽北官方圈速认证的中国车手。据悉，小米汽车官方已宣布…

05-20

小米17 Max续航实力大揭秘：长视频重度测试超33小时影像散热皆出色

今天，小米手机官方继续进行新机发布前的预热剧透，展示了小米17 Max和iPhone 17 Pro Max的长视频重度续航测试对比。参考目前的消息来看，全新的小米17 Max采用超级像素屏幕，小米17 Pr…

05-20

2026全能旗舰新标杆！OPPO Find X9s Pro影像续航性能全解析

这套组合确保了Find X9s Pro不仅能满足当前大型手游（如某开放世界手游实测5小时持久流畅）的高帧率需求，其超前的硬件和深度的系统优化也为未来三到四年的流畅使用打下了坚实基础，有效回应了用户对安卓旗舰…

05-20

智慧农业新引擎：太原大棚灌溉设备如何以科技赋能本地农业新未来

这种技术不仅解决了人工操作误差大的问题，更让“坐在家里种大棚”成为可能，是智慧农业在实际生产中最为直观的体现。在晋中市寿阳县的基层农技推广项目中，该公司部署的智能温室大棚解决方案，通过精准调控环境与灌溉，显著…

05-19

2026菲尼克斯交换机集成服务全景：多层级格局下企业如何选对伙伴

在这一进程中，菲尼克斯电气作为工业连接与自动化领域的核心品牌，其交换机产品线——涵盖工业交换机、管理型交换机、冗余交换机——已成为构建高可靠性工业网络的关键基础设施。对于项目型、需要快速交付与全系列配套的企…

05-19

《制造天才：霍金的“身体”如何被机器与人类网络共同塑造？》

事实上，这常常也是我们对天才的理解——他们的创造发生于纯粹的观念世界，而相对忽视身体、技术、社会关系等网络那隐而不彰的作用。她揭示了一个重要事实：霍金这位被视为最天才、但也同时“最无身体感”的物理学家，其实比…

05-19

算力发展迈入新阶段：存力从幕后走向台前，如何解锁新未来？

带着这个问题，我们走进了中国移动呼和浩特数据中心，与业内专家和企业代表展开了一场关于“先进存力如何助力算力高质量发展”的对话。这个设想能否落地尚需时间检验，但它指向了一个趋势：在AI驱动下，存储的角色正在从…

05-19

长安智能化转型成果显著：L3自动驾驶落地，L4及飞行汽车等未来布局加速推进

05-19

鸿蒙智行硬核维权：两自媒体被判高额赔偿，500余黑账号遭法律严惩

05-19

大摩报告：英伟达AI GPU建造成本虽高，但性能优势或带来更高回报

05-19

比亚迪闪充电池如何破局？1000次循环验证+全场景测试护航量产落地

05-19

技术契合与品牌出海双驱动，比亚迪拟入局F1赛道与巨头同台竞技

05-19

百度AI转型迎里程碑：新业务收入占比超半，智能云与自动驾驶双轮驱动增长

05-19

点击查看更多 +

全站最新

科大讯飞学习机深度测评：AI赋能个性化教育，助力孩子高效学习成长

广汽丰田铂智3X来袭！9.48万起售，轴距2765mm配激光雷达，续航达610km

东莞场景革命：中国智造新赛道，谁先融入场景谁先领跑未来产业

石头科技业绩说明会亮点纷呈：割草机器人量产，具身智能加速，海外营收再创新高

长安智能化转型加速：从L3到L4，携手百度共建智算中心布局未来出行

小米YU7 GT纽北创纪录！中国车手任周灿致谢雷军：用速度诠释一切

热门内容

本栏最新