百度文心大模型5.1发布:多榜单登顶,以6%成本实现同级领先性能

   时间:2026-05-09 15:27 来源:互联网作者:杨凌霄

百度近日宣布,其最新迭代的文心大模型5.1已正式上线。该版本在继承前代知识体系的基础上,通过架构创新实现预训练成本大幅压缩,总参数量缩减至前代的约三分之一,激活参数量减少约一半,仅需同类模型6%的预训练资源即可达到同级别领先性能。这一突破标志着大模型技术进入更高效、更经济的阶段。

在性能评估方面,文心5.1展现强劲竞争力。国际权威榜单Arena Search最新数据显示,该模型以1223分位列全球第四,在中国模型中稳居榜首。在智能体能力专项测试中,其τ³-bench和SpreadsheetBench-Verified成绩超越DeepSeek-V4-Pro,接近国际顶尖闭源模型水平。数学推理能力方面,在AIME26竞赛基准测试中取得99.6分,仅以微弱差距落后于Gemini 3.1 Pro。

知识应用与创作维度同样表现突出。GPQA和MMLU-Pro测试显示,其世界知识掌握程度与头部闭源模型相当;内部评估中创意写作能力已接近Gemini 3.1 Pro标准。深度搜索能力作为核心优势,在Search Arena排行榜的专项评分中持续保持领先地位。

技术实现层面,研发团队构建了"一次训练,处处部署"的弹性训练框架。该框架突破传统模型逐个训练的局限,通过动态采样机制同时优化不同规模子模型。具体实现三大创新:弹性深度机制使Transformer层数随机变化,促进深浅层特征共享;弹性专家容量通过动态调整MoE层参与路由的专家数量,提升计算资源利用率;弹性稀疏度采用可变Top-k路由,在推理效率与模型性能间取得动态平衡。

生态建设方面,文心5.1已启动多平台部署计划。即日起,全球领先的AI角色扮演平台ISEKAI ZERO、创意智能体平台Mulan AI、AI原生创意画布谛听幻流,以及AI短剧生成平台Storymaster等十余个创作平台将陆续接入该模型。开发者可通过千帆大模型平台将model_name切换至ernie-5.1调用API服务,普通用户登录文心一言官网即可体验最新交互能力。

 
 
更多>同类内容
全站最新
热门内容