中文科技资讯 CWX中文科技资讯官方网站！

时事快闻

14大主流AI！谁是最强者？实测GPT4、Claude-3、文心一言

时间：2024-04-24 21:27 来源：中文科技资讯

由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架，正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型，结果显示：文心一言4.0中文理解、数学等多能力全球第一。

评测显示，文心一言4.0表现优异，在中文推理、中文语言等评测上遥遥领先，和其他模型拉开明显差距。中文理解上，文心一言4.0领先优势明显，领先第二名GLM-4 0.41分，GPT-4系列模型表现较差，排在中下游，并且和第一名文心一言4.0分差超过1分。

在语义理解中的数学能力上，文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五，其他模型得分在55分附近较为集中，明显落后第一梯队;而在语义理解中的阅读理解能力上，文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上，国内模型文心一言4.0表现亮眼，力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分)，Claude-3仅列第四。

更多>同类内容

开启未来新体验巴可亮相北京InfoComm China 2025

4月16日至18日，InfoComm China 2025展会在北京国家会议中心隆重开幕，巴可盛大参展，现场亮点纷呈!沉浸式体验与混合会议两大展区，不仅带来了“沉浸环宇”的震撼视听效果，还首次展示了可立享全家族五大产品阵容，吸引了众多目光。此外，巴可可立享无线会议

04-22

青岛疾控中心公益视频：结核分枝杆菌潜伏感染者预防性治疗大冒险

视频来源：青岛市疾病预防控制中心青岛市预防医学研究院青岛市卫生健康大数据中心

03-27

DeepGreenX中国公司荣获“2025福布斯中国行业发展领军企业”奖项

2025年3月22日，在2025沙利文中国企业家年会暨“福布斯中国行业发展领创者评选”颁奖典礼上，阳光七星投资集团旗下企业DeepGreenX集团(以下简称“DXG”)旗下的中国公司凭借其在行业创新、市场领导力及可持续发展方面的卓越表现，荣获“2025福布斯中国行业发展

03-24

吴征博士荣获“2025福布斯中国行业发展领创者”称号

吴征博士荣获“2025福布斯中国行业发展领创者”称号引领阳光七星投资集团迈向全球创新新高地2025年3月22日，在2025沙利文中国企业家年会暨“福布斯中国行业发展领创者评选”颁奖典礼上，阳光七星投资集团主席兼CEO吴征博士凭借其卓越的领导力、创新精神及对

03-24

2025年呼叫中心品牌排行，如何选择智能呼叫系统？

呼叫中心已从传统电话接听演变为企业连接客户的核心枢纽，一套高效、稳定且智能的呼叫系统，是企业提升服务效率、优化用户体验的关键基建。本文将基于行业调研与市场反馈，梳理当前呼叫中心品牌排行的核心逻辑，并深度解析头部厂商的产品价值，为企业选型提供

03-17

2025世俱杯奖杯重庆首秀让球迷心动的竟是影院级激光电视

3月10日，2025海信X FIFA世俱杯奖杯中国行在重庆解放碑广场盛大举行，世俱杯奖杯首次亮相中国，点燃众多球迷参与的热情。作为2025国际足联俱乐部世界杯全球官方电视，海信激光电视现场演绎出如同比赛现场的沉浸氛围，足球名宿孙继海参与现场互动，将活动氛围

03-13

米乔人体工学亮相第四届应用人因工效大会，共话人体工学产业应用新机遇

2024年11月15日，由环一科技(上海)有限公司与中国职场工效学专委会联合举办的「2024可持续发展高峰论坛」及第四届「应用人因工效学大会」在上海圆满举行。米乔人体工学作为合作伙伴，携人体工学创新产品精彩亮相，并在圆桌会议环节分享在人体工学领域的长期研

02-05

青岛疾控中心公益视频：肺结核患者如何打赢情绪战？

视频来源：青岛市疾病预防控制中心青岛市预防医学研究院青岛市卫生健康大数据中心

01-18

正式签约！360为宁波城市大模型发展注入新动能

近日，由宁波市数据局、宁波市科技局、宁波市经信局、宁波通商控股集团有限公司指导，宁波市人工智能学会、宁波市大数据发展协会主办，三六零数字安全科技集团有限公司等单位承办的城市大模型发展交流主题活动在宁波举行。活动上，360数字安全集团与宁波人工

01-16

服装电商困局何解？AI+3D赋能「上新」加速破局

众所周知，电商是一个极度快节奏领域，尤其是服装电商，想要获得高流量和高销量，关键在于不断上新和打造爆款。而对于商家来说，不断推新不仅考验其对市场的敏感度，更是挖掘爆款的好方法。「上新」对于服装电商而言，如同GMV的肾上腺素。「爆款」亦是在持续

01-16

霸榜榜单，口碑领跑！XR元宇宙最燃新示范来了

王者归来，霸气登场!1月10日，超人气“顶流”秦潮觉醒第二季，于上海时尚地标今潮8弄滨港商业中心震撼首发。上海市虹口区商务委挂职副主任张秀娟，复旦大学教授、复旦大学国家智能评价与治理实验基地副主任、元宇宙与虚实交互联合研究院院长赵星，上海市徐汇

01-11

大象云智携手邯郸文旅集团，共绘数字文旅新蓝图

2025年1月3日，大象云智数据运营有限公司(以下简称“大象云智”)与邯郸市文体旅产业集团有限公司(以下简称“邯郸文旅集团”)在邯郸签署战略合作协议，共同推进“邯郸市数字文旅建设与运营项目”。此次合作标志着双方将通过数字化手段，重新定义文旅产业的未来

01-08

遂川蓝之洋智能产业园盛大投产助力地方经济升级与产业智能化转型

2025年1月5日，深圳市蓝之洋科技有限公司在江西遂川举行了盛大的生产启动仪式，标志着蓝之洋遂川智能产业园一期正式投产。这一里程碑不仅是蓝之洋发展历程的重要时刻，也是遂川县迈向智能制造和高质量发展的关键一步，为地方经济注入了强大动能。仪式现场，重

01-06

三寰传媒：专注港人北上消费市场佛山文旅开启新篇章

【佛山讯】2024年12月，三寰传媒在佛山正式成立，标志着Trilx Group在内地市场的战略布局迈出了重要一步。Trilx Group致力于成为中国内地、香港、东南亚的商业及文化桥梁，旗下有awaytop10 、eattop10、探吃玩旅等多个新兴项目，在香港已为上百家餐饮、时尚、

01-03

青岛疾控中心公益视频：“青小侠”带你认识人畜共患结核病

内容视频来源：青岛市疾病预防控制中心青岛市预防医学研究院青岛市卫生健康大数据中心

12-30

点击查看更多 +

全站最新

王化透露：小米YU7汽车将亮相下届车展，网友期待满满

泛林集团2025年Q3财报亮眼：营收大增24.4%，中国大陆市场占比第一

南海东部海域！我国海上稠油油田无人平台投产成功

京沪高铁宠物托运受热捧，2025五一假期预订量超八成！

奔驰设计主管：豪华车不仅是代步，更是情感与尊重的象征

2025年一季度，我国规模以上互联网企业收入达4118亿，增长态势如何？

热门内容

开启未来新体验巴可亮相北京InfoComm China 2025

本栏最新

开启未来新体验巴可亮相北京InfoComm China 2025

霸榜榜单，口碑领跑！XR元宇宙最燃新示范来了

闪耀乌镇，问鼎决赛丨归芯科技喜获2024“直通乌镇”全球互联网大赛特等奖

发布文心iRAG和无代码“秒哒”两大AI技术！李彦宏：打造数百万“超级有用”的应用

字节豆包通用图像编辑模型SeedEdit开启测试用户可一句话轻松改图

如何简化App Store提现？——作为游戏开发者的万里汇收款体验分享