2026-02-04 14:49:03

全球中文大模子战力榜发布：前三被海外包办国产有欣喜

摘要

2月4日消息，今天，SuperCLUE发布2025年年度中文大模型基准测评报告。23个国内外模型参与角逐，覆盖数学推理、科学推理、代码生成等六大核

2月4日消息，今天，SuperCLUE发布2025年年度中文大模型基准测评报告。

23个国内外模型参与角逐，覆盖数学推理、科学推理、代码生成等六大核心维度。

从结果来看，海外闭源模型依旧占据头部位置，Anthropic旗下的Claude-Opus-4.5-Reasoning以68.25分位居榜首。

谷歌的Gemini-3-Pro-Preview和OpenAI的GPT-5.2(high)分别以65.59分、64.32分紧随其后，包揽前三名。

不过，国产大模型正加速从跟跑向并跑迈进。国内开源最佳模型Kimi-K2.5-Thinking 和闭源最佳模型Qwen3-Max-Thinking，分别以61.50分、60.61分位列全球第四和第六。

在部分细分领域，国产模型表现亮眼，比如Kimi-K2.5-Thinking在代码生成任务中以53.33分夺冠，Qwen3-Max-Thinking在数学推理任务中与Gemini-3-Pro-Preview同获80.87分，并列全球第一。

从整体格局看，海内外开闭源模型差异显著。闭源阵营呈现海外领先、国产追赶态势，开源阵营则是国产主导、海外式微，国内开源模型Top5均大幅领先海外开源模型。

全球中文大模子战力榜发布：前三被海外包办国产有欣喜

声明：文章不代表币圈子观点及立场，不构成本平台任何投资建议。投资决策需建立在独立思考之上，本文内容仅供参考，风险自担！转载请注明出处！侵权必究！

币圈快讯

2026-02-04 10:46:03

探索海角的黑料与爆炸反差猎奇：一场前所未有的直播视频体验

2026-02-04 04:38:28

探索99丨国产丨精品|网站：直播视频软件的新选择

2026-02-04 05:33:44

蜜桃产业一二三产区：全面解析蜜桃产业链的现状与未来

2026-02-04 12:17:25

B站禁止转播(404)短视频软件的原因与影响

2026-02-04 01:49:04

五一今日爆料|极品反差红框挑战：一场不可错过的直播盛宴

2026-02-04 02:44:05

嫩草m码和欧洲码本质上的区别

查看更多

热门新闻

热门百科

探索海角的黑料与爆炸反差猎奇：一场前所未有的直播视频体验

探索海角的黑料与爆炸反差猎奇：一场前所未有的直播视频体验

探索99丨国产丨精品|网站：直播视频软件的新选择

探索99丨国产丨精品|网站：直播视频软件的新选择

蜜桃产业一二三产区：全面解析蜜桃产业链的现状与未来

蜜桃产业一二三产区：全面解析蜜桃产业链的现状与未来

B站禁止转播(404)短视频软件的原因与影响

B站禁止转播(404)短视频软件的原因与影响

五一今日爆料|极品反差红框挑战：一场不可错过的直播盛宴

五一今日爆料|极品反差红框挑战：一场不可错过的直播盛宴

嫩草m码和欧洲码本质上的区别

嫩草m码和欧洲码本质上的区别

17c丨国产丨精品视频：开创直播视频软件的新纪元

17c丨国产丨精品视频：开创直播视频软件的新纪元

今日丨极品丨反差丨新娘：直播视频软件引领婚礼新趋势

今日丨极品丨反差丨新娘：直播视频软件引领婚礼新趋势

今日黑料,爆反差女神：直播视频软件上那些让人惊讶的瞬间

今日黑料,爆反差女神：直播视频软件上那些让人惊讶的瞬间

全面解析欧洲尺码、日本尺码、美国尺码与欧洲LV尺码的转化与适用性

全面解析欧洲尺码、日本尺码、美国尺码与欧洲LV尺码的转化与适用性

查看更多

探索海角的黑料与爆炸反差猎奇：一场前所未有的直播视频体验

探索海角的黑料与爆炸反差猎奇：一场前所未有的直播视频体验

探索99丨国产丨精品|网站：直播视频软件的新选择

探索99丨国产丨精品|网站：直播视频软件的新选择

蜜桃产业一二三产区：全面解析蜜桃产业链的现状与未来

蜜桃产业一二三产区：全面解析蜜桃产业链的现状与未来

B站禁止转播(404)短视频软件的原因与影响

B站禁止转播(404)短视频软件的原因与影响

五一今日爆料|极品反差红框挑战：一场不可错过的直播盛宴

五一今日爆料|极品反差红框挑战：一场不可错过的直播盛宴

嫩草m码和欧洲码本质上的区别

嫩草m码和欧洲码本质上的区别

17c丨国产丨精品视频：开创直播视频软件的新纪元

17c丨国产丨精品视频：开创直播视频软件的新纪元

今日丨极品丨反差丨新娘：直播视频软件引领婚礼新趋势

今日丨极品丨反差丨新娘：直播视频软件引领婚礼新趋势

今日黑料,爆反差女神：直播视频软件上那些让人惊讶的瞬间

今日黑料,爆反差女神：直播视频软件上那些让人惊讶的瞬间

全面解析欧洲尺码、日本尺码、美国尺码与欧洲LV尺码的转化与适用性

全面解析欧洲尺码、日本尺码、美国尺码与欧洲LV尺码的转化与适用性

查看更多