← 返回排行榜
🧠 模型排行 最近更新: 2026-05-10

AI 推理能力排行榜

数据来源: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard
AIME 2026GPQA DiamondLiveBench
排名模型厂商AIMEGPQA类型
🥇o3OpenAI96.7%89.2%闭源
🥈Claude 4 OpusAnthropic94.2%87.8%闭源
🥉GPT-5.5OpenAI93.5%86.5%闭源
4Gemini 3.1Google91.0%85.1%闭源
5DeepSeek-V4DeepSeek88.3%82.0%开源
6Claude 4 SonnetAnthropic86.0%80.5%闭源
7GPT-5OpenAI84.5%79.0%闭源
8文心 5.1百度82.0%77.5%闭源
9Qwen3-Max阿里80.5%76.0%闭源
10Gemini 3.0Google78.8%74.5%闭源
11Kimi-2月之暗面77.0%73.0%闭源
12Llama 4 MaverickMeta75.5%71.5%开源
13GLM-5智谱 AI74.0%70.0%闭源
14Mistral Large 3Mistral72.5%68.5%闭源
15Claude 4 HaikuAnthropic71.0%67.0%闭源
16DeepSeek-V3.2DeepSeek69.5%65.5%开源
17Llama 4 ScoutMeta68.0%64.0%开源
18Yi-3零一万物66.5%62.5%开源
19Command ACohere65.0%61.0%闭源
20MiniMax-M2.5MiniMax63.5%59.5%闭源