Compare Models

Select up to 4 models to compare benchmarks, pricing, and capabilities side by side.

GPT-4o

OpenAI

Kimi K2.5

Moonshot AI

Claude Sonnet 4.6

Anthropic

Add Model

MMLU

GPT-4o

88.7

Kimi K2.5

92.0

Claude Sonnet 4.6

92.0

HumanEval

GPT-4o

90.2

Kimi K2.5

99.0

Claude Sonnet 4.6

95.0

GSM8K

GPT-4o

95.8

Kimi K2.5

99.0

Claude Sonnet 4.6

97.5

GPQA

GPT-4o

53.6

Kimi K2.5

87.6

Claude Sonnet 4.6

82.0

MGSM

GPT-4o

90.5

Kimi K2.5

96.0

Claude Sonnet 4.6

94.0

ARC-Challenge

GPT-4o

96.7

Kimi K2.5

0.0

Claude Sonnet 4.6

97.5

HellaSwag

GPT-4o

95.3

Kimi K2.5

0.0

Claude Sonnet 4.6

95.0

MATH

GPT-4o

76.6

Kimi K2.5

98.0

Claude Sonnet 4.6

89.0

SWE-bench

GPT-4o

38.4

Kimi K2.5

76.8

Claude Sonnet 4.6

79.6

MMMLU

GPT-4o

85.1

Kimi K2.5

0.0

Claude Sonnet 4.6

89.5

LiveCodeBench

GPT-4o

0.0

Kimi K2.5

85.0

Claude Sonnet 4.6

0.0

IFEval

GPT-4o

0.0

Kimi K2.5

94.0

Claude Sonnet 4.6

94.0

AIME 2025

GPT-4o

0.0

Kimi K2.5

96.1

Claude Sonnet 4.6

87.0

Model	Input	Output	Blended*
GPT-4o	$2.50	$10.00	$6.25
Kimi K2.5	$0.45	$2.20	$1.33
Claude Sonnet 4.6	$3.00	$15.00	$9.00

*Blended = average of input and output price

Spec	GPT-4o	Kimi K2.5	Claude Sonnet 4.6
Context Window	128K	256K	1.0M
Max Output	16K	16K	16K
TTFT	320ms	500ms	250ms
Speed	95 tok/s	70 tok/s	110 tok/s
Parameters	~1.8T (estimated)	1T (32B active)	N/A
Architecture	Transformer (MoE)	MoE + Multimodal	Transformer
Open Source	No	No	No
Tier	frontier	frontier	frontier

Quick Verdict

Best Performance

Kimi K2.5

Best Value

Kimi K2.5

Fastest

Claude Sonnet 4.6