Compare Models

Select up to 4 models to compare benchmarks, pricing, and capabilities side by side.

o3-mini

OpenAI

DeepSeek-R1

DeepSeek

Granite 3.1 8B

IBM

Add Model

MMLU

o3-mini

86.9

DeepSeek-R1

90.8

Granite 3.1 8B

72.0

HumanEval

o3-mini

92.9

DeepSeek-R1

92.8

Granite 3.1 8B

68.0

GSM8K

o3-mini

97.9

DeepSeek-R1

97.3

Granite 3.1 8B

78.0

GPQA

o3-mini

77.0

DeepSeek-R1

71.5

Granite 3.1 8B

0.0

MGSM

o3-mini

89.5

DeepSeek-R1

92.8

Granite 3.1 8B

0.0

ARC-Challenge

o3-mini

96.0

DeepSeek-R1

97.2

Granite 3.1 8B

0.0

HellaSwag

o3-mini

92.5

DeepSeek-R1

93.8

Granite 3.1 8B

78.0

MATH

o3-mini

97.0

DeepSeek-R1

97.3

Granite 3.1 8B

0.0

SWE-bench

o3-mini

49.3

DeepSeek-R1

49.2

Granite 3.1 8B

0.0

MMMLU

o3-mini

83.5

DeepSeek-R1

87.5

Granite 3.1 8B

0.0

IFEval

o3-mini

0.0

DeepSeek-R1

0.0

Granite 3.1 8B

82.0

Model	Input	Output	Blended*
o3-mini	$1.10	$4.40	$2.75
DeepSeek-R1	$0.55	$2.19	$1.37
Granite 3.1 8B	$0.10	$0.20	$0.15

*Blended = average of input and output price

Spec	o3-mini	DeepSeek-R1	Granite 3.1 8B
Context Window	200K	128K	128K
Max Output	100K	8K	N/A
TTFT	800ms	900ms	N/A
Speed	75 tok/s	60 tok/s	N/A
Parameters	N/A	685B (37B active)	8B
Architecture	Transformer + CoT	Transformer (MoE) + CoT	Dense Transformer
Open Source	No	Yes	Yes
Tier	mid	mid	mid

Quick Verdict

Best Performance

DeepSeek-R1

Best Value

Granite 3.1 8B

Fastest

o3-mini