改善実績 Archive | APTO

JP

Downloads Contact

安全性データセット
LLMがより安全な回答を行えるようにするためのデータセット
Benchmark | AIME2025
AnswerCarefully
1
Gemma3-27B
11.3190.18
2
Qwen3-32B
9.5286.01
SafeDialBench
1
Gemma3-27B
4.7149.44
全ランキングを見る
マルチベンチマーク比較
複数ベンチマークを横断的に比較できるデータセット
Benchmark | M-IFEval
AnswerCarefully
1
Gemma3-27B
11.3190.18
2
Qwen3-32B
9.5286.01
SafeDialBench
1
Gemma3-27B
15.8749.44
全ランキングを見る
指示追従データセット
高難易度の指示追従能力を強化するためのチューニングデータ
Benchmark | M-IFEval
1
gpt-oss-20b
1025.9
2
gemini-2.5-pro
921.84
3
o3-pro
820.42
全ランキングを見る
数学推論データセット
LLMの数学推論能力を改善させるデータセット
Benchmark | AIME2025
1
gpt-oss-20b
1043.3
2
Qwen3-32B
10.136.7
3
gpt-4o-mini
6.6710
全ランキングを見る

Data that sparks innovation

Unlock new possibilities for your business with APTO's AI data.
Feel free to get started by requesting our materials.

Download materials

Ask us a question