
安全性データセット
LLMがより安全な回答を行えるようにするためのデータセット
Benchmark | AIME2025AnswerCarefully1Gemma3-27B11.3190.182Qwen3-32B9.5286.01SafeDialBench1Gemma3-27B4.7149.44
マルチベンチマーク比較
複数ベンチマークを横断的に比較できるデータセット
Benchmark | M-IFEvalAnswerCarefully1Gemma3-27B11.3190.182Qwen3-32B9.5286.01SafeDialBench1Gemma3-27B15.8749.44
指示追従データセット
高難易度の指示追従能力を強化するためのチューニングデータ
Benchmark | M-IFEval1gpt-oss-20b1025.92gemini-2.5-pro921.843o3-pro820.42
数学推論データセット
LLMの数学推論能力を改善させるデータセット
Benchmark | AIME20251gpt-oss-20b1043.32Qwen3-32B10.136.73gpt-4o-mini6.6710
Data that sparks innovation
Unlock new possibilities for your business with APTO's AI data.
Feel free to get started by requesting our materials.