Dolphin R1 es un conjunto de datos creado por el equipo de Cognitive Computations, diseñado para entrenar modelos de inferencia similares al modelo DeepSeek-R1 Distill. Este conjunto de datos incluye 300.000 muestras de inferencia de DeepSeek-R1, 300.000 muestras de inferencia de Gemini 2.0 flash thinking y 200.000 muestras de chat de Dolphin. La combinación de estos conjuntos de datos proporciona a investigadores y desarrolladores abundantes recursos de entrenamiento, contribuyendo a mejorar la capacidad de inferencia y conversación de los modelos. Su creación contó con el patrocinio de varias empresas como Dria, Chutes y Crusoe Cloud, las cuales proporcionaron recursos computacionales y financiación para el desarrollo del conjunto de datos. La publicación de Dolphin R1 proporciona una base importante para la investigación y el desarrollo en el campo del procesamiento del lenguaje natural, impulsando el avance de las tecnologías relacionadas.