MiraDataは、平均72秒の長尺動画片段に特化した大規模動画データセットです。構造化字幕(平均318文字)を提供することで、動画内容の記述を充実させています。GPT-4Vなどの技術を活用し、動画理解と字幕生成において高い精度と意味の一貫性を示しています。