lmms-finetuneは、大規模マルチモーダルモデル(LMMs)のファインチューニングプロセスを簡素化することを目的とした統一的なコードベースです。最新のLMMsを容易に統合し、ファインチューニングを行うための構造化されたフレームワークを提供します。フルファインチューニングやLoRAなどの戦略をサポートしています。コードベースはシンプルで軽量に設計されており、理解と変更が容易です。LLaVA-1.5、Phi-3-Vision、Qwen-VL-Chat、LLaVA-NeXT-Interleave、LLaVA-NeXT-Videoなど、様々なモデルをサポートしています。