Bunnyは、軽量ながらも強力な機能を備えたマルチモーダルモデルシリーズです。様々なプラグアンドプレイ式の視覚エンコーダと言語バックボーンネットワークを提供します。より広範なデータソースから厳選されたデータを用いて、より豊富なトレーニングデータを構築することで、モデルサイズの小ささを補っています。Bunny-v1.0-3Bモデルは、同等のサイズ、あるいはそれ以上のMLLM(7B)モデルを性能で上回り、13Bモデルと同等の性能を示します。