この度、上海人工知能研究所(上海AI研究所)は、初の画像とテキストの混合生成大規模言語モデル「書生・浦語霊筆(InternLM-XComposer)」を発表しました。浦語霊筆は、流暢な中国語と英語での画像とテキストの対話が可能で、画像の内容を正確に理解し、「ワンクリック生成」による画像とテキストの混合記事の作成機能も備えています。ユーザーがテーマを提供するだけで、浦語霊筆は画像とテキストを組み合わせた記事をワンクリックで生成します。浦語霊筆は、テキストの生成、イラストの計画、画像のスマートな選別という「3ステップ」のアルゴリズムで画像とテキストの記事を作成します。複数の主要なマルチモーダルモデルの評価において、浦語霊筆は常にトップレベルのパフォーマンスを示しており、特に中国語のマルチモーダル理解においては非常に優れています。浦語霊筆はGitHubなどのプラットフォームでオープンソース化されており、開発者の皆様による試用と革新的なアプリケーション開発を歓迎します。