美图奇想大規模言語モデルによる画像生成能力が再びアップグレード：より繊細で自然な質感を実現

美图公司は、同社の美图奇想大規模言語モデル（MiracleVision）の画像生成能力が再び向上したと発表しました。今回のアップグレードは、この大規模言語モデルの総合的な能力がさらに向上したことを示しています。同時に、美图公司はAIショートビデオ制作ツール「MOKI」を発表し、順次美图社の製品エコシステムに統合され、ユーザーに全く新しいビジュアル体験を提供する予定です。

今回のアップグレードは、美图奇想大規模言語モデルにとって1ヶ月以内での2回目の更新となります。9月23日には、この大規模言語モデルの動画生成能力が向上し、最長1分間、24FPS、1080Pの高解像度動画の生成に対応しました。そして今回のアップグレードでは、画像生成能力が特に強化され、美图奇想大規模言語モデルのセマンティック理解とテキスト拡張能力を活用することで、正確な画像表現とストーリー性のある雰囲気の表現を実現しています。

微信截图_20241025075711.png

美图奇想大規模言語モデルの開発チームは、今回のアップグレードでは美图公司が長年培ってきた画像処理、美学、芸術などの分野での蓄積を深く融合し、多様な美学理念をモデルのトレーニングプロセスに組み込んだと述べています。これにより、生成される画像の質感はより繊細で自然になり、輪郭、光と影、構図に至るまで、あらゆる面で映画のような高画質の画像表現が可能になりました。アップグレード後の美图奇想大規模言語モデルは、超短文から超長文まで幅広いテキスト入力に対応し、多様なスタイルや複雑なシーンを正確に理解し、想像力豊かなクリエイティブな画像を表現できます。

特筆すべきは、今回のアップグレードでは中国文化の要素を抽出して重点的に調整し、東洋的な意味合いだけでなく、東洋と西洋を融合した意味合いも正確に理解し表現することで、ユーザーに東洋的な雰囲気あふれるビジュアルスタイルを提供できるようになったことです。