Midjourneyの創設者兼CEOであるDavid Holz氏が最近、Discordの「オフィスアワー」で、同社の現在のプロジェクトの最新状況を自ら共有し、コミュニティユーザーからの質問に答えています。今回の交流から、MidjourneyはAI画像生成分野におけるますます激化する競争に対応するため、多方面での技術革新を進めていることが明らかになりました。

新バージョンの延期と機能の充実

Midjourneyは短期間で急速な進歩を遂げましたが、最近の新モデルのリリース頻度は明らかに低下しています。同社の最新の6.1バージョンは7月にリリースされましたが、その後、ユーザーは比較的長い待ち時間を経験しました。当初は夏前にリリース予定だった第7版は、新たなスケジュールが設定され、1~2ヶ月以内には準備が整う見込みです。

Holz氏によると、開発チームは新モデルを急いでリリースするのではなく、技術のアクセシビリティとツールの日常的な専門的な使用価値の向上に重点を置いています。例えば、多くのユーザーは当初、Discordを使用しなければならないことに戸惑っていましたが、現在、同社はAI画像生成を無料で試したいユーザーを含むすべてのユーザーにウェブインターフェースを提供しています。

性能向上と新機能

Midjourneyは近日中に、ユーザーエクスペリエンスを向上させるいくつかの新機能を導入する予定です。

複数画像生成:ユーザーは一度に8枚の画像を生成できるようになります。これは現在の4枚という制限の改善です。

画像エディター:同社は、ユーザーが外部画像(写真など)を編集できるツールを開発中です。これには、インペインティング(局所的な再描画)とアウトペインティング(拡張描画)機能が含まれます。

3Dシステム:より野心的なプロジェクトとして、ユーザーがAI画像の中に仮想的に没入できる3Dシステムの開発があります。このシステムは、従来のポリゴンレンダリング、NeRF、またはガウス散乱技術ではなく、新しい「NeRF類似」形式を採用します。

パーソナライズ:ユーザーからのフィードバックに基づき、Midjourneyはユーザーの好みに関する情報をより多く学習し、よりパーソナライズされた結果を提供することを目指しています。この機能は最近、アニメキャラクターを専門に生成するNijiモデルで有効化されました。

image.png

動画生成:静止画に加えて、Midjourneyは動画生成分野にも進出する予定です。

ハードウェア開発:同社はソフトウェア以外にもハードウェア開発に投資しています。

OpenAIなどの競合他社の急速な発展に対抗して、Midjourneyはより堅実な開発の道を歩んでいます。モデルの反復速度を追求するのではなく、より実用的な機能の導入とユーザーエクスペリエンスの向上を通じて、MidjourneyはAI画像生成という競争の激しい分野で独自の優位性を維持することを目指しています。

製品入口:https://top.aibase.com/tool/midjourneywangyeban