David Holz, fondateur et PDG de Midjourney, a récemment partagé les dernières avancées des projets de l'entreprise et répondu aux questions de la communauté lors d'une session de « questions-réponses » sur Discord. Cet échange a révélé que Midjourney est en train d'innover sur plusieurs fronts pour faire face à la concurrence de plus en plus intense dans le domaine de la génération d'images par IA.

Un nouveau modèle retardé, mais plus riche en fonctionnalités

Bien que Midjourney ait progressé rapidement en peu de temps, la fréquence de sortie des nouveaux modèles a considérablement ralenti. La dernière version, la 6.1, est sortie en juillet, et les utilisateurs ont dû patienter longtemps. Initialement prévue pour l'été, la version 7 a désormais un nouveau calendrier : elle devrait être prête dans un à deux mois.

Holz a expliqué que l'équipe de développement ne se précipite pas pour sortir de nouveaux modèles, mais se concentre sur l'amélioration de l'accessibilité de la technologie et de la valeur d'utilisation quotidienne professionnelle des outils. Par exemple, de nombreux utilisateurs étaient initialement réticents à utiliser Discord. L'entreprise a désormais mis à disposition une interface web pour tous les utilisateurs, y compris ceux qui souhaitent essayer gratuitement la génération d'images par IA.

Amélioration des performances et nouvelles fonctionnalités

Midjourney prévoit de lancer prochainement plusieurs nouvelles fonctionnalités pour améliorer l'expérience utilisateur :

Génération d'images multiples : les utilisateurs pourront générer 8 images simultanément, contre 4 actuellement.

Éditeur d'images : l'entreprise développe un outil permettant aux utilisateurs de modifier des images externes (comme des photos), avec des fonctions de recoloration partielle (inpainting) et d'extension de dessin (outpainting).

Système 3D : un projet plus ambitieux consiste à développer un système 3D permettant aux utilisateurs de s'immerger virtuellement dans les images IA. Ce système utilisera un nouveau format « type NeRF », plutôt que les techniques traditionnelles de rendu polygonal, NeRF ou de diffusion gaussienne.

Personnalisation : basé sur les retours utilisateurs, Midjourney vise à en apprendre davantage sur les préférences des utilisateurs afin de fournir des résultats plus personnalisés. Cette fonctionnalité a récemment été activée dans le modèle Niji, spécialisé dans la génération de personnages d'anime.

image.png

Génération vidéo : outre les images statiques, Midjourney prévoit également de se lancer dans la génération de vidéos.

Développement matériel : l'entreprise investit également dans le développement matériel, en plus du logiciel.

Face à la progression rapide de concurrents comme OpenAI, Midjourney a choisi une voie de développement plus prudente. En privilégiant l'ajout de fonctionnalités pratiques et l'amélioration de l'expérience utilisateur plutôt que la vitesse d'itération des modèles, Midjourney espère conserver son avantage unique dans le domaine concurrentiel de la génération d'images par IA.

Accès au produit : https://top.aibase.com/tool/midjourneywangyeban