Midjourney创始人兼CEO David Holz近日在Discord上的"办公时间"中,亲自分享了公司当前项目的最新进展,并回答了社区用户的问题。这次交流透露出Midjourney正在进行多方面的技术创新,以应对日益激烈的AI图像生成领域的竞争。
新版本推迟但功能更丰富
尽管Midjourney在短时间内取得了快速进步,但最近新模型的发布频率明显放缓。公司最新的6.1版本是在7月份发布的,此后用户经历了一段较长的等待期。原计划在夏季前推出的第7版现在有了新的时间表:预计将在一到两个月内准备就绪。
Holz表示,开发团队并非急于推出新模型,而是将重点放在提高技术的可访问性和工具的日常专业使用价值上。例如,许多用户最初对必须使用Discord感到不适应,现在公司已经为所有用户提供了网页界面,包括那些想免费试用AI图像生成的用户。
性能提升与新功能
Midjourney计划在近期推出一些新功能来提升用户体验:
多图生成:用户将能够一次性生成8张图像,这是对目前4张限制的提升。
图像编辑器:公司正在开发一个允许用户编辑外部图像(如照片)的工具,包括局部重绘(inpainting)和扩展绘制(outpainting)功能。
3D系统:一个更具雄心的项目是开发允许用户虚拟沉浸在AI图像中的3D系统。该系统将采用一种新的"类NeRF"格式,而非传统的多边形渲染、NeRF或高斯散射技术。
个性化:基于用户反馈,Midjourney aims to learn更多关于用户偏好的信息,从而提供更个性化的结果。这项功能最近已在专门生成动漫角色的Niji模型中启用。
视频生成:除了静态图像,Midjourney也计划涉足视频生成领域。
硬件开发:公司还在软件之外投资硬件开发。
面对OpenAI等竞争对手的快速发展,Midjourney选择了一条更加稳健的发展道路。通过推出更多实用功能和提升用户体验,而非仅仅追求模型迭代速度,Midjourney希望在AI图像生成这个竞争激烈的领域中保持自己的独特优势。
产品入口:https://top.aibase.com/tool/midjourneywangyeban