El 26 de febrero, el equipo de Google DeepMind lanzó Genie, un modelo mundial básico y un entorno virtual interactivo generativo con 11 mil millones de parámetros. Entrenado con datos de video, Genie puede generar fotos, bocetos e incluso mundos virtuales manipulables. A diferencia de los modelos de IA tradicionales que requieren etiquetas humanas para las imágenes, Genie se entrenó sin etiquetas de acción. Esto significa que Genie tuvo que identificar por sí mismo las características y patrones de diferentes acciones a partir del video. Los videos generados por Genie tienen un estilo de dibujos animados y pueden simular movimientos de robots y objetos que cambian de forma, siendo más similar a un GIF animado que Sora. Google afirma que Genie es un desafío, capaz de aprender control de grano fino a partir de videos de internet. Genie también puede simular múltiples acciones potenciales e inferir diferentes acciones según el entorno generado.
Google lanza Genie, un modelo de mundo base con 11 mil millones de parámetros

雪球App
144
© Todos los derechos reservados AIbase 2024, haz clic para ver la fuente original - https://www.aibase.com/es/news/5657