¡Qwen-VL, el nuevo modelo de lenguaje visual de Alibaba Cloud, permite a Tongyi Qianwen ver imágenes!

AI前线

Publicado elNoticias de IA · 2 minutos de lectura · Aug 25, 2023

Alibaba Cloud ha lanzado código abierto para el modelo de lenguaje visual Qwen-VL, el cual se suma a los modelos de lenguaje de código abierto Qwen-7B y Qwen-7B-Chat (lanzados en agosto), consolidándose como otro gran modelo de código abierto. Qwen-VL admite chino e inglés y puede utilizarse en diversas aplicaciones, como preguntas y respuestas sobre conocimiento, generación de títulos de imágenes y preguntas y respuestas sobre imágenes. En comparación con otros modelos, Qwen-VL puede realizar una localización de dominio abierto en chino y etiquetar con precisión los cuadros delimitadores en las imágenes. Desarrollado basándose en Qwen-7B, Qwen-VL incorpora un codificador visual que admite la entrada de imágenes. En las pruebas realizadas en múltiples tareas de lenguaje visual, Qwen-VL ha obtenido los mejores resultados entre modelos similares. Qwen-VL ya está disponible en plataformas de código abierto como ModelScope. La multimodalidad es una dirección importante en el desarrollo de grandes modelos, aunque todavía presenta ciertos desafíos tecnológicos.

Alibaba Cloud Tongyi Qianwen Qwen-VL código abierto modelo de lenguaje visual

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

Boletín diario de IA: Alibaba's Tongyi Qianwen encabeza la lista de modelos de código abierto a nivel mundial; MiniMax lanza el modelo de voz Speech-02; Los usuarios de pago de ChatGPT aumentan a 20 millones

¡Bienvenido al boletín diario de IA! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Todos los días le presentamos los temas más relevantes del campo de la IA, centrados en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA. Más información sobre nuevos productos de IA: https://top.aibase.com/1. El modelo Qwen-2.5-Omni de Alibaba's Tongyi Qianwen encabeza la lista de modelos de código abierto a nivel mundial. El 2 de abril de 2024, HuggingFace publicó la última lista de modelos de gran tamaño, con el Qwe de Alibaba...

Apr 2, 2025

阿里通义千问 Qwen-2.5-Omni encabeza la lista mundial de modelos de código abierto

Apr 2, 2025

Arthur lanza Arthur Engine, el primer motor de evaluación de IA en tiempo real de código abierto

Apr 2, 2025

Boletín diario de IA: Runway lanza el nuevo modelo de video Gen-4; el robot cuadrúpedo Unitree G1 supera el millón en ventas en 5 minutos de transmisión en vivo; OpenAI lanzará un nuevo modelo de código abierto

¡Bienvenido al boletín diario de IA! Aquí encontrará su guía diaria para explorar el mundo de la inteligencia artificial. Cada día le presentamos los temas más relevantes del campo de la IA, con enfoque en los desarrolladores, para ayudarle a comprender las tendencias tecnológicas y las innovadoras aplicaciones de productos de IA. Conozca los nuevos productos de IA: https://top.aibase.com/1. Runway lanza el impresionante modelo de generación de video con IA Gen-4, con una consistencia asombrosa en personajes y escenas. El modelo de inteligencia artificial Gen-4 recientemente lanzado por Runway ha generado un gran interés en el campo de la generación de medios...

Apr 1, 2025

Turrón lanza Xiao Niu, su asistente de IA: con el apoyo de modelos grandes de código abierto, se inicia un servicio de viaje inteligente integral

El 1 de abril por la tarde, Turrón Travel anunció el lanzamiento oficial de su asistente de IA de desarrollo propio, "Xiao Niu", un agente de aplicaciones turísticas, que se lanzará simultáneamente en la aplicación Turrón Travel y en el miniprograma "Xiao Niu", el asistente de IA. Según se informa, "Xiao Niu", el asistente de IA, utiliza innovadoramente los modelos de código abierto DeepSeek y Tongyi Qianwen, y se integra profundamente en los escenarios de aplicación vertical de viajes, con el objetivo de brindar a los usuarios una experiencia de viaje más conveniente y eficiente. A través de "Xiao Niu", el asistente de IA, los usuarios pueden realizar fácilmente consultas y reservas rápidas de billetes de avión, hoteles y billetes de tren. Cabe destacar que esta IA...

Apr 1, 2025

SF Express Same City: Colaboraciones con Doubao, Tencent HunYuan y otros fabricantes

Recientemente, SF Express Same City anunció que implementará completamente la digitalización de las operaciones y la toma de decisiones de inteligencia artificial (IA) en todos los aspectos de sus operaciones comerciales. La compañía espera construir una infraestructura de modelos grandes más adecuada para la industria de entrega inmediata para lograr operaciones y servicios más eficientes. Para lograr este objetivo, SF Express Same City se basa en el ecosistema de código abierto DeepSeek y sus capacidades de IA multimodal para permitir un desarrollo personalizado rápido. Esto significa que SF Express Same City puede ajustar rápidamente sus servicios y productos según las necesidades específicas de los diferentes clientes para satisfacer las demandas del mercado.

Apr 1, 2025

OpenAI planea lanzar un modelo de IA de código abierto en los próximos meses

El CEO de OpenAI, Sam Altman, anunció hoy en las redes sociales que la compañía lanzará un modelo de inteligencia artificial de código abierto en los próximos meses. Esta noticia ha generado un gran interés, especialmente después del éxito innovador del modelo R1 de la empresa china DeepSeek, lo que ha supuesto una presión para OpenAI, particularmente ante la competencia del modelo de la serie Llama de Meta. Altman declaró que OpenAI ya estaba considerando el lanzamiento de un modelo de código abierto.

Apr 1, 2025

Google lanza el modelo de código abierto TxGemma para acelerar el desarrollo de fármacos terapéuticos

Recientemente, Google anunció el lanzamiento de su nuevo modelo de código abierto TxGemma, diseñado para mejorar la eficiencia en el desarrollo de fármacos terapéuticos. Este modelo, desarrollado por el equipo de Google DeepMind a partir de su avanzada familia de modelos Gemma, integra potentes funciones de comprensión del lenguaje, predicción científica y diálogos multiturno, con el objetivo de revolucionar el campo del desarrollo de fármacos. El lanzamiento de TxGemma se considera un importante avance de la inteligencia artificial en el ámbito biomédico, con el potencial de reducir significativamente el tiempo que tarda un fármaco en pasar del laboratorio a la clínica, y al mismo tiempo reducir los costes.

Mar 31, 2025

¡Llega Suno de código abierto! YuE, el modelo de generación de música con IA, crea voces y acompañamientos musicales profesionales

YuE es un nuevo modelo de generación de música con IA de código abierto basado en Suno, capaz de producir voces y acompañamientos musicales de calidad profesional. Descubre cómo esta innovadora tecnología está revolucionando la creación musical.

Mar 28, 2025

Together AI lanza un nuevo servicio de chatbot con soporte para múltiples modelos de código abierto y funciones de búsqueda

Recientemente, Together AI anunció el lanzamiento de su nuevo servicio de chatbot, que ofrece a los usuarios una experiencia de interacción con IA diversificada. Según se informa, este servicio integra una serie de modelos de código abierto, incluyendo R1, Qwen y FLUX, con el objetivo de proporcionar a desarrolladores y usuarios soluciones eficientes e inteligentes a través de una potente capacidad de cálculo y apertura. El servicio de chatbot lanzado no solo admite la interacción multimodal, sino que también incorpora una función de búsqueda, permitiendo a los usuarios obtener información de la web rápidamente mediante consultas en lenguaje natural. Esta función...

Mar 25, 2025

Noticias de IA

IA Diario

Cronología de la IA

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General

¡Qwen-VL, el nuevo modelo de lenguaje visual de Alibaba Cloud, permite a Tongyi Qianwen ver imágenes!

AI前线

Este artículo proviene de AIbase Daily

Noticias de IA relacionadas recomendadas

Boletín diario de IA: Alibaba's Tongyi Qianwen encabeza la lista de modelos de código abierto a nivel mundial; MiniMax lanza el modelo de voz Speech-02; Los usuarios de pago de ChatGPT aumentan a 20 millones

阿里通义千问 Qwen-2.5-Omni encabeza la lista mundial de modelos de código abierto

Arthur lanza Arthur Engine, el primer motor de evaluación de IA en tiempo real de código abierto

Boletín diario de IA: Runway lanza el nuevo modelo de video Gen-4; el robot cuadrúpedo Unitree G1 supera el millón en ventas en 5 minutos de transmisión en vivo; OpenAI lanzará un nuevo modelo de código abierto

Turrón lanza Xiao Niu, su asistente de IA: con el apoyo de modelos grandes de código abierto, se inicia un servicio de viaje inteligente integral

SF Express Same City: Colaboraciones con Doubao, Tencent HunYuan y otros fabricantes

OpenAI planea lanzar un modelo de IA de código abierto en los próximos meses

Google lanza el modelo de código abierto TxGemma para acelerar el desarrollo de fármacos terapéuticos

¡Llega Suno de código abierto! YuE, el modelo de generación de música con IA, crea voces y acompañamientos musicales profesionales

Together AI lanza un nuevo servicio de chatbot con soporte para múltiples modelos de código abierto y funciones de búsqueda