¡Olvídate de la optimización manual! PromptWizard de Microsoft optimiza prompts a gran escala, ¡ahorrando tiempo y costes!

AIbase基地

Publicado elNoticias de IA · 6 minutos de lectura · Dec 19, 2024

535

Recientemente, el equipo de investigación de IA de Microsoft publicó la herramienta de código abierto PromptWizard, un marco de IA impulsado por retroalimentación diseñado para optimizar eficientemente el diseño de indicaciones para modelos de lenguaje grandes (LLM). La calidad de las indicaciones es crucial para la calidad de la salida del modelo; sin embargo, crear indicaciones de alta calidad suele requerir mucho tiempo y recursos humanos, especialmente en tareas complejas o de dominio específico.

Los métodos tradicionales de optimización de indicaciones dependen en gran medida de la experiencia humana, un método no solo lento sino también difícil de escalar. Las técnicas de optimización existentes se dividen en continuas y discretas. Las técnicas continuas, como las indicaciones suaves, requieren muchos recursos computacionales, mientras que los métodos discretos, como PromptBreeder y EvoPrompt, generan varias variantes de indicaciones para su evaluación. Aunque estos métodos funcionan bien en algunos casos, carecen de un mecanismo de retroalimentación eficaz, lo que a menudo lleva a resultados insatisfactorios.

PromptWizard introduce un mecanismo de retroalimentación, utilizando un enfoque crítico y sintético para optimizar iterativamente las instrucciones y ejemplos de las indicaciones, mejorando significativamente el rendimiento de las tareas. Su flujo de trabajo se divide principalmente en dos fases: la fase de generación y la fase de inferencia de prueba. En la fase de generación, el sistema utiliza modelos de lenguaje grandes para generar varias variantes basadas en una indicación base y las evalúa para encontrar las opciones de mejor rendimiento. Simultáneamente, el mecanismo de crítica integrado en el marco analiza las ventajas y desventajas de cada indicación, proporcionando retroalimentación para guiar la optimización posterior. Después de varias rondas de optimización, el sistema puede mejorar la diversidad y la calidad de las indicaciones.

En la fase de inferencia de prueba, las indicaciones y ejemplos optimizados se aplican a nuevas tareas para asegurar una mejora continua del rendimiento. Utilizando este método, PromptWizard realizó experimentos exhaustivos en 45 tareas y obtuvo excelentes resultados en configuraciones supervisadas y no supervisadas. Por ejemplo, logró una precisión del 90% sin supervisión en el conjunto de datos GSM8K y del 82.3% en SVAMP. Además, en comparación con métodos discretos como PromptBreeder, PromptWizard redujo hasta 60 veces el uso de llamadas a la API y tokens, mostrando su eficiencia en entornos con recursos limitados.

El éxito de PromptWizard radica en su innovadora optimización secuencial, crítica guiada e integración de roles de experto, lo que le permite adaptarse eficazmente a tareas específicas y tener una buena interpretabilidad. Este avance presagia la importancia de los marcos automatizados en los flujos de trabajo de procesamiento del lenguaje natural y promete promover aplicaciones más eficientes y económicas de la tecnología de IA avanzada.

Blog: https://www.microsoft.com/en-us/research/blog/promptwizard-the-future-of-prompt-optimization-through-feedback-driven-self-evolving-prompts/

Código del proyecto: https://github.com/microsoft/PromptWizard?tab=readme-ov-file

Artículo: https://www.microsoft.com/en-us/research/publication/promptwizard-task-aware-agent-driven-prompt-optimization-framework/

Puntos clave:
🌟 PromptWizard es un nuevo marco de IA para optimizar las indicaciones de los modelos de lenguaje grandes y mejorar el rendimiento del modelo.
🔍 Este marco combina un mecanismo de crítica y un bucle de retroalimentación para generar y evaluar eficientemente varias variantes de indicaciones.
💰 PromptWizard muestra una precisión excepcional en múltiples tareas y reduce significativamente el consumo de recursos y los costos.

PromptWizard Modelos de lenguaje grandes Optimización de prompts Marco AI

Este artículo proviene de AIbase Daily

¡Bienvenido a la columna [AI Diario]! Aquí está tu guía diaria para explorar el mundo de la inteligencia artificial. Todos los días te presentamos el contenido más destacado en el campo de la IA, centrándonos en los desarrolladores para ayudarte a comprender las tendencias tecnológicas y conocer las aplicaciones innovadoras de productos de IA.

—— Creado por el grupo AIbase Daily

Noticias de IA relacionadas recomendadas

TikTok responde al lanzamiento de la tarjeta de desmentido: combina capacidades de modelos de lenguaje grandes de IA y humanos

Recientemente, el boletín de TikTok publicó un anuncio importante anunciando el lanzamiento oficial de una nueva función de "tarjeta de desmentido" para combatir la información errónea. Esta medida tiene como objetivo identificar y manejar la información errónea de manera más eficiente, y revelar a los usuarios de manera integral el origen, las causas de la propagación y la verdad de la información errónea.

Apr 9, 2025

Los investigadores de IA de Nvidia presentan la tecnología de fusión FFN: aceleración de la inferencia de modelos de lenguaje grandes

Mar 31, 2025

Plataforma X5 de Tuosda: Rompiendo las barreras de datos entre robots y modelos de lenguaje grandes

En la era del rápido desarrollo de la inteligencia artificial, Tuosda reveló recientemente funciones innovadoras de su nueva generación de plataforma de control robótico, la plataforma X5, en su evento de relaciones con inversores. La plataforma X5 utiliza una arquitectura en la nube, borde y extremo, combinando cómputo de alto rendimiento con control inteligente de robots, logrando la transmisión de datos en tiempo real y la ejecución eficiente de decisiones inteligentes. El lanzamiento de esta plataforma no solo es un complemento poderoso para la tecnología robótica tradicional, sino que también construye un puente de comunicación entre la inteligencia encarnada y las aplicaciones de modelos de lenguaje grandes. En concreto, la plataforma X5...

Mar 16, 2025

Equipo de la CMU presenta Meta Reinforcement Fine-Tuning (MRT): un nuevo paradigma para mejorar la capacidad de razonamiento de los modelos de lenguaje grandes

En el campo de la inteligencia artificial, los modelos de lenguaje grandes (LLM) están en constante evolución. Recientemente, investigadores de la Universidad Carnegie Mellon (CMU) y HuggingFace presentaron un nuevo método llamado "Meta Reinforcement Fine-Tuning" (MRT). Este método busca optimizar la eficiencia computacional de los modelos de lenguaje grandes durante las pruebas, especialmente al resolver problemas complejos de razonamiento, donde muestra un rendimiento excepcional. Los estudios demuestran que los modelos de lenguaje grandes existentes tienen dificultades en el razonamiento...

Mar 13, 2025

ByteDance lanza AIBrix: un nuevo sistema de inferencia de código abierto diseñado para modelos de lenguaje grandes

Feb 28, 2025

El modelo GLM-4-9B de Zhihu logra una tasa de alucinación de solo el 1.3%, liderando la evaluación mundial de modelos de lenguaje grandes

En el campo de la inteligencia artificial, el 'problema de alucinación' de los modelos de lenguaje grandes ha sido un desafío clave para la industria. Recientemente, los resultados de una prueba basada en el sistema de evaluación HHEM-2.1-Open muestran que el modelo GLM-4-9B de Zhihu AI ha presentado resultados notables. Los datos de la prueba muestran que, de los 85 modelos de lenguaje grandes que participaron en la evaluación, GLM-4-9B obtuvo el primer lugar con una tasa de consistencia de hechos del 98.7% y una tasa de respuesta del 100%. Cabe destacar que la tasa de alucinación de este modelo es de solo el 1.3%, un logro significativo.

Jan 10, 2025

3.2k

NVIDIA y universidades presentan "FlashInfer": una nueva biblioteca de núcleos para mejorar la eficiencia de la inferencia de modelos de lenguaje grandes

Con la proliferación de los modelos de lenguaje grandes (LLM) en las aplicaciones modernas de inteligencia artificial, herramientas como los chatbots y los generadores de código dependen de las capacidades de estos modelos. Sin embargo, los problemas de eficiencia en el proceso de inferencia se están volviendo cada vez más pronunciados. Especialmente en el manejo de mecanismos de atención, como FlashAttention y SparseAttention, a menudo se enfrentan a desafíos con cargas de trabajo diversas, patrones de entrada dinámicos y limitaciones de recursos de GPU. Estos desafíos, junto con la alta latencia y los cuellos de botella de memoria

Jan 6, 2025

2.3k

¡Ganar 1 millón de dólares en 20 meses! ¿Cómo lo logró TypingMind, la herramienta de chat con modelos de lenguaje grandes?

TypingMind es una herramienta de terceros diseñada para ofrecer a los usuarios una experiencia mejorada con ChatGPT. Creada por el desarrollador independiente Tony Dinh, admite varios modelos de lenguaje grandes, incluyendo GPT de OpenAI y Claude de Anthropic. Ofrece funciones básicas como chats, listas de múltiples conversaciones y plantillas de indicaciones, sin necesidad de descarga ni instalación, lo que facilita su uso. Esta herramienta también admite la implementación privada, ofreciendo protección de la privacidad de los datos; su modelo de negocio...

Jan 3, 2025

6.4k

SKT lanza servicio de IA para PC: acceso gratuito a múltiples modelos de lenguaje grandes

¡SK Telecom vuelve a dar un gran paso! El martes anunciaron el lanzamiento de la versión para PC de su servicio de Inteligencia Artificial (IA), A., que permite a los usuarios acceder gratuitamente a varios modelos de lenguaje grandes (LLM) a través del sitio web adot.ai, incluyendo el último GPT-4o. Esta versión para PC permite a los usuarios utilizar A. no solo en sus teléfonos móviles, sino que por primera vez también podrán acceder a través de navegadores en computadoras y tabletas. Nota de la imagen: Imagen generada por IA, servicio de autorización de imágenes Midjourney

Oct 22, 2024

1.6k

OpenR: Un innovador framework de código abierto para mejorar la capacidad de razonamiento de los modelos de lenguaje grandes

Recientemente se ha presentado OpenR, un innovador framework de código abierto diseñado para abordar las deficiencias de los modelos de lenguaje grandes (LLM) en tareas de razonamiento complejas. Desarrollado conjuntamente por investigadores de University College London, la Universidad de Liverpool, la Universidad Jiao Tong de Shanghai, la Universidad de Ciencia y Tecnología de Hong Kong (Guangzhou) y la Universidad de Westlake, este framework utiliza el cálculo en tiempo de prueba, el aprendizaje por refuerzo y la supervisión de procesos para mejorar la capacidad de razonamiento de los LLM. Aunque los LLM han mostrado un progreso significativo en la generación de lenguaje, todavía presentan dificultades al abordar tareas complejas como problemas matemáticos, de programación y científicos.

Oct 14, 2024

2.0k

Noticias de IA

IA Diario

Cronología de la IA

Al hardware

Últimos Casos

Colección de Imágenes

Colección de Videos

Colección de Audio

Colección de Contenido

Últimos Tutoriales

Ranking de Productos de IA

Ranking de Crecimiento de Tráfico de IA

Ranking de Descenso de Tráfico de IA

Ranking Semanal de IA

Estados Unidos

China

India

Brasil

Generación de Imágenes

Asistente Personal

Generación de Personajes

Generación de Videos

Ranking de Proyectos de IA

Ranking de Crecimiento de Proyectos de IA

Ranking de Desarrolladores de IA

Ranking de Organizaciones de IA

Deepseek

TTS

LLM

ChatGPT

Visión General