Concurso Mundial de Modelos de Lenguaje Grande 2023: Lanzamiento de la Plataforma de Evaluación en Chino

量子位

Publicado elNoticias de IA · 2 minutos de lectura · Oct 17, 2023

178

Resultados de los Modelos de Lenguaje Grande en 2023

En la competencia mundial de modelos de lenguaje grande de 2023, el desempeño de los modelos de lenguaje grande en chino atrajo mucha atención. La Universidad China de Hong Kong lanzó la plataforma de evaluación CLEVA para chino, que incluye tareas y métricas de evaluación integrales.

CLEVA se centra en una variedad de métricas, como la precisión, la robustez, la equidad, la eficiencia, la calibración y la diversidad. Simultáneamente, proporciona diversas plantillas de indicaciones para asegurar la equidad de la evaluación y el análisis del rendimiento del modelo. CLEVA también emplea varios métodos para mitigar el riesgo de contaminación de datos y ofrece una interfaz fácil de usar.

OpenAI insta a la administración central de EE. UU. a fortalecer la regulación de la inteligencia artificial

OpenAI, en una consulta reciente al gobierno de EE. UU. sobre la regulación de la inteligencia artificial, abogó por una supervisión federal de la IA en lugar de que los estados individuales establezcan regulaciones más estrictas. La empresa argumenta que una regulación federal unificada impulsaría la innovación estadounidense en IA y reduciría las inconsistencias entre las regulaciones estatales. Nota sobre la imagen: Imagen generada por IA, servicio de licencia de imágenes Midjourney. En este documento de 15 páginas, OpenAI señala que las medidas de regulación de la IA en China podrían perjudicar a la apertura de EE. UU.

Pekín creará 11 escenarios de aplicación de inteligencia artificial en escuelas primarias y secundarias y lanzará 7 avatares inteligentes de 'Jingwa'

Según un informe de CCTV News, la Comisión Municipal de Educación de Beijing anunció que este año se centrará en el desarrollo de los primeros 11 escenarios de aplicación de inteligencia artificial en las escuelas primarias y secundarias, y lanzará la creación de 7 avatares inteligentes de 'Jingwa'. El objetivo es utilizar la tecnología de inteligencia artificial para potenciar el sistema de desarrollo integral de las cinco áreas educativas y ayudar a los estudiantes a lograr un desarrollo personalizado y diversificado. Estos escenarios de aplicación incluyen ayudantes de IA para la preparación inteligente de lecciones, el monitoreo inteligente de la calidad de las clases, y tareas/creación inteligente; aprendizaje asistido por IA para el análisis inteligente de errores y la recomendación de recursos, la corrección de escritura autónoma y el asistente de aprendizaje de idiomas extranjeros; apoyo educativo por IA para deportes inteligentes y asistentes de salud mental; y evaluación asistida por IA para...

Equipo de la CMU presenta Meta Reinforcement Fine-Tuning (MRT): un nuevo paradigma para mejorar la capacidad de razonamiento de los modelos de lenguaje grandes

En el campo de la inteligencia artificial, los modelos de lenguaje grandes (LLM) están en constante evolución. Recientemente, investigadores de la Universidad Carnegie Mellon (CMU) y HuggingFace presentaron un nuevo método llamado "Meta Reinforcement Fine-Tuning" (MRT). Este método busca optimizar la eficiencia computacional de los modelos de lenguaje grandes durante las pruebas, especialmente al resolver problemas complejos de razonamiento, donde muestra un rendimiento excepcional. Los estudios demuestran que los modelos de lenguaje grandes existentes tienen dificultades en el razonamiento...

Noticias de IA

Concurso Mundial de Modelos de Lenguaje Grande 2023: Lanzamiento de la Plataforma de Evaluación en Chino

量子位

Noticias de IA relacionadas recomendadas

OpenAI insta a la administración central de EE. UU. a fortalecer la regulación de la inteligencia artificial

Pekín creará 11 escenarios de aplicación de inteligencia artificial en escuelas primarias y secundarias y lanzará 7 avatares inteligentes de 'Jingwa'

Equipo de la CMU presenta Meta Reinforcement Fine-Tuning (MRT): un nuevo paradigma para mejorar la capacidad de razonamiento de los modelos de lenguaje grandes

Manus y Alibaba Cloud Tongyi Qianwen colaboran para impulsar productos de agentes de IA nacionales