Estudio: Los modelos de IA aún no son buenos generando código limpio. La tasa de uso incorrecto de la API de GPT-4 alcanza el 62%

站长之家

Publicado elNoticias de IA · 2 minutos de lectura · Aug 30, 2023

Evaluación de Modelos de Lenguaje Grande en la Generación de Código Java

Científicos de la computación evaluaron la capacidad de varios modelos de lenguaje grande (LLM) para responder preguntas de codificación Java en StackOverflow, descubriendo que la calidad del código generado aún deja mucho que desear.

Los investigadores recopilaron 1208 preguntas de codificación Java de StackOverflow, que involucraban 24 API comunes de Java. Luego, utilizaron 4 LLM con capacidad de generación de código para responder a estas preguntas y evaluaron las respuestas utilizando RobustAPI, un verificador de API desarrollado por ellos mismos.

Los resultados mostraron que GPT-3.5 y GPT-4 tuvieron tasas de uso incorrecto de API del 49.83% y 62.09%, respectivamente.

El estudio concluye que existe una brecha significativa entre la mejora en la capacidad de generación de código de los LLM y la fiabilidad y robustez del código generado, y que aún hay margen de mejora.

¡Evolución de la capacidad de programación de la IA! Mejorar la calidad del código mediante la optimización continua de modelos grandes

En los últimos años, la capacidad de programación de la inteligencia artificial (IA) ha evolucionado constantemente, pero aún no ha alcanzado la perfección. Recientemente, Max Woolf, científico de datos senior de BuzzFeed, descubrió a través de un experimento que, si se proporcionan continuamente indicaciones de "escribir un código mejor" a los modelos de lenguaje grandes (LLM), la IA puede generar código de mayor calidad. Este descubrimiento ha generado un gran interés, y destacados científicos de IA han mostrado un gran interés, enfatizando la importancia de la iteración y el diseño de las indicaciones. En el experimento de Woolf,

OpenAI lanza CriticGPT: un nuevo modelo para mejorar la calidad del código de IA

Investigadores de OpenAI anunciaron el jueves el lanzamiento de CriticGPT, un innovador modelo de IA diseñado para identificar y corregir errores en el código generado por ChatGPT. Este avance significativo representa un paso importante en la automejora y el control de calidad de la tecnología de inteligencia artificial.

Encuesta: El 57% de los encuestados cree que la IA mejora la calidad del código

El 42% de los participantes en la encuesta ya utiliza la inteligencia artificial en el desarrollo de software. El 57% de los profesionales encuestados considera que la IA mejora la calidad del código. El 46% de los encuestados afirma que su satisfacción laboral ha aumentado. El 44% de los participantes en la encuesta señala que la IA ha supuesto un ahorro de costes.

Noticias de IA

Estudio: Los modelos de IA aún no son buenos generando código limpio. La tasa de uso incorrecto de la API de GPT-4 alcanza el 62%

站长之家

Noticias de IA relacionadas recomendadas

¡Evolución de la capacidad de programación de la IA! Mejorar la calidad del código mediante la optimización continua de modelos grandes

OpenAI lanza CriticGPT: un nuevo modelo para mejorar la calidad del código de IA

Encuesta: El 57% de los encuestados cree que la IA mejora la calidad del código