Usuarios internacionales han descubierto una nueva técnica de evasión que utiliza prompts desordenados para eludir los filtros de seguridad tradicionales y hacer que ChatGPT genere ransomware. El investigador Jim Fan se sorprendió de que el modelo GPT pudiera comprender palabras fuera de orden. Esta técnica, que aprovecha la capacidad del cerebro humano para entender frases y palabras desordenadas, ha logrado la evasión y ha generado preocupación en la comunidad.
Un código desordenado permite a ChatGPT 'escapar'. Un prompt aleatorio hace que el LLM genere rápidamente software de extorsión, Jim Fan está sorprendido

新智元
43
© Todos los derechos reservados AIbase 2024, haz clic para ver la fuente original - https://www.aibase.com/es/news/643