Incidente 1238: Se informa que los modelos OpenAI ChatGPT fueron liberados para proporcionar instrucciones sobre armas químicas, biológicas y nucleares.
Descripción: Una investigación de NBC News descubrió que los modelos de lenguaje de OpenAI o4-mini, GPT-5-mini, oss-20b y oss-120b podían ser liberados en condiciones normales de uso para eludir las medidas de seguridad y generar instrucciones detalladas para la creación de armas químicas, biológicas y nucleares. Mediante un mensaje de liberación documentado públicamente, los reporteros obtuvieron repetidamente resultados peligrosos, como pasos para sintetizar patógenos o maximizar el daño con agentes químicos. Los hallazgos revelaron importantes fallos de seguridad en situaciones reales, lo que impulsó a OpenAI a implementar nuevas medidas de mitigación.
Entidades
Ver todas las entidadesPresunto: un sistema de IA desarrollado e implementado por OpenAI , oss-20b , oss-120b , GPT-5-mini , ChatGPT y 04-mini, perjudicó a Public safety , National security stakeholders y General public.
Estadísticas de incidentes
ID
1238
Cantidad de informes
1
Fecha del Incidente
2025-10-10
Editores
Dummy Dummy
Informes del Incidente
Cronología de Informes
Loading...

ChatGPT de OpenAI cuenta con barreras de seguridad que, supuestamente, impiden que los usuarios generen información que pueda utilizarse con fines catastróficos, como la fabricación de armas biológicas o nucleares.
Sin embargo, estas barrer…
Variantes
Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.
¿Has visto algo similar?
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Loading...

Hackers Break Apple Face ID
 · 24 informes
Incidentes Similares
Did our AI mess up? Flag the unrelated incidents
Loading...

Hackers Break Apple Face ID
 · 24 informes

