Incidente 357: GPT-2 capaz de recitar información personal identificable (PII) en los datos de entrenamiento

Descripción:

Según se informa, GPT-2 de OpenAI memorizaba y podía regurgitar instancias textuales de datos de entrenamiento, incluida información de identificación personal como nombres, correos electrónicos, cuentas de Twitter y números de teléfono.

Herramientas

Nuevo Informe Nueva Respuesta DescubrirVer Historial

Entidades

Ver todas las entidades

Presunto: un sistema de IA desarrollado e implementado por OpenAI, perjudicó a OpenAI y people having personal data in GPT-2's training data.

Estadísticas de incidentes

357

Cantidad de informes

Fecha del Incidente

2019-02-14

Editores

Dummy Dummy

Applied Taxonomies

MIT

Clasificaciones de la Taxonomía MIT

Machine-Classified

Detalles de la Taxonomía

Risk Subdomain

2.1. Compromise of privacy by obtaining, leaking or correctly inferring sensitive information

Risk Domain

Privacy & Security

Entity

Timing

Post-deployment

Intent

Unintentional

Informes del Incidente

Cronología de Informes

Extracción de datos de entrenamiento de modelos de lenguaje grandes

arxiv.org

¿GPT-2 sabe su número de teléfono?

bair.berkeley.edu

¿Qué sucede cuando su red neuronal masiva de generación de texto comienza a escupir los números de teléfono de las personas? Si eres OpenAI, creas un filtro

theregister.com

arxiv.org · 2020

Traducido por IA

Se ha vuelto común publicar grandes modelos de lenguaje (mil millones de parámetros) que han sido entrenados en conjuntos de datos privados. Este documento demuestra que en tales entornos, un adversario puede realizar un ataque de extracció…

bair.berkeley.edu · 2020

Traducido por IA

Probablemente no. Sin embargo, el [modelo de lenguaje GPT-2] de OpenAI (https://openai.com/blog/better-language-models/) sí sabe cómo comunicarse con un tal Peter W--- (nombre redactado por motivos de privacidad). Cuando se le solicita un b…

theregister.com · 2021

Traducido por IA

Informe especial OpenAI está creando un filtro de contenido para evitar que GPT-3, su última y más grande red neuronal generadora de texto, revele inadvertidamente la información personal de las personas mientras se prepara para comercializ…

Variantes

Una "Variante" es un incidente de IA similar a un caso conocido—tiene los mismos causantes, daños y sistema de IA. En lugar de enumerarlo por separado, lo agrupamos bajo el primer incidente informado. A diferencia de otros incidentes, las variantes no necesitan haber sido informadas fuera de la AIID. Obtenga más información del trabajo de investigación.

¿Has visto algo similar?

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

OpenAI's GPT-3 Associated Muslims with Violence

Incidentes Similares

Por similitud de texto

Did our AI mess up? Flag the unrelated incidents

Incidente 357: GPT-2 capaz de recitar información personal identificable (PII) en los datos de entrenamiento

Herramientas

Entidades

Estadísticas de incidentes

Clasificaciones de la Taxonomía MIT

Informes del Incidente

Cronología de Informes

Extracción de datos de entrenamiento de modelos de lenguaje grandes

¿GPT-2 sabe su número de teléfono?

¿Qué sucede cuando su red neuronal masiva de generación de texto comienza a escupir los números de teléfono de las personas? Si eres OpenAI, creas un filtro

Extracción de datos de entrenamiento de modelos de lenguaje grandes

¿GPT-2 sabe su número de teléfono?

¿Qué sucede cuando su red neuronal masiva de generación de texto comienza a escupir los números de teléfono de las personas? Si eres OpenAI, creas un filtro

Variantes

Incidentes Similares

Por similitud de texto

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate

Incidentes Similares

Por similitud de texto

OpenAI's GPT-3 Associated Muslims with Violence

High-Toxicity Assessed on Text Involving Women and Minority Groups

Gender Biases in Google Translate