Question 1

¿Cuál de las siguientes técnicas es fundamental para mitigar el riesgo de 'envenenamiento de datos' (data poisoning) en modelos de aprendizaje automático supervisado?

Accepted Answer

Implementar técnicas de validación y saneamiento de datos de entrenamiento, como la detección de anomalías y la eliminación de puntos de datos atípicos sospechosos.. El envenenamiento de datos es un ataque adversarial donde se introducen datos maliciosos en el conjunto de entrenamiento para corromper el modelo resultante. La validación y el saneamiento de datos son defensas esenciales para detectar y eliminar estos puntos de datos corruptos antes de que afecten el entrenamiento del modelo.

Question 2

En el contexto de la seguridad de la IA, ¿qué representa el 'ataque de evasión' (evasion attack) contra un modelo de clasificación?

Accepted Answer

Crear entradas adversarias sutilmente modificadas que el modelo clasifica erróneamente, a pesar de ser casi indistinguibles para los humanos.. Los ataques de evasión son una clase de ataques adversarios que se dirigen a modelos de IA *después* de su entrenamiento. El objetivo es diseñar entradas maliciosas, a menudo con modificaciones imperceptibles para los humanos, que hagan que el modelo cometa errores de clasificación, demostrando la fragilidad de las fronteras de decisión aprendidas.

Question 3

¿Qué enfoque de seguridad es más apropiado para proteger los modelos de IA contra ataques de 'envenenamiento de prompts' (prompt poisoning) en sistemas de procesamiento de lenguaje natural (PLN) basados en grandes modelos de lenguaje (LLM)?

Accepted Answer

Validar y sanear rigurosamente todas las entradas del usuario (prompts) para detectar y eliminar instrucciones maliciosas o contenido sospechoso.. El envenenamiento de prompts es un ataque contra LLMs donde las entradas del usuario (prompts) contienen instrucciones ocultas o maliciosas diseñadas para manipular el comportamiento del modelo, como la generación de contenido dañino o la revelación de información. El saneamiento y la validación de los prompts son defensas cruciales para mitigar este riesgo.

Question 4

¿Cuál es la principal diferencia entre un ataque de 'infección de modelo' (model stealing) y un ataque de 'infección de pertenencia' (membership inference attack) en el contexto de la seguridad de la IA?

Accepted Answer

La infección de modelo busca robar la propiedad intelectual del modelo, mientras que la inferencia de pertenencia busca exponer datos privados.. Los ataques de extracción de información de modelos de IA incluyen el 'robo de modelos' (model stealing), cuyo objetivo es crear una copia o un sustituto del modelo objetivo, y la 'inferencia de pertenencia' (membership inference), que busca determinar si un dato específico se utilizó en el entrenamiento. Ambos explotan el acceso a las predicciones del modelo, pero tienen objetivos distintos: propiedad intelectual versus privacidad de datos.

Guía ISACA AAISM - Advanced in AI Security Management

¿Cuál de las siguientes técnicas es fundamental para mitigar el riesgo de 'envenenamiento de datos' (data poisoning) en modelos de aprendizaje automático supervisado?

En el contexto de la seguridad de la IA, ¿qué representa el 'ataque de evasión' (evasion attack) contra un modelo de clasificación?

¿Qué enfoque de seguridad es más apropiado para proteger los modelos de IA contra ataques de 'envenenamiento de prompts' (prompt poisoning) en sistemas de procesamiento de lenguaje natural (PLN) basados en grandes modelos de lenguaje (LLM)?

¿Cuál es la principal diferencia entre un ataque de 'infección de modelo' (model stealing) y un ataque de 'infección de pertenencia' (membership inference attack) en el contexto de la seguridad de la IA?

Related Certifications

Local Testing

Careers