Ir al contenido principal
OpenAI

17 de julio de 2025

Recompensas por la detección de errores en materia de biología

Prueba de jailbreaks universales frente a riesgos biológicos en el agente de ChatGPT

Invitación

Como parte de nuestros esfuerzos para reforzar nuestra medidas de seguridad en capacidades de IA avanzadas en biología, abrimos las solicitudes para participar en nuestro programa de recompensas por la detección de errores en materia de biología. Hemos implementado el modelo de agente de ChatGPT y estamos trabajando activamente para reforzar aún más las medidas de seguridad y las de otros modelos. Invitamos a investigadores con experiencia en pruebas de equipo rojo de IA, seguridad o riesgos químicos y biológicos a intentar encontrar un jailbreak universal que pueda superar nuestro reto bioquímico de 10 niveles.

Vista general del programa

  • Modelo contemplado en el alcance: solo el agente de ChatGPT.
  • Objetivo: Encontrar una única indicación de jailbreak universal para responder correctamente a 10 preguntas sobre seguridad biológica/química desde un chat nuevo.
  • Recompensas:
    • 25 000 $ al primer jailbreak universal que funcione para responder las 10 preguntas.
    • 10 000 $ al primer equipo que responda a las 10 preguntas con varias indicaciones de jailbreak.
    • Se podrán otorgar otros premios menores por logros parciales, a nuestra discreción.
  • Plazo: las solicitudes se abren el 17 de julio de 2025, con admisiones continuas. Las pruebas comienzan el 29 de julio de 2025.
  • Acceso: mediante solicitud e invitación. Extenderemos invitaciones a una lista verificada de expertos de confianza en equipo rojo y biología y revisaremos las nuevas solicitudes. Una vez seleccionados, los candidatos aceptados se incorporarán a la plataforma de recompensas por la detección de errores en materia de biología.
  • Divulgación: todas las indicaciones, finalizaciones, hallazgos y comunicaciones están protegidos por un acuerdo de confidencialidad.

Cómo postular

Envía aquí(se abre en una ventana nueva) una solicitud breve con tu nombre, afiliación, trayectoria resumida y un plan de 150 palabras antes del 29 de julio de 2025. Los solicitantes y colaboradores aceptados deben tener una cuenta previa de ChatGPT para postular y firmarán un acuerdo de confidencialidad.

Envía tu solicitud y contribuye a mejorar la seguridad de la IA del futuro.

Apúntate al programa de recompensas por la detección de errores en materia de biología de OpenAI

Autor

OpenAI