Anexo a la tarjeta del sistema de GPT‑5: Conversaciones sensibles
Cuando lanzamos GPT‑5, señalamos en la tarjeta del sistema que nos estábamos esforzando por establecer mejores puntos de referencia y mejorar aún más la seguridad del modelo en áreas relacionadas con el malestar mental y emocional. El 3 de octubre, introdujimos una actualización(se abre en una nueva ventana) que respondía a esos esfuerzos, ya que mejoraba el modelo predeterminado de ChatGPT para poder reconocer y apoyar mejor a las personas en momentos de angustia. Trabajamos con más de 170 expertos en salud mental para que ChatGPT reconozca de forma más confiable los signos de angustia y pueda responder cuidadosamente, guiando a las personas hacia apoyo real y reduciendo las respuestas que no cumplen con nuestro comportamiento deseado en un 65 a 80 %.
Al respecto, vamos a publicar una entrada en el blog con más información sobre este trabajo y este anexo a la ficha del sistema de GPT‑5 para compartir evaluaciones de seguridad de referencia. Estas evaluaciones comparan la versión del 15 de agosto(se abre en una nueva ventana) del modelo predeterminado de ChatGPT, también conocido como GPT‑5 Instant, con la versión actualizada lanzada el 3 de octubre.


