3 de octubre de 2024

Presentamos canvas

Una nueva forma de trabajar con ChatGPT para escribir y programar.

Una barra de herramientas vertical que contiene cinco iconos dispuestos en una columna sobre un fondo de suave tono pastel. El tercer icono desde arriba representa un libro abierto y se destaca con la etiqueta «Nivel de lectura» junto a él.

Cargando…

Presentamos canvas, una nueva interfaz para trabajar con ChatGPT en proyectos de escritura y programación más complejos que el simple chat. Canvas se abre en una ventana independiente que permite al usuario y ChatGPT colaborar en un proyecto. Esta versión beta inicial supone una forma nueva de colaborar, no solo a través de la conversación, sino también mediante la creación y el perfeccionamiento de ideas de manera conjunta.

Canvas se ha creado con GPT‑4o y se puede seleccionar manualmente en el selector de modelos en beta. A partir de hoy, canvas estará disponible para los usuarios de ChatGPT Plus y Team a nivel mundial. Los usuarios de Enterprise y Edu tendrán acceso la próxima semana. También prevemos conceder acceso a todos los usuarios con una cuenta gratuita de ChatGPT una vez superada la fase beta.

Mejor colaboración con ChatGPT

La gente usa ChatGPT cada día para que les ayude a escribir y programar. Aunque la interfaz del chat es fácil de usar y funciona bien para muchas tareas, es limitada si quieres trabajar en proyectos que requieran edición y revisión. Canvas ofrece una nueva interfaz para este tipo de tareas.

Con canvas, ChatGPT puede entender mejor el contexto de lo que estás intentando lograr. Puedes resaltar secciones concretas para indicar exactamente en qué quieres que se centre ChatGPT. Como un corrector de textos o revisor de código, puede insertar comentarios y sugerencias teniendo en cuenta todo el proyecto.

Tú controlas el proyecto en canvas. Puedes editar texto o código directamente. Hay un menú de atajos de teclado para pedirle a ChatGPT que ajuste la longitud de escritura, depure el código y realice otras acciones útiles de forma rápida. Asimismo, puedes restaurar versiones anteriores de tu trabajo usando el botón para volver atrás en canvas.

Canvas se abre automáticamente cuando ChatGPT detecta una situación en la que pueda ser útil. También puedes incluir «usar canvas» en tu prompt para que se abra y poder utilizarlo en un proyecto en el que estés trabajando.

Los atajos de teclado de escritura incluyen:

Sugerir modificaciones: ChatGPT inserta sugerencias y comentarios.
Ajustar la longitud: modifica la longitud del documento para que sea más corto o largo.
Cambiar el nivel de lectura: adapta el nivel de lectura, desde el infantil hasta el universitario.
Añadir los últimos retoques: comprueba la gramática, la claridad y la coherencia.
Incorporar emojis: agrega los emojis pertinentes para dar énfasis y color.

Programar en canvas

Programar es un proceso repetitivo y puede ser difícil seguir todas las revisiones del código en un chat. Canvas facilita la detección y comprensión de los cambios de ChatGPT; además, prevemos continuar mejorando la transparencia en estos tipos de cambios.

Los atajos de teclado de programación incluyen:

Revisar el código: ChatGPT inserta sugerencias para mejorar el código.
Añadir registros: inserta declaraciones impresas para ayudarte a depurar el código y entenderlo.
Incorporar comentarios: agrega comentarios al código para facilitar su comprensión.
Corregir errores: detecta y reescribe código problemático para resolver errores.
Cambiar de lenguaje: traduce tu código a JavaScript, TypeScript, Python, Java, C++ o PHP.

Entrenar el modelo para convertirse en colaborador

Entrenamos GPT‑4o para que colabore contigo como si fuera un socio creativo. El modelo sabe cuándo abrir un canvas, realizar cambios específicos y reescribir por completo. También entiende el contexto general para proporcionar comentarios y sugerencias precisos.

Para hacer esto posible, nuestro equipo de investigación creo los siguientes comportamientos clave:

Activar canvas para escribir y programar
Generar diversos tipos de contenido
Realizar cambios específicos
Reescribir documentos
Insertar críticas

Medimos los avances con más de 20 evaluaciones internas automatizadas. Utilizamos novedosas técnicas de generación de datos artificiales, como el filtrado de los resultados de OpenAI o1‑preview, para el entrenamiento posterior del modelo en sus comportamientos clave. Este planteamiento nos permitió ocuparnos rápidamente de la calidad de escritura y las interacciones de los nuevos usuarios, todo ello sin depender de datos generados por humanos.

Una dificultad esencial fue definir cuándo activar canvas. Enseñamos al modelo a abrir canvas para prompts como «Escribe una publicación de blog sobre la historia de los granos de café» y, al mismo tiempo, evitar que se active en exceso en tareas de preguntas y respuestas generales como «Ayúdame a cocinar una nueva receta para cenar». En las tareas de escritura, priorizamos la mejora de las «activaciones correctas» (en detrimento de las «no activaciones correctas»), que alcanzó el 83 % frente al GPT‑4o zero shot de referencia con entrada de prompts.

Cabe señalar que la calidad de tales puntos de referencia es muy sensible al prompt específico utilizado. Con diferentes prompts, el punto de referencia podría incluso mostrar un rendimiento mediocre, pero de una forma distinta, por ejemplo, con una imprecisión uniforme en las tareas de programación y escritura que provocaría la distribución diferente de errores y formas alternativas de rendimiento ineficiente. En la programación, introdujimos a propósito en el modelo una tendencia contraria a la activación para evitar interrumpir a los usuarios avanzados. Continuaremos perfeccionándolo en función de los comentarios de nuestros usuarios.

Activador del límite de decisión en el lienzo – Escritura y programación

En las tareas de escritura y programación, mejoramos la activación correcta del límite de decisión de canvas, que representa el 83 % y el 94 %, respectivamente, frente al GPT‑4o zero shot de referencia con entrada de prompts.

Una segunda dificultad consistió en ajustar el comportamiento de edición del modelo una vez activado canvas; en concreto, decidir cuándo realizar un cambio específico o reescribir el contenido por completo. Entrenamos el modelo para llevar a cabo cambios específicos cuando los usuarios seleccionan de forma expresa un texto a través de la interfaz; de lo contrario, se favorece la reescritura. Este comportamiento sigue evolucionando a medida que mejoramos el modelo.

Límite de cambios en el lienzo – Escritura y programación

En las tareas de escritura y programación, priorizamos mejorar los cambios específicos de canvas. GPT‑4o con canvas funciona un 18 % mejor que el GPT‑4o de referencia con prompts.

Por último, el entrenamiento del modelo para generar comentarios de gran calidad exigió una iteración minuciosa. A diferencia de los primeros dos casos, que se adaptan fácilmente a la evaluación automatizada con revisiones manuales rigurosas, medir la calidad de modo automatizado reviste una dificultad particular. Por lo tanto, usamos evaluaciones humanas para valorar la calidad y precisión de los comentarios. Nuestro modelo integrado de canvas supera al GPT‑4o zero shot con entrada de prompts en un 30 % en precisión y un 16 % en calidad, lo cual demuestra que el entrenamiento artificial mejora de forma significativa la calidad de las respuestas y el comportamiento frente a la entrada de prompts zero shot con instrucciones detalladas.

Canvas Suggested Comments

Los evaluadores humanos valoraron la calidad de los comentarios y la precisión de las funciones de canvas. Nuestro modelo de canvas supera al GPT‑4o zero shot con entrada de prompts en un 30 % en cuanto a precisión y un 16 % en calidad.

¿Cuáles son las perspectivas de futuro?

Hacer que la IA sea más útil y accesible requiere reflexionar sobre cómo interactuamos con ella. Canvas es un nuevo enfoque y la primera actualización importante de la interfaz visual de ChatGPT desde que lo estrenamos hace dos años.

Canvas está en una etapa beta inicial y prevemos mejorar rápidamente sus funciones.

Autor

OpenAI

Dirección de investigación

Karina Nguyen

Investigación principal

Kai Chen, Michael Wu y Tarun Gogineni

Ingeniería principal, producto y diseño

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver y Thomas Dimson

Contribuidores

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao y Yilei Qian

Liderazgo de apoyo

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman y Sulman Choudhry