3 de octubre de 2024

Presentamos canvas

Una nueva forma de trabajar con ChatGPT para escribir y codificar

En la imagen se muestra una barra de herramientas vertical con cinco íconos dispuestos en una columna sobre un fondo pastel suave. El tercer ícono, que representa un libro abierto, está resaltado con una etiqueta que dice “Nivel de lectura”.

Cargando...

Presentamos canvas, una nueva interfaz para trabajar con ChatGPT en proyectos de escritura y codificación que van más allá de un simple chat. Canvas se abre en una ventana aparte, lo que te permite colaborar con ChatGPT en un proyecto. Esta beta anticipada presenta una nueva forma de trabajar juntos, no solo a través de una conversación, sino al crear ideas y someterlas a un ajuste fino al mismo tiempo.

Canvas se creó con GPT‑4o y se puede seleccionar manualmente en el selector de modelos mientras está en fase beta. A partir de hoy, estamos implementando canvas para usuarios de ChatGPT Plus y Team a nivel mundial. Los usuarios de Enterprise y Edu tendrán acceso la próxima semana. También planeamos que canvas esté disponible para todos los usuarios de la versión gratuita de ChatGPT cuando finalice la fase beta.

Mejor colaboración con ChatGPT

Las personas usan ChatGPT todos los días para que les ayude a escribir y codificar. Aunque la interfaz de chat es fácil de usar y funciona bien para muchas tareas, es limitada cuando quieres trabajar en proyectos que requieren edición y revisión. Canvas ofrece una nueva interfaz para este tipo de trabajo.

Con canvas, ChatGPT puede comprender mejor el contexto de lo que intentas conseguir. Puedes resaltar secciones específicas para indicar exactamente en lo que quieres que ChatGPT se enfoque. Al igual que ocurre con un editor o revisor de códigos, puede dar comentarios y sugerencias en línea con todo el proyecto en mente.

No solo puedes controlar el proyecto en canvas, sino que puedes editar directamente texto o código. Hay un menú de atajos para que pidas a ChatGPT que ajuste la longitud de escritura, elimine los errores en el código y realice rápidamente otras acciones útiles. También puedes restaurar versiones previas de tu trabajo usando el botón de “atrás” en canvas.

Canvas se abre automáticamente cuando ChatGPT detecta un escenario en el que podría ser útil. También puedes incluir “usar canvas” en tu prompt para abrirla y usarla para trabajar en un proyecto existente.

Escribir atajos incluye:

Sugerir ediciones. ChatGPT ofrece sugerencias y comentarios en línea.
Ajustar la longitud. Edita la longitud del documento para que sea más corto o más largo.
Cambiar el nivel de lectura. Ajusta el nivel de lectura de jardín de infantes a escuela de posgrado.
Agregar pulido final. Comprueba gramática, claridad y consistencia.
Agregar emojis. Agrega emojis relevantes para énfasis y color.

Codificación en canvas

La codificación es un proceso iterativo y puede ser difícil de seguir todas las revisiones de tu código en un chat. Canvas facilita hacer seguimiento y comprender los cambios de ChatGPT y planeamos continuar mejorando la transparencia en estos tipos de ediciones.

Codificar atajos incluye:

Revisar código. ChatGPT proporciona sugerencias en línea para mejorar tu código.
Agregar registros. Inserta declaraciones de impresión para ayudarte a eliminar los errores y comprender el código.
Agregar comentarios. Agrega comentarios al código para facilitar su comprensión.
Corregir errores. Detecta y reescribe código problemático para resolver errores.
Transfiere a un lenguaje. Traduce tu código a JavaScript, TypeScript, Python, Java, C++ o PHP.

Entrenar al modelo para que se convierta en un colaborador

Entrenamos a GPT‑4o para colaborar como un socio creativo. El modelo sabe cuándo abrir un canvas, hacer ediciones específicas y reescribir por completo. También comprende un contexto más amplio para proporcionar comentarios y sugerencias precisas.

Para apoyar esto, nuestro equipo de investigación desarrolló los siguientes comportamientos principales:

Activar el canvas para escribir y codificar
Generar tipos de contenido diversos
Hacer ediciones específicas
Reescribir documentos
Proporcionar crítica en línea

Medimos el progreso con más de 20 evaluaciones internas automatizadas. Usamos técnicas de generación de datos sintéticos como datos de salida destilados de OpenAI o1‑preview, para entrenar posteriormente el modelo para sus comportamientos principales. Este enfoque nos permitió abordar rápidamente la calidad de escritura y nuevas interacciones de usuarios, todo ello sin depender de datos generados por humanos.

Un desafío clave fue definir cuándo activar un canvas. Le enseñamos al modelo a abrir un canvas para prompts como “Escribe una entrada de blog sobre la historia de los granos de café” y evitar la sobreactivación de tareas generales de control de calidad como “Ayúdame a cocinar una receta nueva para la cena”. Para tareas de escritura, priorizamos mejorar “disparadores correctos” (a expensas de “no disparadores correctos”), lo que llega a un 83 % en comparación con un GPT‑4o de referencia con técnica zero-shot (disparo cero) cuando se le piden instrucciones.

Vale la pena destacar que la calidad de tales puntos de referencia es altamente sensible al prompt específico utilizado. Con distintos prompts, el punto de referencia puede tener un desempeño deficiente, pero de otra forma; por ejemplo, al ser impreciso de forma uniforme en tareas de codificación y redacción, lo que resulta en una distribución de errores diferente y formas alternativas de rendimiento subóptimo. Para codificar, sesgamos de forma intencional el modelo contra la activación a fin de evitar afectar a nuestros usuarios avanzados. Continuaremos haciendo ajustes en función de los comentarios de usuarios.

Activador de límites de decisión del Lienzo: Escritura y codificación

Para tareas de escritura y codificación, mejoramos correctamente la activación del límite de decisión de canvas, llegando a un 83 y 94 % respectivamente en comparación con un GPT‑4o de técnica zero-shot de referencia cuando se le piden instrucciones.

Un segundo desafío comprendió ajustar el comportamiento de edición del modelo una vez que se activó el canvas, específicamente al decidir cuándo hacer una edición determinada en comparación con reescribir todo el contenido. Entrenamos el modelo para realizar ediciones específicas cuando los usuarios explícitamente seleccionan texto mediante la interfaz, de lo contrario, favorece las reescrituras. Este comportamiento continúa evolucionando a medida que refinamos el modelo.

Límites de edición de Lienzo: Escritura y codificación

Para tareas de escritura y codificación, priorizamos mejorar ediciones específicas en canvas. GPT‑4o con canvas se desempeña mejor que un GPT‑4o con prompts de referencia en un 18 %.

Por último, entrenar al modelo para generar comentarios de alta calidad requirió una iteración cuidadosa. A diferencia de los primeros dos casos, que son fácilmente adaptables a una evaluación automatizada con revisiones manuales exhaustivas, la medición de calidad de forma automatizada es particularmente desafiante. Por lo tanto, usamos evaluaciones humanas para evaluar la calidad y precisión de los comentarios. Nuestro modelo de canvas integrado consigue mejores resultados con GPT‑4o de técnica zero-shot mediante la solicitud de instrucciones en un 30 % de exactitud y 16 % de calidad, lo que muestra que el entrenamiento sintético mejora significativamente la calidad de respuesta y el comportamiento en comparación con la indicación de zero-shot con instrucciones detalladas.

Canvas Suggested Comments

Las evaluaciones humanas evaluaron la calidad de comentarios y funcionalidad de exactitud de canvas. Nuestro modelo de canvas consigue mejores resultados que GPT‑4o con técnica zero-shot cuando se le piden instrucciones con una mejora del 30 % en exactitud y 16 % en calidad.

¿Qué sigue?

Hacer que la IA sea más útil y accesible requiere repensar cómo interactuar con esta. Canvas es un enfoque nuevo y la primera actualización grande a la interfaz visual de ChatGPT desde que lo lanzamos hace dos años.

Canvas es una primera versión beta y planeamos mejorar rápidamente sus capacidades.

Autor

OpenAI

Jefe de investigación

Karina Nguyen

Investigación principal

Kai Chen, Michael Wu, Tarun Gogineni

Ingeniería básica, producto, diseño

Alexi Christakis, Bryan Ashley, Bryant Jow, Chris Haugli, Daniel Levine, Eric Jiang, Gabriel Peal, Lee Byron, Lukas Gross, Matt Lim, Sara Culver, Thomas Dimson

Contribuidores

Andrew Gibiansky, Andrew Howell, Arianna McClain, David Li, Doug Li, Ilya Kostrikov, Katy Shi, Noah Deutsch, Randall Lin, Sara Culver, Sean Fitzgerald, Shuaiqi Xia, Spencer Papay, Thomas Shadwell, Valerie Qi, Xiaolin Hao, Yilei Qian

Liderazgo de soporte

Akshay Nathan, Barret Zoph, Ian Silber, Joanne Jang, John Schulman, Kevin Weil, Mia Glaese, Mira Murati, Nick Turley, Sam Altman, Sulman Choudhry