Nuevas funciones de nivel empresarial para clientes de la API

Ayudamos a muchas empresas como Klarna, Morgan Stanley, Oscar, Salesforce y Wix a diseñar desde cero soluciones asistidas por IA y a desplegar la inteligencia artificial en sus organizaciones y productos con total seguridad. Hemos desarrollado una serie de funciones que ayudarán a las empresas, pero también a los desarrolladores que usan nuestra plataforma para escalar sus proyectos.
Hemos introducido Private Link, un sistema que los clientes pueden usar para entablar una comunicación directa entre Azure y OpenAI minimizando su exposición en internet. Asimismo, hemos lanzado una autenticación multifactor(se abre en una ventana nueva) nativa (MFA) para favorecer el cumplimiento normativo a partir de requisitos de acceso más estrictos. Estas nuevas incorporaciones se suman a nuestro abanico de funciones de seguridad empresarial(se abre en una ventana nueva), entre las que destacan la certificación SOC 2 de tipo II, el inicio de sesión único (SSO), el cifrado de datos en reposo mediante AES-256, el cifrado de los datos en tránsito con TLS 1.2 y los controles de acceso basados en funciones. También hemos puesto en marcha acuerdos de asociación comercial(se abre en una ventana nueva) para las empresas del sector sanitario, para las cuales el cumplimiento de las normas HIPAA es un requisito indispensable, así como una política de retención cero de datos para los clientes de la API con determinados caso de uso.
Gracias a la nueva función Projects(se abre en una ventana nueva), las empresas dispondrán de una visión y un control más exhaustivos sobre cada proyecto que lleven a cabo en OpenAI. Projects permite, por ejemplo, delimitar el alcance de los roles y las claves API en función del proyecto, restringir o autorizar el acceso a determinados modelos y establecer límites de uso o frecuencia para otorgar permisos y evitar sobrecostes inesperados. Los responsables de los proyectos también podrán crear claves API para cuentas de servicio a fin de dar acceso a los proyectos en general, y no a usuarios en particular.

Hemos introducido una serie de mejoras en Assistants API para que encuentre información de forma más rápida y precisa, para que sea más flexible a la hora de usar herramientas y modelos para desempeñar tareas, y para que sea más eficiente en el control de costes. Entre estas funciones destacan:
- Mayor velocidad de recuperación de datos con «file_search», que permite procesar hasta 10 000 archivos por asistente, una cifra 500 veces superior al límite anterior de 20 archivos. Como resultado, la API trabaja más rápido, admite preguntas en paralelo a partir de búsquedas multihilo y presenta una mayor capacidad para reclasificar los resultados y reescribir las consultas.
- Respuestas progresivas para interacciones en tiempo real y en tono conversacional, una de las demandas más recurrentes entre las empresas y los desarrolladores.
Nuevos objetos «vector_store» en la API, función que permite añadir archivos a un almacén de vectores para luego analizarlos, fragmentarlos e integrarlos con la finalidad de facilitar la búsqueda de contenido en archivos. Los almacenes de vectores pueden usarse en diversos asistentes e hilos, lo que simplifica la gestión de archivos y la facturación. - Control sobre la cantidad máxima de tokens que pueden usarse por solicitud, además de límites a los mensajes anteriores y recientes empleados en cada solicitud, lo que permite optimizar los costes asociados al uso de tokens.
Nuevo parámetro «tool_choice» para seleccionar una herramienta específica (como «file_search», «code_interpreter» o «function») en una solicitud determinada. - Compatibilidad con los modelos GPT‑3.5 Turbo optimizados en la API (para empezar, admitiremos la versión gpt-3.5-turbo-0125 optimizada).

A fin de ayudar a las empresas a escalar su uso de la inteligencia artificial sin pasarse de presupuesto, hemos incorporado dos métodos para abaratar los costes en los flujos de trabajo sistemáticos y asincrónicos:
- Descuento por volumen acordado: los clientes que usan un nivel de tokens por minuto (TPM) uniforme en los modelos GPT‑4 o GPT‑4 Turbo pueden acogerse a este método para beneficiarse de descuentos de entre el 10 y el 50 %, en función del volumen acordado.
- Reducción de costes en flujos de trabajo asincrónicos: los clientes ahora pueden usar nuestra nueva Batch API(se abre en una ventana nueva) para ejecutar cargas de trabajo no urgentes de forma asincrónica. Las solicitudes que se envían a Batch API tienen un descuento del 50 % con respecto al precio estándar, lo que se traduce en límites mucho más altos. Los resultados se suministran en 24 horas. Se trata de un método ideal para casos de uso como evaluar modelos, clasificar datos sin conexión, elaborar resúmenes y generar datos sintéticos.
Nuestra intención es seguir incorporando funciones centradas en la seguridad de la empresa, los controles administrativos y el control de costes. Para más información sobre estas novedades, visita la documentación de la API(se abre en una ventana nueva) o contacta con nuestro equipo para conocer la solución más adecuada para tu empresa.



