23 d’abril del 2024

Introducing more enterprise-grade features for API customers

More Enterprise Grade Features Hero Image

S'està carregant…

Treballem amb moltes empreses com Klarna⁠, Morgan Stanley⁠, Oscar⁠, Salesforce⁠ i Wix⁠ per ajudar-les a crear solucions d’IA des de zero i desplegar la IA de manera segura a les seves organitzacions i productes. Estem ampliant el nostre suport a les empreses amb noves funcions útils tant per a grans companyies com per a qualsevol desenvolupador que estigui creixent ràpidament a la nostra plataforma.

Seguretat de nivell empresarial millorada

Hem introduït Private Link, una nova manera perquè els clients garanteixin la comunicació directa entre Azure i OpenAI tot minimitzant l’exposició a internet oberta. També hem llançat la autenticació multifactor⁠(s'obre en una finestra nova) (MFA) nativa per ajudar a garantir el compliment dels creixents requisits de control d’accés. Aquestes són noves incorporacions a la nostra oferta actual de funcions de seguretat empresarial⁠(s'obre en una finestra nova), que inclou la certificació SOC 2 Type II, l’inici de sessió únic (SSO), el xifratge de dades en repòs amb AES-256 i en trànsit amb TLS 1.2, i els controls d’accés basats en rols. També oferim acords d’associat comercial⁠(s'obre en una finestra nova) per a empreses sanitàries que requereixen compliment de la HIPAA i una política de retenció de dades nul·la per a clients de l’API amb un cas d’ús que compleixi els requisits.

Millor control administratiu

Amb la nostra nova funció Projects⁠(s'obre en una finestra nova), les organitzacions tindran un control i una supervisió més granulars sobre els projectes individuals a OpenAI. Això inclou la possibilitat d’assignar rols i claus d’API a projectes específics, restringir/permetre quins models estan disponibles i establir límits d’ús i de tarifa per donar accés i evitar excessos inesperats. Els propietaris de projectes també podran crear claus d’API de compte de servei, que donen accés als projectes sense estar vinculades a un usuari individual.

More Enterprise Grade Features Product Demo-1

Millores de l’API Assistants

Hem introduït diverses actualitzacions a l’API Assistants per a una recuperació més precisa, més flexibilitat pel que fa al comportament del model i les eines utilitzades per completar tasques, i un millor control dels costos. Aquestes funcions inclouen:

Recuperació millorada amb ‘file_search’, que pot ingerir fins a 10.000 fitxers per assistent: un augment de 500 vegades respecte del límit anterior de 20 fitxers. L’eina és més ràpida, admet consultes en paral·lel mitjançant cerques multithread i té una millora en la reordenació i la reescriptura de consultes.
Compatibilitat amb streaming per a respostes conversacionals en temps real, una de les peticions principals de desenvolupadors i empreses.
Nous objectes ‘vector_store’ a l’API perquè els fitxers es puguin afegir a un magatzem vectorial i es processin, fragmentin i incrustin automàticament per preparar la cerca de fitxers. Els magatzems vectorials es poden utilitzar en diferents assistents i fils, simplificant la gestió de fitxers i la facturació.
Control sobre el nombre màxim de segments utilitzats per execució, a més de límits sobre els missatges anteriors i recents utilitzats en cada execució, perquè pugueu gestionar els costos d’ús de segments.
Nou paràmetre ‘tool_choice’ per seleccionar una eina específica (com ‘file_search’, ‘code_interpreter’ o ‘function’) en una execució concreta.
Compatibilitat amb models GPT‑3.5 Turbo ajustats finament a l’API (per començar, admetrem ajustos fins de ‘gpt-3.5-turbo-0125’).

More Enterprise Grade Features Product Demo-2

Més opcions per gestionar costos

Per ajudar les organitzacions a escalar l’ús de la IA sense sobrepassar els seus pressupostos, hem afegit dues noves maneres de reduir costos en càrregues de treball constants i asíncrones:

Ús amb descompte en rendiment compromès: Els clients amb un nivell sostingut d’ús de segments per minut (TPM) a GPT‑4 o GPT‑4 Turbo poden sol·licitar accés a rendiment aprovisionat per obtenir descomptes d’entre el 10 i el 50% segons la mida del compromís.
Reducció de costos en càrregues de treball asíncrones: Els clients poden utilitzar la nostra nova Batch API⁠(s'obre en una finestra nova)per executar càrregues de treball no urgents de manera asíncrona. Les sol·licituds de la Batch API tenen un preu amb un 50% de descompte sobre els preus compartits, ofereixen límits de tarifa molt més alts i retornen resultats en un termini de 24 hores. Això és ideal per a casos d’ús com ara l’avaluació de models, la classificació fora de línia, la resumització i la generació de dades sintètiques.

Tenim previst continuar afegint noves funcions centrades en la seguretat de nivell empresarial, els controls administratius i la gestió de costos. Per a més informació sobre aquests llançaments, visiteu la nostra documentació de l’API⁠(s'obre en una finestra nova) o poseu-vos en contacte amb el nostre equip⁠ per parlar de solucions personalitzades per a la vostra empresa.

Autor

OpenAI

Recerca relacionada

Un estol d’avions de paper volant per sobre i entre les copes dels arbres.

Models de generació de vídeo com a simuladors del món

Sora

Sweeping strokes of orange, yellow, and purple in an abstract design

Building an early warning system for LLM-aided biological threat creation

Publicació31 de gen. del 2024

A vibrant, abstract image with radiating streaks of yellow, red, blue, and purple, creating a dramatic, explosive effect reminiscent of a colorful burst of light or energy.

Weak-to-strong generalization

Seguretat14 de des. del 2023

Practices for Governing Agentic AI Systems

Safety & Alignment