Introducing more enterprise-grade features for API customers

Treballem amb moltes empreses com Klarna, Morgan Stanley, Oscar, Salesforce i Wix per ajudar-les a crear solucions d’IA des de zero i desplegar la IA de manera segura a les seves organitzacions i productes. Estem ampliant el nostre suport a les empreses amb noves funcions útils tant per a grans companyies com per a qualsevol desenvolupador que estigui creixent ràpidament a la nostra plataforma.
Hem introduït Private Link, una nova manera perquè els clients garanteixin la comunicació directa entre Azure i OpenAI tot minimitzant l’exposició a internet oberta. També hem llançat la autenticació multifactor(s'obre en una finestra nova) (MFA) nativa per ajudar a garantir el compliment dels creixents requisits de control d’accés. Aquestes són noves incorporacions a la nostra oferta actual de funcions de seguretat empresarial(s'obre en una finestra nova), que inclou la certificació SOC 2 Type II, l’inici de sessió únic (SSO), el xifratge de dades en repòs amb AES-256 i en trànsit amb TLS 1.2, i els controls d’accés basats en rols. També oferim acords d’associat comercial(s'obre en una finestra nova) per a empreses sanitàries que requereixen compliment de la HIPAA i una política de retenció de dades nul·la per a clients de l’API amb un cas d’ús que compleixi els requisits.
Amb la nostra nova funció Projects(s'obre en una finestra nova), les organitzacions tindran un control i una supervisió més granulars sobre els projectes individuals a OpenAI. Això inclou la possibilitat d’assignar rols i claus d’API a projectes específics, restringir/permetre quins models estan disponibles i establir límits d’ús i de tarifa per donar accés i evitar excessos inesperats. Els propietaris de projectes també podran crear claus d’API de compte de servei, que donen accés als projectes sense estar vinculades a un usuari individual.

Hem introduït diverses actualitzacions a l’API Assistants per a una recuperació més precisa, més flexibilitat pel que fa al comportament del model i les eines utilitzades per completar tasques, i un millor control dels costos. Aquestes funcions inclouen:
- Recuperació millorada amb ‘file_search’, que pot ingerir fins a 10.000 fitxers per assistent: un augment de 500 vegades respecte del límit anterior de 20 fitxers. L’eina és més ràpida, admet consultes en paral·lel mitjançant cerques multithread i té una millora en la reordenació i la reescriptura de consultes.
- Compatibilitat amb streaming per a respostes conversacionals en temps real, una de les peticions principals de desenvolupadors i empreses.
Nous objectes ‘vector_store’ a l’API perquè els fitxers es puguin afegir a un magatzem vectorial i es processin, fragmentin i incrustin automàticament per preparar la cerca de fitxers. Els magatzems vectorials es poden utilitzar en diferents assistents i fils, simplificant la gestió de fitxers i la facturació. - Control sobre el nombre màxim de segments utilitzats per execució, a més de límits sobre els missatges anteriors i recents utilitzats en cada execució, perquè pugueu gestionar els costos d’ús de segments.
Nou paràmetre ‘tool_choice’ per seleccionar una eina específica (com ‘file_search’, ‘code_interpreter’ o ‘function’) en una execució concreta. - Compatibilitat amb models GPT‑3.5 Turbo ajustats finament a l’API (per començar, admetrem ajustos fins de ‘gpt-3.5-turbo-0125’).

Per ajudar les organitzacions a escalar l’ús de la IA sense sobrepassar els seus pressupostos, hem afegit dues noves maneres de reduir costos en càrregues de treball constants i asíncrones:
- Ús amb descompte en rendiment compromès: Els clients amb un nivell sostingut d’ús de segments per minut (TPM) a GPT‑4 o GPT‑4 Turbo poden sol·licitar accés a rendiment aprovisionat per obtenir descomptes d’entre el 10 i el 50% segons la mida del compromís.
- Reducció de costos en càrregues de treball asíncrones: Els clients poden utilitzar la nostra nova Batch API(s'obre en una finestra nova)per executar càrregues de treball no urgents de manera asíncrona. Les sol·licituds de la Batch API tenen un preu amb un 50% de descompte sobre els preus compartits, ofereixen límits de tarifa molt més alts i retornen resultats en un termini de 24 hores. Això és ideal per a casos d’ús com ara l’avaluació de models, la classificació fora de línia, la resumització i la generació de dades sintètiques.
Tenim previst continuar afegint noves funcions centrades en la seguretat de nivell empresarial, els controls administratius i la gestió de costos. Per a més informació sobre aquests llançaments, visiteu la nostra documentació de l’API(s'obre en una finestra nova) o poseu-vos en contacte amb el nostre equip per parlar de solucions personalitzades per a la vostra empresa.



