Го претставуваме нашиот најнов модел за генерирање слики во API
Кога го воведовме генерирањето слики во ChatGPT минатиот месец, тоа брзо стана една од нашите најпопуларни функции: над 130 милиони корисници ширум светот креираа повеќе од 700 милиони слики само во првата седмица(се отвора во нов прозорец).
Денес, го донесуваме нативно мултимодалниот модел кој го напојува ова искуство во ChatGPT до API преку gpt-image-1, овозможувајќи им на развивачите на софтвер и бизнисите лесно да интегрираат висококвалитетно, професионално генерирање на слики директно во нивните алатки и платформи. Разновидноста на моделот му овозможува да креира слики во различни стилови, верно да следи прилагодени насоки, да го користи светското знаење и прецизно да прикажува текст – отворајќи безброј практични апликации низ повеќе домени.
Водечки претпријатија и стартапи од различни индустрии, вклучувајќи креативни алатки, е-трговија, образование, софтвер за претпријатија, игри, веќе користат генерирање на слики во нивните производи и искуства. Со задоволство споделуваме некои од овие примери подолу.
Adobe’s leading ecosystem of creative tools including its Firefly and Express apps will provide access to OpenAI’s image generation capabilities, giving creators the choice and flexibility to experiment with different aesthetic styles—something business professionals, consumers and creators all value when generating new creative ideas.
Исто така, продолжуваме да работиме со развивачи на софтвер и бизниси за да откриеме повеќе начини на кои генерирањето слики во API може да им служи на нивните случаи на употреба, вклучувајќи:
Дизајнирање и уредување: Canva истражува начини за интегрирање на gpt-image-1 на OpenAI за да ги помести границите на генерирање и уредување на дизајн во своите алатки Canva AI и Magic Studio. Преку можностите на gpt-image-1 како трансформирање на груби скици во извонредни графички елементи и овозможување на висококвалитетни визуелни уредувања, Canva дополнително ќе ги овласти своите 230 милиони корисници да ги оживеат своите идеи на сосема нови начини.
Креирање и уредување на логоа: GoDaddy активно експериментира за да интегрира генерирање слики, така што корисниците лесно можат да креираат уредливи логоа, да отстрануваат заднини и да генерираат професионална типографија. Дополнително, како ново искуство со GoDaddy Airo®, тимот работи на тоа клиентите да креираат објави на социјалните медиуми и маркетинг материјали кои го одразуваат нивниот уникатен идентитет на брендот за оригинална содржина на производи и брендови создадена од промпт.
Изработка на маркетинг материјали: HubSpot истражува како новите способности на OpenAI за генерирање слики можат да им помогнат на клиентите да креираат маркетинг и продажни материјали. Како што HubSpot продолжува да додава нови алатки со вештачка интелигенција за скалирање на бизнисите, овие можности за генерирање слики имаат потенцијал да го трансформираат начинот на кој клиентите создаваат висококвалитетни слики за социјални медиуми, е-пошта за маркетинг и целни страници без потреба од специјализирана дизајнерска експертиза.
Генерира рецепти и листи за пазарување: Instacart тестира нови начини за користење на API за генерирање слики, вклучувајќи слики за рецепти и листи за пазарување.
Уредување на видеа: invideo им овозможува на милиони корисници да ги претворат своите идеи во видеа користејќи вештачка интелигенција. Со интеграцијата на gpt-слика-1, платформата сега нуди подобрено генерирање на текст, контроли за прецизно уредување и напредни насоки за стил.
Моделот gpt-image-1 во API користи исти безбедносни мерки како и генерирање слики со 4o во ChatGPT, вклучувајќи заштити кои го ограничуваат моделот од генерирање на штетни слики и вклучување на C2PA метаподатоци во генерираните слики – можеш да прочиташ повеќе за ова во нашата претходна блог објава тука. Дополнително, развивачите на софтвер можат исто така да ја контролираат чувствителноста на модерирање со параметарот „moderation“ кој може да се постави на auto (стандардно) за стандардно филтрирање или на low за помалку рестриктивно филтрирање. Дознај повеќе во нашите документи(се отвора во нов прозорец).
По стандарден избор, никогаш не обучуваме од податоци од API на клиенти и сите внесени и излезни слики остануваат предмет на нашите политики на користење на API.
Користењето на gpt-image-1 се наплаќа по токен, со одделни цени за текстуални и слика токени:
- Токени за внесување текст (текст за промпт): 5 долари за 1 милион токени
- Токени за внесување слика (влезни слики): 10 долари за 1 милион токени
- Токени за резултат на слики (генерирани слики): 40 долари за 1 милион токени
Во пракса, ова се преведува на приближно 0,02 долари, 0,07 долари и 0,19 долари по генерирана слика за низок, среден и висок квалитет на квадратни слики, соодветно. За детални цени според квалитетот и големината на сликата, види ги документите(се отвора во нов прозорец).
Моделот gpt-image-1 сега е достапен глобално преку Images API, а поддршката во Responses API наскоро ќе биде достапна. Некои развивачи на софтвер можеби ќе треба да ја потврдат(се отвора во нов прозорец) својата организација пред да можат да го користат моделот. Провери ги поставките на организацијата(се отвора во нов прозорец) за да видиш дали веќе имаш пристап.
За да започнеш, истражи ги способностите на моделот во playground(се отвора во нов прозорец) и провери го нашиот водич за генерирање слики(се отвора во нов прозорец). Со нетрпение очекуваме да видиме што ќе изградиш.