Представяме Ви 4o генериране на изображения
Отключете полезно и ценно генериране на изображения с вграден мултимодален модел, способен на прецизни, точни, фотореалистични резултати.
В OpenAI отдавна вярваме, че генерирането на изображения трябва да бъде основна способност на нашите езикови модели. Ето защо вградихме нашия най-усъвършенстван генератор на изображения досега в GPT‑4o. Резултатът — генериране на изображения, което е не само красиво, но и полезно.
От първите пещерни рисунки до съвременните инфографики, хората са използвали визуални изображения, за да комуникират, убеждават и анализират—не само за украса. Съвременните генеративни модели могат да създават сюрреалистични, спиращи дъха сцени, но изпитват затруднения с основните изображения, които хората използват за споделяне и създаване на информация. От лога до диаграми, изображенията могат да предадат точно значение, когато са допълнени със символи, които се отнасят до споделен език и опит.
Генерирането на изображения с GPT‑4o се отличава с точно изобразяване на текст, прецизно следване на подкани и използване на присъщата база от знания и контекста на чата на 4o—включително трансформиране на качени изображения или използването им като визуално вдъхновение. Тези възможности улесняват създаването точно на изображението, което си представяте, като Ви помагат да комуникирате по-ефективно чрез визуализации и превръщат генерирането на изображения в практичен инструмент с прецизност и мощност.
Обучихме нашите модели върху съвместното разпределение на онлайн изображения и текст, като научихме не само как изображенията се свързват с езика, но и как се свързват помежду си. В съчетание с агресивно последващо обучение, полученият модел има изненадваща визуална плавност, способен да генерира изображения, които са полезни, последователни и контекстно осъзнати.
Една картина струва повече от хиляда думи, но понякога използването на няколко думи на правилното място може да повиши значението на изображението. Способността на 4o да съчетава прецизни символи с изображения превръща генерирането на изображения в инструмент за визуална комуникация.
Тъй като генерирането на изображения вече е вградено в GPT‑4o, можете да прецизирате изображенията чрез естествен разговор. GPT‑4o може да надгражда изображения и текст в контекста на чата, осигурявайки последователност през цялото време. Например, ако проектирате герой за видеоигра, външният вид на героя остава последователен в множество итерации, докато усъвършенствате и експериментирате.
Генерирането на изображения в GPT‑4o следва подробни подкани с внимание към детайла. Докато други системи се затрудняват с ~5-8 обекта, GPT‑4o може да обработва до 10-20 различни обекта. По-тясното обвързване на обектите с техните характеристики и връзки позволява по-добър контрол.
GPT‑4o може да анализира и да се учи от изображения, качени от потребителя, безпроблемно интегрирайки техните подробности в своя контекст, за да ги използва при генерирането на изображения.
Генерирането на естествени изображения позволява на 4o да свърже знанията си между текст и изображения, което води до по-интелигентен и ефективен модел.
Обучението върху изображения, отразяващи разнообразие от стилове, позволява на модела да създава или трансформира изображения убедително.
Нашият модел не е съвършен. В момента сме наясно с множество ограничения, върху които ще работим за отстраняване чрез подобрения на модела след първоначалното пускане.

Забелязахме, че GPT‑4o понякога може да изрязва по-дълги изображения, като постери, особено близо в долната част.
В съответствие с нашата спецификация на модела, ние се стремим да увеличим максимално творческата свобода, като подкрепяме ценни случаи на употреба като разработване на игри, историческо проучване и образование—като същевременно поддържаме строги стандарти за безопасност. В същото време остава толкова важно, колкото винаги, да се блокират заявки, които нарушават тези стандарти. По-долу са представени оценки на допълнителни рискови области, върху които работим, за да осигурим безопасно и съдържание с голяма полезност и да подкрепим по-широкото творческо изразяване на потребителите.
Произход чрез C2PA и вътрешно обратимо търсене
Всички генерирани изображения са снабдени с метаданни C2PA, които идентифицират изображението като създадено от GPT‑4o, за да се осигури прозрачност. Също така създадохме вътрешен инструмент за търсене, който използва техническите характеристики на поколенията, за да помогне да се проверява дали съдържанието произхожда от нашия модел.
Блокиране на лошите неща
Продължаваме да блокираме заявките за генерирани изображения, които могат да нарушават нашите политики за съдържание, като материали за сексуално насилие над деца и сексуални дийпфейкове. Когато става въпрос за изображения на реални хора, имаме засилени ограничения относно вида изображения, които могат да бъдат създадени, с особено строги предпазни мерки срещу голотата и графичното насилие. Както при всяко стартиране, безопасността никога не е завършена и е по-скоро област на непрекъсната инвестиция. С научаването на повече за реалното използване на този модел ще коригираме съответно нашите политики.
За повече информация относно нашия подход посетете допълнение за генериране на изображения към системната карта GPT‑4o.
Използване на разсъждения за осигуряване на безопасност
Подобно на нашата работа по съзнателно съгласуване, ние обучихме LLM, базиран на разсъждение, да работи директно с написани от човек и интерпретируеми спецификации за безопасност. Използвахме този LLM за разсъждения по време на разработката, за да ни помогне да идентифицираме и адресираме неясноти в нашите политики. Заедно с нашите мултимодални подобрения и съществуващите техники за безопасност, разработени за ChatGPT и Sora, това ни позволява да модерираме както входния текст, така и изходните изображения спрямо нашите политики.
4o генериране на изображение започва от днес за потребителите на Plus, Pro, Team и Free като генератор на изображение по подразбиране в ChatGPT, като скоро ще бъде достъпно и за Enterprise и Edu. Също така е налично за използване в Sora. За тези, които държат специално място в сърцата си за DALL·E, все още може да бъде достъпен чрез специален DALL·E GPT.
Разработчиците скоро ще могат да генерират изображения с GPT‑4o чрез API, като достъпът ще бъде предоставен през следващите няколко седмици.
Създаването и персонализирането на изображения е толкова просто, колкото чатът с помощта на GPT‑4o - просто опишете от какво се нуждаете, включително всякакви специфики като съотношение на страните, точни цветове, използвайки шестнадесетични кодове, или прозрачен фон. Тъй като този модел създава по-подробни изображения, рендирането на изображенията отнема повече време, често до една минута.
Автор
Лидерство
Габриел Го: Генериране на изображения
Джаки Шанън: Продукт на ChatGPT
Менгчао Чжун, Уейн Чанг: Инженеринг на ChatGPT
Рохан Сахай: Продукти и инженеринг на Sora
Брендън Куин, Томер Кафтан: Разсъждение
Прафула Дхаривал: Мултимодална организация
Проучване
Фундаментални изследвания
Алън Джабри, Дейвид Медина, Габриел Го, Кенджи Хата, Лу Лиу, Прафула Дхаривал
Основни изследвания
Адитя Рамеш, Алекс Никол, Кейси Чу, Ченг Лу, Диан Анг Яп, Хиу Джун, Джеймс Беткър, Джианфън Уанг, Лонг Оуян, Ли Дзин, Уесам Манасра
Сътрудници в изследването
Ейдън Лоу, Брандън МакКинзи, Чарли Неш, Хуивен Чанг, Ишан Гулраджани, Джейми Кирос, Джи Лин, Кшитидж Гупта, Янг Сонг
Поведение на модела
Лаурентия Романюк
Мултимодална организация
Андрю Гибиански, Ян Лу
Данни
Ръководители по данни
Гилдас Шабот, Джеймс Парк Ленън
Данни
Арши Бхатнагар, Драгос Оприца, Рохан Кширсагар, Спенсър Папай, Си-чие Ю, Уесам Манасра, Йилей Чиан
Модератори
Хейзъл Бърн, Дженифър Лъкенбил, Мариано Лопес
Консултанти по човешки данни
Лонг Оуянг
Мащабиране
Ръководители по разсъждения
Брендън Куин, Томер Кафтан
Разсъждение
Алиса Хуанг, Джейкъб Меник, Ник Статас, Руслан Василев, Стенли Хсие
Приложимо
Ръководител на продукти на ChatGPT
Джаки Шанън
Ръководители на инженерния екип на ChatGPT
Менгчао Чонг, Уейн Чанг
Ръководител на продуктовия дизайн
Мат Чан
Наука за данни
Сяолин Хао
ChatGPT
Андрю Сима, Ани Ченг, Бенджамин Гох, Боянг Ниу, Диан Анг Яп, Дък Тран, Едеде Ойвох, Ерик Джанг, Итън Чанг, Джефри Дънам, Джей Чен, Кан Ву, Карън Ли, Кели Стърман, Менгюан Сю, Мишел Цин, Ола Окелола, Педро Агилар, Роки Смит, Рохит Рамчандани, Сара Кълвър, Шон Фицджералд, Влад Фоменко, Уанинг Джианг, Уесам Манасра, Сяолин Хао, Йилей Циен
Sora
Ръководител на продукти на Sora
Рохан Сахай, Уесам Манасра
Продукти и инженеринг на Sora
Боян Ниу, Дейвид Шнур, Гилман Толе, Джо Тейлър, Джоуи Флин, Майк Стар, Раджив Наяк, Рохан Сахай, Уесам Манасра
Безопасност
Ръководител по безопасност
Сомай Джайн
Безопасност
Алекс Ботел, Андреа Валоне, Ботао Хао, Брендън Куин, Камерън Реймънд, Чонг Джан, Дейвид Робинсън, Ерик Уолъс, Филипо Расо, Хуивен Чанг, Иън Кивличан, Ирина Кофман, Керен Гу-Лемберг, Кристен Инг, Мадлен Бойд, Меган Шах, Майкъл Лампе, Оуен Кембъл-Мур, Рохан Сахай, Родриго Риаза Перес, Сам Тойзер, Сандини Агарвал, Трой Питърсън
Стратегия
Адам Коен, Адам Уелс, Али Бенет, Ашли Пантулиано, Каролина Пас, Клаудия Фишер, Деклан Граб, Габи Сакрамоне-Луц, Лорън Джонас, Райън Байермайстер, Шиао Лий, Том Стаси, Тайс Уолтърс, Зиад Реслан, Зоуи Стол
Маркетинг и комуникации
Ръководители по комуникации и маркетинг
Миния Фенг, Натали Съмърс, Тая Кристиансън
Комуникации
Алекс Бейкър-Уиткомб, Ашли Тайра, Бейли Ричардсън, Габи Райла, Марселус Кейтън, Скот Етърсмит, Суки Мансур
Дизайн и креативност
Ръководители
Кендра Римбах, Файт Мьолер
Дизайн
Адам Брандън, Адам Копел, Анджела Бек, Кари Хъдсън, Дана Палми, Фреди Сулит, Джефри Сабин Мацумото, Леян Ло, Мат Никълс, Томас Дегри, Ванеса Антония Шефке, Яра Хакбаз
Специални благодарности
Адитья Рамеш, Ейдън Кларк, Алекс Ботел, Бен Нюхаус, Бен Росен, Че Чанг, Грег Брокман, Хана Уонг, Ишан Сингал, Джейсън Куон, Джиаченг Фенг, Джиахуи Ю, Джоан Джанг, Йоханес Хайдеке, Кевин Уейл, Марк Чен, Миа Глезе, Ник Търли, Раул Пури, Рейчиро Накано, Руи Шу, Сам Алтман, Шучао Би, Вини Монако

















](https://images.ctfassets.net/kftzwdyauwt9/2R9czqCiP1nqec6UED0AJd/0f24e9e9299c871ffd3d5b76f5635d16/roope-car.png?w=3840&q=90&fm=webp)






](https://images.ctfassets.net/kftzwdyauwt9/4mDKmV3ex9OT8wyAFGDAQS/1b0e1baacb80125e1f92e66dbdf1e32a/Alex_Duffy1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/30DNW3QcEb1BosJhJqPAfA/56e4708045e63d40d5fe31c122da2bfb/August_Kamp_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2ukMfLwQHGEnwMbS43M3Hf/6f5fa57419fdc16ca603e41c1ac290ff/August_Kamp_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2KZaGKW5emVRwnYBMcMYCP/560cd7d513aed92b4a943b66b6b5e836/August_Kamp_4.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2PVNlktDwuJJgAlrviWfF1/bf374f33e21c41e770068f4f66a22394/August_Kamp_5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/39oS3hSQqMSqHHNAS0q3DB/0624bcc17a3e7a3fd318a1eb5c63146e/August_Kamp.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5WdHD3ToXx1mj13bjDhdQh/46c283533309492585f3538a5ed3a2fd/August_Kamp_1_.png?w=3840&q=90&fm=webp)

](https://images.ctfassets.net/kftzwdyauwt9/37BlQeBhtmTAazdT7LyRIU/7e6472d3ba12c22748cf14a670c0a725/Copy_of_Isa.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2pRf2V2Zmd1YF7GfBtfRwG/92ac8188795fcdd4be9152a27a971289/Copy_of_Isa2.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/2D1UY4SXAHAxN0uCGT4KCd/43da3a5152c1a823fdf2bed6acea5cf8/Derya_Unutmaz1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1jRz4YFkVwGIVQC6yz5DJV/af2ed5507df32860b8b82a4a326c437e/Derya2.jpg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1hakInZjBH5SENKVLD68Gl/0140eb82eae9e5cd2f1fbc7ef8f5c46c/Derya3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/3viXLb1u1ZsUXju6gc0Izh/51b37635165df801077399b26e6c0ff5/Elene_6.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6EoS1QOv0KOi4aESduy0cU/12705b1ca86abce06bf7366f98e9a8c7/Elene_Chekurishvili.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5sKaN7iVvtLlzGJQtFmfMg/4ef6d51d2e54d4effd3019401401deb1/Elene3.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1iA7pHLA84KDCRIuoG5pTk/ae8e52600bfbd53a10a749dcd78b2382/Elene4.jpeg?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5MPmWWYE3fDk6M5QSpA0X8/ac729246785fc8d052be4427085bbcda/Elene5.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2CrXaGuZ3fcCIyKNcDaiRr/26fb7c949919a2de82f7b8340ad4e708/Eugenio_Marongiu.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/6JJh92fHC6diXnnj0rz6DP/53a43e30200729a648cfda1faa6328a5/Eugenio2.png?w=3840&q=90&fm=webp)



](https://images.ctfassets.net/kftzwdyauwt9/tZr3EpmNfrkZBQAIYMffM/d85415f7a01a49718adf2509bb9ad8f1/Minh_Do1.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/1TQS4fCbgIOjdnML4u6i5o/bc81b9ff76e503e32b69dbf447a967e6/niceaunties.png?w=3840&q=90&fm=webp)


](https://images.ctfassets.net/kftzwdyauwt9/1TYYxCnSFWzwoEOHJ7OlfC/767ce4ec94b972138598cce0be1e8d79/Roope_2.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/2Gr22uAGGIQjmDBQt2ccKx/620417fa3b9667f7e95a1fd98c692203/Roope_3.png?w=3840&q=90&fm=webp)
](https://images.ctfassets.net/kftzwdyauwt9/5neXFSFNWbbdhruFManjbU/3a084e08790a90af52cb7005372539b9/Roope_Rainisto1.png?w=3840&q=90&fm=webp)






