پرش به محتوای اصلی
OpenAI

۵ فروردین ۱۴۰۴

محصولانتشار

معرفی قابلیت تولید تصویر 4o

ایجاد تصویر مفید و ارزشمند با یک مدل چندوجهی بومی که قادر به خروجی‌های دقیق، صحیح و واقع‌گرایانه است.

در حال بارگذاری…

در OpenAI، ما مدت‌هاست که معتقدیم تولید تصویر باید قابلیت اصلی مدل‌های زبانی ما باشد. به همین دلیل ما پیشرفته‌ترین مولد تصویرمان را تاکنون در GPT‑4o ساخته‌ایم. نتیجه—تولید تصویری که نه تنها زیباست، بلکه مفید هم هست.

A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt wiith a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.

The text reads:

(left)
"Transfer between Modalities:

Suppose we directly model
p(text, pixels, sound) [equation]
with one big autoregressive transformer.

Pros:
* image generation augmented with vast world knowledge
* next-level text rendering
* native in-context learning
* unified post-training stack

Cons:
* varying bit-rate across modalities
* compute not adaptive"

(Right)
"Fixes:
* model compressed representations
* compose autoregressive prior with a powerful decoder"

On the bottom right of the board, she draws a diagram:
"tokens -> [transformer] -> [diffusion] -> pixels"

oai_image-generation_whiteboard1

Best of 8

selfie view of the photographer, as she turns around to high five him

oai_image-generation_whiteboard2

Best of 8

تولید تصویر مفید

از اولین نقاشی‌های غار تا اینفوگرافیک‌های مدرن، انسان‌ها از تصاویر بصری برای برقراری ارتباط، ترغیب و تحلیل استفاده کرده‌اند - نه فقط برای تزئین. مدل‌های مولد امروزی می‌توانند صحنه‌های سورئال و نفس‌گیر را خلق کنند، اما در استفاده از تصاویر کاربردی که مردم برای به اشتراک‌گذاری و ایجاد اطلاعات استفاده می‌کنند، با مشکل مواجه هستند. از لوگوها تا نمودارها، تصاویر می‌توانند معنای دقیقی را منتقل کنند وقتی با نمادهایی که به زبان و تجربه مشترک اشاره دارند، تقویت شوند.

تولید تصویر GPT‑4o در رندر دقیق متن، پیروی دقیق از دستورات و بهره‌گیری از پایگاه دانش ذاتی 4o و زمینه گفتگو - از جمله تبدیل تصاویر آپلود شده یا استفاده از آنها به عنوان الهام بصری - به خوبی عمل می‌کند. این قابلیت‌ها ایجاد تصویری که دقیقاً در ذهن داری را آسان‌تر می‌کنند و به تو کمک می‌کنند تا از طریق تصاویر، ارتباط مؤثرتری برقرار کنی و تولید تصویر را به ابزاری کاربردی با دقت و قدرت تبدیل کنی.

قابلیت‌های بهبود یافته

ما مدل‌های خود را بر اساس توزیع مشترک تصاویر و متن آنلاین آموزش دادیم و نه تنها ارتباط تصاویر با زبان، بلکه ارتباط آنها با یکدیگر را نیز آموختیم. در ترکیب با آموزش پس از آموزش تهاجمی، مدل حاصل دارای روانی بصری شگفت‌انگیزی است و می‌تواند تصاویری تولید کند که مفید، سازگار و آگاه از زمینه هستند.

تبدیل متن

یک تصویر به اندازه هزار کلمه ارزش دارد، اما گاهی اوقات تولید چند کلمه در جای مناسب می‌تواند معنای یک تصویر را ارتقا دهد. توانایی 4o در ترکیب نمادهای دقیق با تصاویر، تولید تصویر را به ابزاری برای ارتباط بصری تبدیل می‌کند.

Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign.

Context:
a city street in a random street in Williamsburg, NY with a pole covered entirely by numerous detailed street signs (e.g., street sweeping hours, parking permits required, vehicle classifications, towing rules), including few ridiculous signs at the middle: (paraphrase it to make these legitimate street signs)"Broom Parking for Witches Not Permitted in Zone C" and "Magic Carpet Loading and Unloading Only (15-Minute Limit)" and "Reindeer Parking by Permit Only (Dec 24–25)
Violators will be placed on Naughty List." The signpost is on the right of a street. Do not repeat signs. Signs must be realistic.

Characters:
one witch is holding a broom and the other has a rolled-up magic carpet. They are in the foreground, back slightly turned towards the camera and head slightly tilted as they scrutinize the signs.

Composition from background to foreground:
streets + parked cars + buildings -> street sign -> witches. Characters must be closest to the camera taking the shot

image-gen-4o-street-sign

Best of ~8

تولید چند مرحله‌ای

از آنجا که تولید تصویر اکنون بومی GPT‑4o است، می توانید تصاویر را از طریق مکالمه طبیعی اصلاح کنید. GPT‑4o می‌تواند بر اساس تصاویر و متن در زمینه گفتگو توسعه یابد و ثبات را در کل تضمین کند. برای مثال، اگر در حال طراحی یک شخصیت بازی ویدیویی هستی، ظاهر شخصیت در طول چندین بار تکرار، همزمان با اصلاح و آزمایش، منسجم باقی می‌ماند.

minnias cat input

Give this cat a detective hat and a monocle

minnias-cat-2

Best of 1

turn this into a triple A video games made with a 4k game engine and add some User interface as overlay from a mystery RPG where we can see a health bar and a minimap at the top as well as spells at the bottom with consistent and iconography

minnias cat2

Best of 1

update to a landscape image 16:9 ratio, add more spells in the UI, and unzoom the visual so that we see the cat in a third person view walking through a steampunk manhattan creating beautiful contrast and lighting like in the best triple A game, with cool-toned colors

minnias cat3

Best of 2

create the interface when the player opens the menu and we see the cat's character profile with his equipment and another page showing active quests (and it should make sense in relationship with the universe worldbuilding we are describing in the image)

minnias cat4

Best of 8

credit creator: Manuel Sainsily

پیروی از دستورالعمل

تولید تصویر GPT‑4o با دقت به جزئیات، دستورالعمل‌های دقیقی را دنبال می‌کند. در حالی که سایر سیستم ها با ~5-8 شی دست و پنجه نرم می کنند، GPT‑4o می تواند تا 10-20 شی مختلف را مدیریت کند. پیوند محکم‌تر اشیاء به ویژگی‌ها و روابطشان، کنترل بهتری را ممکن می‌سازد.

A square image containing a 4 row by 4 column grid containing 16 objects on a white background. Go from left to right, top to bottom. Here's the list:
1. a blue star
2. red triangle
3. green square
4. pink circle
5. orange hourglass
6. purple infinity sign
7. black and white polka dot bowtie
8. tiedye "42"
9. an orange cat wearing a black baseball cap
10. a map with a treasure chest
11. a pair of googly eyes
12. a thumbs up emoji
13. a pair of scissors
14. a blue and white giraffe
15. the word "OpenAI" written in cursive
16. a rainbow-colored lightning bolt

Screenshot 2025-03-24 at 10.07.12 AM

Best of 5

یادگیری در زمینه

GPT‑4o می‌تواند تصاویر آپلود شده توسط کاربر را تجزیه و تحلیل کرده و از آنها یاد بگیرد و جزئیات آنها را به طور یکپارچه در متن خود ادغام کند تا از تولید تصویر مطلع شود.

in-context-learning-prompt
  • draw a design for a vehicle with triangular wheels, using these images as reference.
  • label the front wheel, the back wheel, and at the of the diagram say (in small caps)
  • TRIANGLE WHEELED VEHICLE. English Patent. 2025. OPENAI.
Screenshot 2025-03-24 at 10.41.56 AM

Best of ~16

now put this in a photo taken in new york city.

Screenshot 2025-03-24 at 10.42.45 AM

Best of ~16

دانش عمومی

تولید تصویر بومی به 4o امکان می‌دهد تا دانش خود را بین متن و تصاویر پیوند دهد و در نتیجه مدلی ایجاد کند که هوشمندتر و کارآمدتر به نظر برسد.

Code Example (Three.js)

HTML

1
<!DOCTYPE html>
2
<html lang="en">
3
<head>
4
<meta charset="UTF-8" />
5
<title>OpenAI Banner</title>
6
<style>
7
body { margin: 0; overflow: hidden; }
8
canvas { display: block; }
9
</style>
10
</head>
11
<body>
12
<script type="module">
13
import * as THREE from 'https://cdn.jsdelivr.net/npm/three@0.160.0/build/three.module.js';
14
import { OrbitControls } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/controls/OrbitControls.js';
15
import { FontLoader } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/loaders/FontLoader.js';
16
import { TextGeometry } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/geometries/TextGeometry.js';
17

18
const scene = new THREE.Scene();
19
const camera = new THREE.PerspectiveCamera(45, window.innerWidth / window.innerHeight, 0.1, 1000);
20
const renderer = new THREE.WebGLRenderer({ antialias: true });
21
renderer.setSize(window.innerWidth, window.innerHeight);
22
document.body.appendChild(renderer.domElement);
23

24
// Lighting
25
const light = new THREE.AmbientLight(0xffffff, 1);
26
scene.add(light);
27

28
const dirLight = new THREE.DirectionalLight(0xffffff, 1);
29
dirLight.position.set(0, 5, 10);
30
scene.add(dirLight);
31

32
// Camera position
33
camera.position.z = 20;
34

35
// Controls
36
const controls = new OrbitControls(camera, renderer.domElement);
37

38
// Banner background
39
const bannerGeometry = new THREE.PlaneGeometry(20, 10);
40
const bannerMaterial = new THREE.MeshStandardMaterial({ color: 0x1a1a1a });
41
const banner = new THREE.Mesh(bannerGeometry, bannerMaterial);
42
scene.add(banner);
43

44
// OpenAI Logo texture (placeholder)
45
const loader = new THREE.TextureLoader();
46
loader.load('https://upload.wikimedia.org/wikipedia/commons/4/4d/OpenAI_Logo.svg', texture => {
47
const logoGeometry = new THREE.PlaneGeometry(4, 4);
48
const logoMaterial = new THREE.MeshBasicMaterial({ map: texture, transparent: true });
49
const logo = new THREE.Mesh(logoGeometry, logoMaterial);
50
logo.position.set(-5, 0, 0.1); // Slightly in front of the banner
51
scene.add(logo);
52
});
53

54
// Load font and add text
55
const fontLoader = new FontLoader();
56
fontLoader.load('https://threejs.org/examples/fonts/helvetiker_regular.typeface.json', font => {
57
const textGeometry = new TextGeometry("I am 4-o", {
58
font: font,
59
size: 1,
60
height: 0.2,
61
curveSegments: 12,
62
bevelEnabled: true,
63
bevelThickness: 0.02,
64
bevelSize: 0.02,
65
bevelOffset: 0,
66
bevelSegments: 5
67
});
68

69
textGeometry.center();
70

71
const textMaterial = new THREE.MeshStandardMaterial({ color: 0x00ffcc });
72
const textMesh = new THREE.Mesh(textGeometry, textMaterial);
73
textMesh.position.set(5, -0.5, 0.1); // Opposite side of logo
74
scene.add(textMesh);
75
});
76

77
// Resize handler
78
window.addEventListener('resize', () => {
79
camera.aspect = window.innerWidth / window.innerHeight;
80
camera.updateProjectionMatrix();
81
renderer.setSize(window.innerWidth, window.innerHeight);
82
});
83

84
// Render loop
85
function animate() {
86
requestAnimationFrame(animate);
87
controls.update();
88
renderer.render(scene, camera);
89
}
90

91
animate();
92
</script>
93
</body>
94
</html>

make an image of what this means to you

Screenshot 2025-03-18 at 11.46.24 AM

فتورئالیسم و سبک

آموزش با تصاویری که طیف گسترده‌ای از سبک‌های تصویری را منعکس می‌کنند، به مدل امکان می‌دهد تا تصاویر را به‌طور قانع‌کننده‌ای ایجاد یا تغییر دهد.

A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.
A cat looking into a puddle of water on a street, but its reflection is that of a tiger, and both reflections are realistically distorted by ripples in the water
Generate a candid, Polaroid-style photograph of four diverse friends in their early 20s at a gritty dive bar. The lighting features a very harsh, direct flash, creating sharp shadows and giving the photo a very overexposed, vintage instant-camera feel. Colors should be slightly muted, evoking nostalgic, early-2000s party vibes. The aesthetic is casually emo. No border or logos or signs. There's an interesting looking wall behind them with some light graffiti. Quality of the image should be very sharp and detailed (very little grain). The energy should be silly and chaotic. They're either playfully grimacing, smiling, or pretending to look tough. One of them should have their friend in a silly, playful headlock. Their mouths are closed.
Generate a photorealistic image of farmer's market in toronto on a saturday in summer 2006, it's a beautiful late june day, people are shopping and eating sandwiches. in focus should be a young asian girl wearing denim overalls and sipping on a strawberry banana smoothie - rest can be blurred. the photo should be reminiscent of that a digital camera from 2006 would take, with a timestamp like a printed photo would have. aspect ratio should be 3:2
blurry old analog film photograph, picture of parked car on side street, quiet night. credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
Create image super-realistic picture of these 4 creatures playing poker on a picnic blanket, zoomed out, in dolores park. photorealistic. The tabby long haired cat is holding a hand; right next to it are 2 tall vertical black chips (with stripes) as it has been raking in the dough.  Tabby's pupils are large and cute, and ii looking down and scrutinizing its cards, focused. Derpy black cat went all in. Two dogs are peering over cat's shoulder to see their cards. All cards are face down and of the same back color except for an exposed three of diamonds. small stack of poker chips are in front of each creature, but black cat went all in. the two dogs folded. All chips are from the same set and all cards have same color. photorealistic, shot on iphone, raw format.
Best of 1 | Generate an portrait ad on a solid pastel background.

In solid white san serif text, "ChatGPT image generation" in the top left, about a third of the way down.

In solid white san serif text, "Form follows function", in the bottom right, about a third of the way up.

In the background, put a photo of a really sleek, modern sculpture. It should gradually transition from a wireframe sketch on the left to the fully photorealistic version on the right. 

At the very bottom, in medium-small text, say "This entire poster was generated by ChatGPT image generation."
A lone astronaut floats inside a vast space station, painting swirling galaxies onto a massive canvas that hangs weightlessly in the air. Their paintbrush leaves behind trails of cosmic dust, and their suit is stained with nebula-colored hues. Their helmet is off, revealing eyes filled with the reflection of distant planets. Outside the glass window, a black hole looms, twisting light into mesmerizing patterns.
Realistic photograph of a horse galloping from right to left across a vast, calm ocean surface, accurately depicting splashes, reflections, and subtle ripple patterns beneath their hooves. Exaggerate horse movements but everything else should be still, quiet to show contrast with the horse's strength. clean composition, cinematographic. A wide, panoramic composition showcasing a distant horizon. Atmospheric perspective creating depth. zoomed out so the horse appears minuscule compared to vast ocean.

horse is right at the horizon where ocean meets sky. use rule of thirds to position horse. size of horse is 1% size of entire image because camera is so far away from subject. camera view is super close to the ground/ocean like a worm's eye view. horse is galloping right where ocean meets the sky
A realistic underwater scene with dolphins swimming through the windows of an abandoned subway car, with bubbles and detailed water flow accurately simulated.
Photo of a fruit bowl consisting of real fruits mixed with miniature planets (Jupiter, Saturn, Mars, Earth), maintaining realistic reflections, lighting, and shadows consistent with original photo, clean composition, authentic textures, crisp detailed rendering
A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.

محدودیت‌ها

مدل ما بی‌نقص نیست. ما در حال حاضر از محدودیت‌های متعددی آگاهیم که پس از عرضه اولیه، با بهبود مدل، برای رفع آنها تلاش خواهیم کرد.

برش

ما متوجه شده‌ایم که GPT‑4o گاهی اوقات می‌تواند تصاویر بلندتر، مانند پوسترها، را بیش از حد نزدیک به لبه برش دهد، به ویژه در قسمت پایین.

ایمنی

مطابق با مشخصات مدل ما، هدف ما به حداکثر رساندن آزادی خلاقانه با پشتیبانی از موارد استفاده ارزشمند مانند توسعه بازی، کاوش تاریخی و آموزش است - در عین حال که استانداردهای ایمنی قوی را حفظ می‌کنیم. در عین حال، مسدود کردن درخواست‌هایی که این استانداردها را نقض می‌کنند، همچنان به همان اندازه مهم باقی می‌ماند. در زیر ارزیابی‌هایی از حوزه‌های خطر اضافی که در آن‌ها برای فعال‌سازی محتوای ایمن و با کاربرد بالا و حمایت از بیان خلاقانه‌تر برای کاربران تلاش می‌کنیم، آمده است.

منشأ از طریق C2PA و جستجوی برگشت‌پذیر داخلی
تمام تصاویر تولید شده با فراداده C2PA ارائه می‌شوند که تصویر را به عنوان تصویری از GPT‑4o شناسایی می‌کند تا شفافیت را فراهم کند. ما همچنین یک ابزار جستجوی داخلی ساخته‌ایم که از ویژگی‌های فنی نسل‌ها برای کمک به تأیید اینکه آیا محتوا از مدل ما آمده است یا خیر، استفاده می‌کند.

مسدود کردن چیزهای بد
ما همچنان درخواست‌های مربوط به تصاویر تولید شده‌ای که ممکن است سیاست‌های محتوای ما را نقض کنند، مانند مطالب مربوط به سوءاستفاده جنسی از کودکان و دیپ‌فیک‌های جنسی، را مسدود می‌کنیم. وقتی تصاویر افراد واقعی در متن قرار می‌گیرند، محدودیت‌های بیشتری در مورد نوع تصاویری که می‌توان ایجاد کرد داریم، به ویژه تدابیر حفاظتی قوی در مورد برهنگی و خشونت گرافیکی اعمال می‌شود. همانند هر راه‌اندازی، ایمنی هرگز به پایان نمی‌رسد و یک حوزه سرمایه‌گذاری مداوم است. همان‌طور که اطلاعات بیشتری دربارهٔ استفاده واقعی از این مدل کسب می‌کنیم، سیاست‌هایمان را بر این اساس تنظیم خواهیم کرد.

برای اطلاعات بیشتر درباره رویکرد ما، به ضمیمه تولید تصویر کارت سیستم GPT‑4o سر بزنید.

استفاده از استدلال برای افزایش ایمنی
مشابه کار هم‌ترازی مشورتی ما، یک LLM استدلالی را آموزش داده‌ایم تا مستقیماً از مشخصات ایمنی نوشته شده توسط انسان و قابل تفسیر استفاده کند. ما در طول توسعه از این LLM استدلال برای کمک به شناسایی و رفع ابهامات در سیاست‌هایمان استفاده کردیم. این امر، همراه با پیشرفت‌های چندوجهی ما و تکنیک‌های ایمنی موجود که برای ChatGPT و Sora توسعه داده شده‌اند، به ما امکان می‌دهد تا هم متن ورودی و هم تصاویر خروجی را در برابر سیاست‌های خود نظارت کنیم.

دسترسی و در دسترس بودن

قابلیت تولید تصویر 4o از امروز برای کاربران نسخه‌های پلاس، پرو، تیمی و رایگان به عنوان تولیدکننده پیش‌فرض تصویر در ChatGPT عرضه می‌شود و به زودی برای کاربران نسخه‌های سازمانی و آموزشی نیز در دسترس قرار خواهد گرفت. همچنین می‌توانی از آن در Sora استفاده کنی. برای کسانی که جایگاه ویژه‌ای برای DALL·E در قلبشان دارند، هنوز هم می‌توانید از طریق یک GPT اختصاصی DALL·E به آن دسترسی پیدا کنید.

توسعه‌دهندگان به زودی قادر خواهند بود از طریق API، تصاویر را با استفاده از GPT‑4o تولید کنند و این دسترسی طی چند هفته آینده ارائه خواهد شد.

ایجاد و سفارشی‌سازی تصاویر به سادگی چت کردن با استفاده از GPT‑4o است - فقط آنچه را که نیاز دارید شرح دهید، از جمله هرگونه جزئیاتی مانند نسبت ابعاد، رنگ‌های دقیق با استفاده از کدهای هگز یا پس‌زمینه شفاف. چون این مدل تصاویر با جزئیات بیشتری ایجاد می‌کند، رندر تصاویر بیشتر طول می‌کشد و اغلب تا یک دقیقه زمان می‌برد.

credit creator: [Alex Duffy](https://every.to/@AlxAi)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: Cassandra Ansara
credit creator: [Isa](https://www.instagram.com/isabelitavirtual/?igsh=ZHdoYjFwYzV6dzFi#)
credit creator: [Isa](https://www.instagram.com/isabelitavirtual/?igsh=ZHdoYjFwYzV6dzFi#)
credit creator: Les Morgan
credit creator: Les Morgan
credit creator: [Derya Unatmaz](https://x.com/deryatr_)
credit creator: [Derya Unatmaz](https://x.com/deryatr_)
credit creator: [Derya Unatmaz](https://x.com/deryatr_)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Eugenio Marongiu](https://www.instagram.com/katsukokoiso.ai/?igsh=YTduZnNjZ2RhdTM3#)
credit creator: [Eugenio Marongiu](https://www.instagram.com/katsukokoiso.ai/?igsh=YTduZnNjZ2RhdTM3#)
credit creator: Jesse Kramme
credit creator: Jesse Kramme
credit creator: Matthew Dear
credit creator: [Minh Do](https://www.instagram.com/minhsmind/?igsh=MTFscDRqZ3JiZHVveA%3D%3D#)
credit creator: [Niceaunties](https://www.instagram.com/niceaunties/?igsh=Nm1jZmV4YTF6MTQ%3D#)
credit creator: Eskcanta
credit creator: Eskcanta
credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
credit creator: Shane Copenhagen
credit creator: Will Maberry
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: [Alex Duffy](https://every.to/@AlxAi)

پخش مجدد زنده

نویسنده

OpenAI

رهبری

گابریل گو: تولید تصویر

جکی شانون: محصول ChatGPT

منگچائو ژونگ، وین چانگ: مهندسی ChatGPT

روهان صحایی: محصول و مهندسی Sora

برندن کوئین، تامر کفتان: استنتاج

پرافولا داریوال: سازمان چند مدلی

تحقیق

پژوهش‌های بنیادی

آلن جبری، دیوید مدینا، گابریل گو، کنجی هاتا، لو لیو، پرافولا داریوال

پژوهش‌های اصلی

آدیتیا رامش، الکس نیکول، کیسی چو، چنگ لو، دیان آنگ یاپ، هیوو جون، جیمز بتکر، جیانفنگ وانگ، لانگ اوویانگ، لی جینگ، وسام ماناسرا

مشارکت‌کنندگان در پژوهش

آیدن لو، براندون مک کینزی، چارلی نش، هویون چانگ، ایشان گلراجانی، جیمی کیروس، جی لین، کشتیج گوپتا، یانگ سونگ

رفتار مدلی

لورنتیا رومانیوک

سازمان چند مدلی

اندرو گیبیانسکی، یانگ لو

داده

سرپرستان داده

گیلداس چابوت، جیمز پارک لنون

داده

آرشی باتناگار، دراگوس اوپریکا، روهان کشیرساگار، اسپنسر پاپای، سی چیه یو، وسام مناسرا، ییلی کیان

مدیران

هیزل برن، جنیفر لاکنبیل، ماریانو لوپز

مشاوران داده انسانی

لانگ اویانگ

مقیاس‌بندی

سرپرستان استنتاج

برندان کوئین، تامر کفتان

استنتاج

آلیسا هوانگ، جیکوب منیک، نیک استاتاس، روسلان واسیلوف، استنلی هسیه

کاربردی

سرپرست محصول ChatGPT

جکی شانون

سرپرستان مهندسی ChatGPT

منگچائو ژونگ، وین چانگ

سرپرست طراحی محصول

مت چان

دانشمند داده

شیائولین هائو

ChatGPT

اندرو سیما، آنی چنگ، بنجامین گو، بویانگ نیو، دیان آنگ یاپ، دوک تران، ادده اویوو، اریک ژانگ، ایتان چانگ، جفری دانهام، جی چن، کان وو، کارن لی، کلی استیرمن، منگیوان شو، میشل کین، اولا اوکلولا، پدرو آگیلار، راکی اسمیت، روهیت رامچاندانی، سارا کالور، شان فیتزجرالد، ولاد فومنکو، وانینگ جیانگ، وسام ماناسرا، شیائولین هائو، ییلی کیان

Sora

سرپرستان محصول Sora

روحان صحاي، وسام منصرا

مهندسی و محصولات Sora

بویانگ نیو، دیوید اشنور، گیلمن تول، جو تیلور، جوی فلین، مایک استار، راجیو نایاک، روهان صاحای، وسام ماناسرا

ایمنی

سرپرست ایمنی

سومای جین

ایمنی

الکس بوتل، آندریا والونه، بوتائو هائو، برندان کوئین، کامرون ریموند، چونگ ژانگ، دیوید رابینسون، اریک والاس، فیلیپو راسو، هویون چانگ، ایان کیولیچان، ایرینا کوفمن، کرن گو-لمبرگ، کریستن یینگ، مادلاین بوید، مگان شاه، مایکل لمپی، اوون کمپبل-مور، روهان ساهای، رودریگو ریازا پرز، سام تویزر، ساندینی آگاروال، تروی پترسون

استراتژی

آدام کوهن، آدام ولز، آلی بنت، اشلی پانتولیانو، کارولینا پاز، کلودیا فیشر، دکلان گراب، گبی ساکرامون-لوتز، لورن جوناس، رایان بایرمایستر، شیائو لی، تام استاسی، تایس والترز، زیاد رسلان، زوئی استول

بازاریابی و ارتباطات

ارتباطات و سرنخ‌های بازاریابی

مینیا فنگ، ناتالی سامرز، تایا کریستینسون

ارتباطات

الکس بیکر-ویتکامب، اشلی تایرا، بیلی ریچاردسون، گبی رایلا، مارسلوس کیتون، اسکات اتراسمیت، سوکی منصور

طراحی و خلاقیت

سرنخ‌ها

کندرا ریمباخ، ویت مولر

طراحی

آدام براندون، آدام کوپل، آنجلا باک، کری هادسون، دانا پالمی، فردی سولیت، جفری سابین ماتسوموتو، لیان لو، مت نیکولز، توماس دگری، ونسا آنتونیا شفکه، یارا خاکباز

تشکر ویژه

آدیتیا رامش، آیدان کلارک، الکس بیوتل، بن نیوهاوس، بن روسن، چه چانگ، گرگ بروکمن، هانا وونگ، ایشان سیگال، جیسون کوان، جیاچنگ فنگ، جیاهوی یو، جوآن جانگ، یوهانس هایدکه، کوین ویل، مارک چن، میا گلیز، نیک ترلی، رائول پوری، رییچیرو ناکانو، روئی شو، سم آلتمن، شوچائو بی، وینی موناکو