ข้ามไปยังเนื้อหาหลัก
OpenAI

ขอแนะนำ 4o Image Generation

การปลดล็อกการสร้างภาพที่มีประโยชน์และมีคุณค่าด้วยโมเดลประมวลผลข้อมูลหลากหลายรูปแบบที่สามารถให้เอาต์พุตที่แม่นยำ ถูกต้อง และเหมือนจริง

กำลังโหลด…

ที่ OpenAI เราเชื่อมาอย่างยาวนานว่าการสร้างภาพควรเป็นความสามารถหลักของโมเดลภาษาของเรา นั่นเป็นเหตุผลที่เราได้สร้างตัวสร้างภาพที่ล้ำหน้าที่สุดของเราใน GPT‑4o ผลลัพธ์คือการสร้างภาพที่ไม่เพียงแต่สวยงาม แต่ยังมีประโยชน์อีกด้วย

A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt wiith a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.

The text reads:

(left)
"Transfer between Modalities:

Suppose we directly model
p(text, pixels, sound) [equation]
with one big autoregressive transformer.

Pros:
* image generation augmented with vast world knowledge
* next-level text rendering
* native in-context learning
* unified post-training stack

Cons:
* varying bit-rate across modalities
* compute not adaptive"

(Right)
"Fixes:
* model compressed representations
* compose autoregressive prior with a powerful decoder"

On the bottom right of the board, she draws a diagram:
"tokens -> [transformer] -> [diffusion] -> pixels"

oai_image-generation_whiteboard1

Best of 8

selfie view of the photographer, as she turns around to high five him

oai_image-generation_whiteboard2

Best of 8

การสร้างภาพที่มีประโยชน์

ตั้งแต่ภาพวาดในถ้ำยุคแรกจนถึงอินโฟกราฟิกสมัยใหม่ มนุษย์ได้ใช้ภาพเพื่อสื่อสาร โน้มน้าวใจ และวิเคราะห์ ไม่ใช่แค่เพื่อตกแต่งเท่านั้น โมเดลการสร้างในปัจจุบันสามารถสร้างฉากที่เหนือจริงและน่าทึ่งได้ แต่ยังคงมีปัญหากับภาพที่ใช้ในการแบ่งปันและสร้างข้อมูล ตั้งแต่โลโก้ไปจนถึงแผนภาพ ภาพสามารถสื่อความหมายที่ชัดเจนได้เมื่อเสริมด้วยสัญลักษณ์ที่อ้างอิงถึงภาษาและประสบการณ์ร่วมกัน

การสร้างภาพ GPT‑4o มีความเป็นเลิศในการแสดงข้อความอย่างแม่นยํา ทําตามคำสั่งอย่างแม่นยํา และใช้ประโยชน์จากความรู้และบริบทการแชตโดยธรรมชาติของ 4o รวมถึงการแปลงภาพที่อัปโหลดหรือใช้เป็นแรงบันดาลใจทางภาพ ความสามารถเหล่านี้ทำให้ง่ายต่อการสร้างภาพที่คุณจินตนาการไว้ ช่วยให้คุณสื่อสารได้อย่างมีประสิทธิผลมากขึ้นผ่านภาพ และพัฒนาการสร้างภาพให้กลายเป็นเครื่องมือที่ใช้งานได้จริงด้วยความแม่นยำและความทรงพลัง

ความสามารถที่ปรับปรุง

เราได้ฝึกโมเดลของเราบนการแจกแจงร่วมของภาพและข้อความออนไลน์ โดยเรียนรู้ไม่เพียงแค่ว่าภาพเกี่ยวข้องกับภาษาอย่างไร แต่ยังรวมถึงความสัมพันธ์ระหว่างภาพด้วย เมื่อรวมกับการฝึกสอนหลังการใช้งานที่เข้มข้น โมเดลที่ได้จะมีความสามารถในการสร้างภาพที่น่าประหลาดใจ ที่สามารถสร้างภาพที่มีประโยชน์ สอดคล้อง และเข้าใจบริบท

การเรนเดอร์ข้อความ

ภาพหนึ่งภาพสามารถอธิบายแทนคำพูดได้นับพันคำ แต่บางครั้งการใส่คำเพียงไม่กี่คำในตำแหน่งที่เหมาะสมก็สามารถถ่ายทอดความหมายของภาพนั้นได้มากขึ้น ความสามารถของ 4o ในการผสมผสานสัญลักษณ์ที่แม่นยำกับภาพทำให้การสร้างภาพกลายเป็นเครื่องมือสำหรับการสื่อสารด้วยภาพ

Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign.

Context:
a city street in a random street in Williamsburg, NY with a pole covered entirely by numerous detailed street signs (e.g., street sweeping hours, parking permits required, vehicle classifications, towing rules), including few ridiculous signs at the middle: (paraphrase it to make these legitimate street signs)"Broom Parking for Witches Not Permitted in Zone C" and "Magic Carpet Loading and Unloading Only (15-Minute Limit)" and "Reindeer Parking by Permit Only (Dec 24–25)
Violators will be placed on Naughty List." The signpost is on the right of a street. Do not repeat signs. Signs must be realistic.

Characters:
one witch is holding a broom and the other has a rolled-up magic carpet. They are in the foreground, back slightly turned towards the camera and head slightly tilted as they scrutinize the signs.

Composition from background to foreground:
streets + parked cars + buildings -> street sign -> witches. Characters must be closest to the camera taking the shot

image-gen-4o-street-sign

Best of ~8

การสร้างหลายรอบ

เนื่องจากการสร้างภาพเป็นแบบ GPT‑4o คุณจึงสามารถปรับแต่งภาพผ่านการสนทนาที่เป็นธรรมชาติได้ GPT‑4o สามารถสร้างจากรูปภาพและข้อความในบริบทการแชต เพื่อให้แน่ใจว่ามีความสอดคล้องกันตลอด ตัวอย่างเช่น หากคุณกำลังออกแบบตัวละครในวิดีโอเกม ลักษณะของตัวละครจะยังคงมีความสอดคล้องกันแม้จะทำซ้ำหลายครั้งในขณะที่คุณปรับแต่งและทดลอง

minnias cat input

Give this cat a detective hat and a monocle

minnias-cat-2

Best of 1

turn this into a triple A video games made with a 4k game engine and add some User interface as overlay from a mystery RPG where we can see a health bar and a minimap at the top as well as spells at the bottom with consistent and iconography

minnias cat2

Best of 1

update to a landscape image 16:9 ratio, add more spells in the UI, and unzoom the visual so that we see the cat in a third person view walking through a steampunk manhattan creating beautiful contrast and lighting like in the best triple A game, with cool-toned colors

minnias cat3

Best of 2

create the interface when the player opens the menu and we see the cat's character profile with his equipment and another page showing active quests (and it should make sense in relationship with the universe worldbuilding we are describing in the image)

minnias cat4

Best of 8

credit creator: Manuel Sainsily

การปฏิบัติตามคำสั่ง

การสร้างภาพของ GPT‑4o ปฏิบัติตามคำสั่งที่ละเอียดด้วยความใส่ใจในรายละเอียด ในขณะที่ระบบอื่นๆ ประสบปัญหากับวัตถุประมาณ 5-8 ชิ้น GPT‑4o สามารถจัดการวัตถุที่แตกต่างกันได้มากถึง 10-20 ชิ้น การผูกวัตถุเข้ากับลักษณะและความสัมพันธ์ได้อย่างแน่นแฟ้นยิ่งขึ้นช่วยให้ควบคุมได้ดีขึ้น

A square image containing a 4 row by 4 column grid containing 16 objects on a white background. Go from left to right, top to bottom. Here's the list:
1. a blue star
2. red triangle
3. green square
4. pink circle
5. orange hourglass
6. purple infinity sign
7. black and white polka dot bowtie
8. tiedye "42"
9. an orange cat wearing a black baseball cap
10. a map with a treasure chest
11. a pair of googly eyes
12. a thumbs up emoji
13. a pair of scissors
14. a blue and white giraffe
15. the word "OpenAI" written in cursive
16. a rainbow-colored lightning bolt

Screenshot 2025-03-24 at 10.07.12 AM

Best of 5

การเรียนรู้จากบริบทภายใน

GPT‑4o สามารถวิเคราะห์และเรียนรู้จากภาพที่ผู้ใช้อัปโหลด โดยผสานรวมรายละเอียดเข้ากับบริบทได้อย่างราบรื่นเพื่อใช้ในการสร้างภาพ

in-context-learning-prompt
  • draw a design for a vehicle with triangular wheels, using these images as reference.
  • label the front wheel, the back wheel, and at the of the diagram say (in small caps)
  • TRIANGLE WHEELED VEHICLE. English Patent. 2025. OPENAI.
Screenshot 2025-03-24 at 10.41.56 AM

Best of ~16

now put this in a photo taken in new york city.

Screenshot 2025-03-24 at 10.42.45 AM

Best of ~16

ความรู้เกี่ยวกับโลก

การสร้างภาพเนทีฟทำให้ 4o สามารถเชื่อมโยงความรู้ระหว่างข้อความกับรูปภาพได้ ส่งผลให้โมเดลดูฉลาดและมีประสิทธิภาพมากขึ้น

Code Example (Three.js)

HTML

1
<!DOCTYPE html>
2
<html lang="en">
3
<head>
4
<meta charset="UTF-8" />
5
<title>OpenAI Banner</title>
6
<style>
7
body { margin: 0; overflow: hidden; }
8
canvas { display: block; }
9
</style>
10
</head>
11
<body>
12
<script type="module">
13
import * as THREE from 'https://cdn.jsdelivr.net/npm/three@0.160.0/build/three.module.js';
14
import { OrbitControls } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/controls/OrbitControls.js';
15
import { FontLoader } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/loaders/FontLoader.js';
16
import { TextGeometry } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/geometries/TextGeometry.js';
17

18
const scene = new THREE.Scene();
19
const camera = new THREE.PerspectiveCamera(45, window.innerWidth / window.innerHeight, 0.1, 1000);
20
const renderer = new THREE.WebGLRenderer({ antialias: true });
21
renderer.setSize(window.innerWidth, window.innerHeight);
22
document.body.appendChild(renderer.domElement);
23

24
// Lighting
25
const light = new THREE.AmbientLight(0xffffff, 1);
26
scene.add(light);
27

28
const dirLight = new THREE.DirectionalLight(0xffffff, 1);
29
dirLight.position.set(0, 5, 10);
30
scene.add(dirLight);
31

32
// Camera position
33
camera.position.z = 20;
34

35
// Controls
36
const controls = new OrbitControls(camera, renderer.domElement);
37

38
// Banner background
39
const bannerGeometry = new THREE.PlaneGeometry(20, 10);
40
const bannerMaterial = new THREE.MeshStandardMaterial({ color: 0x1a1a1a });
41
const banner = new THREE.Mesh(bannerGeometry, bannerMaterial);
42
scene.add(banner);
43

44
// OpenAI Logo texture (placeholder)
45
const loader = new THREE.TextureLoader();
46
loader.load('https://upload.wikimedia.org/wikipedia/commons/4/4d/OpenAI_Logo.svg', texture => {
47
const logoGeometry = new THREE.PlaneGeometry(4, 4);
48
const logoMaterial = new THREE.MeshBasicMaterial({ map: texture, transparent: true });
49
const logo = new THREE.Mesh(logoGeometry, logoMaterial);
50
logo.position.set(-5, 0, 0.1); // Slightly in front of the banner
51
scene.add(logo);
52
});
53

54
// Load font and add text
55
const fontLoader = new FontLoader();
56
fontLoader.load('https://threejs.org/examples/fonts/helvetiker_regular.typeface.json', font => {
57
const textGeometry = new TextGeometry("I am 4-o", {
58
font: font,
59
size: 1,
60
height: 0.2,
61
curveSegments: 12,
62
bevelEnabled: true,
63
bevelThickness: 0.02,
64
bevelSize: 0.02,
65
bevelOffset: 0,
66
bevelSegments: 5
67
});
68

69
textGeometry.center();
70

71
const textMaterial = new THREE.MeshStandardMaterial({ color: 0x00ffcc });
72
const textMesh = new THREE.Mesh(textGeometry, textMaterial);
73
textMesh.position.set(5, -0.5, 0.1); // Opposite side of logo
74
scene.add(textMesh);
75
});
76

77
// Resize handler
78
window.addEventListener('resize', () => {
79
camera.aspect = window.innerWidth / window.innerHeight;
80
camera.updateProjectionMatrix();
81
renderer.setSize(window.innerWidth, window.innerHeight);
82
});
83

84
// Render loop
85
function animate() {
86
requestAnimationFrame(animate);
87
controls.update();
88
renderer.render(scene, camera);
89
}
90

91
animate();
92
</script>
93
</body>
94
</html>

make an image of what this means to you

Screenshot 2025-03-18 at 11.46.24 AM

ความสมจริงของภาพถ่ายและสไตล์

การฝึกอบรมเกี่ยวกับภาพที่สะท้อนถึงรูปแบบภาพที่หลากหลาย ช่วยให้โมเดลสามารถสร้างหรือแปลงโฉมภาพได้อย่างน่าเชื่อถือ

A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.
A cat looking into a puddle of water on a street, but its reflection is that of a tiger, and both reflections are realistically distorted by ripples in the water
Generate a candid, Polaroid-style photograph of four diverse friends in their early 20s at a gritty dive bar. The lighting features a very harsh, direct flash, creating sharp shadows and giving the photo a very overexposed, vintage instant-camera feel. Colors should be slightly muted, evoking nostalgic, early-2000s party vibes. The aesthetic is casually emo. No border or logos or signs. There's an interesting looking wall behind them with some light graffiti. Quality of the image should be very sharp and detailed (very little grain). The energy should be silly and chaotic. They're either playfully grimacing, smiling, or pretending to look tough. One of them should have their friend in a silly, playful headlock. Their mouths are closed.
Generate a photorealistic image of farmer's market in toronto on a saturday in summer 2006, it's a beautiful late june day, people are shopping and eating sandwiches. in focus should be a young asian girl wearing denim overalls and sipping on a strawberry banana smoothie - rest can be blurred. the photo should be reminiscent of that a digital camera from 2006 would take, with a timestamp like a printed photo would have. aspect ratio should be 3:2
blurry old analog film photograph, picture of parked car on side street, quiet night. credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
Create image super-realistic picture of these 4 creatures playing poker on a picnic blanket, zoomed out, in dolores park. photorealistic. The tabby long haired cat is holding a hand; right next to it are 2 tall vertical black chips (with stripes) as it has been raking in the dough.  Tabby's pupils are large and cute, and ii looking down and scrutinizing its cards, focused. Derpy black cat went all in. Two dogs are peering over cat's shoulder to see their cards. All cards are face down and of the same back color except for an exposed three of diamonds. small stack of poker chips are in front of each creature, but black cat went all in. the two dogs folded. All chips are from the same set and all cards have same color. photorealistic, shot on iphone, raw format.
Best of 1 | Generate an portrait ad on a solid pastel background.

In solid white san serif text, "ChatGPT image generation" in the top left, about a third of the way down.

In solid white san serif text, "Form follows function", in the bottom right, about a third of the way up.

In the background, put a photo of a really sleek, modern sculpture. It should gradually transition from a wireframe sketch on the left to the fully photorealistic version on the right. 

At the very bottom, in medium-small text, say "This entire poster was generated by ChatGPT image generation."
A lone astronaut floats inside a vast space station, painting swirling galaxies onto a massive canvas that hangs weightlessly in the air. Their paintbrush leaves behind trails of cosmic dust, and their suit is stained with nebula-colored hues. Their helmet is off, revealing eyes filled with the reflection of distant planets. Outside the glass window, a black hole looms, twisting light into mesmerizing patterns.
Realistic photograph of a horse galloping from right to left across a vast, calm ocean surface, accurately depicting splashes, reflections, and subtle ripple patterns beneath their hooves. Exaggerate horse movements but everything else should be still, quiet to show contrast with the horse's strength. clean composition, cinematographic. A wide, panoramic composition showcasing a distant horizon. Atmospheric perspective creating depth. zoomed out so the horse appears minuscule compared to vast ocean.

horse is right at the horizon where ocean meets sky. use rule of thirds to position horse. size of horse is 1% size of entire image because camera is so far away from subject. camera view is super close to the ground/ocean like a worm's eye view. horse is galloping right where ocean meets the sky
A realistic underwater scene with dolphins swimming through the windows of an abandoned subway car, with bubbles and detailed water flow accurately simulated.
Photo of a fruit bowl consisting of real fruits mixed with miniature planets (Jupiter, Saturn, Mars, Earth), maintaining realistic reflections, lighting, and shadows consistent with original photo, clean composition, authentic textures, crisp detailed rendering
A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.

ข้อจำกัด

โมเดลของเรายังไม่สมบูรณ์แบบ พวกเราตระหนักถึงข้อจำกัดหลายประการในขณะนี้ ซึ่งพวกเราจะดำเนินการแก้ไขผ่านการปรับปรุงโมเดลหลังจากการเปิดตัวครั้งแรก

การครอบตัด

เราได้สังเกตว่า GPT‑4o อาจครอบตัดภาพที่ยาวขึ้น เช่น โปสเตอร์ แน่นเกินไปในบางครั้ง โดยเฉพาะบริเวณด้านล่าง

ความปลอดภัย

เรามุ่งเป้าที่จะเพิ่มอิสระในการสร้างสรรค์ให้ถึงขีดสูงสุดในลักษณะที่สอดคล้องกับข้อมูลจำเพาะของโมเดลของเรา โดยสนับสนุนกรณีการใช้งานที่มีคุณค่า เช่น การพัฒนาเกม การสำรวจประวัติศาสตร์ และการศึกษา ไปพร้อมกับยังคงรักษามาตรฐานความปลอดภัยที่เข้มงวด ในขณะเดียวกัน การบล็อกคำขอที่ละเมิดมาตรฐานเหล่านั้นยังคงมีความสำคัญเช่นเดิม ด้านล่างนี้คือการประเมินด้านที่เสี่ยงเพิ่มเติม ซึ่งเรากำลังดำเนินการเพื่อเปิดการใช้งานเนื้อหาที่ปลอดภัยและมีประโยชน์สูง และสนับสนุนการแสดงออกทางความคิดสร้างสรรค์ในวงกว้างสำหรับผู้ใช้

แหล่งที่มาผ่าน C2PA และการค้นหาแบบย้อนกลับภายใน
ภาพที่สร้างขึ้นทั้งหมดมาพร้อมกับข้อมูลเมตาดาต้า C2PA ซึ่งจะระบุว่าภาพมาจาก GPT‑4o เพื่อให้เกิดความโปร่งใส นอกจากนี้ เราได้พัฒนาเครื่องมือค้นหาภายในที่ใช้คุณลักษณะทางเทคนิคของการสร้างสรรค์เพื่อช่วยตรวจสอบว่าเนื้อหามาจากโมเดลของเราหรือไม่

การบล็อกสิ่งที่ไม่ดี
เรายังคงบล็อกคำขอภาพที่สร้างขึ้นต่อไป ซึ่งอาจละเมิดนโยบายเนื้อหาของเรา เช่น สื่อเกี่ยวกับการล่วงละเมิดทางเพศเด็กและดีปเฟคลามกอนาจารทางเพศ ในกรณีที่มีภาพของคนจริงอยู่ในบริบท เราได้เพิ่มข้อจำกัดที่เข้มงวดมากขึ้นเกี่ยวกับประเภทของภาพที่สามารถสร้างได้ โดยมีมาตรการป้องกันที่เข้มงวดเป็นพิเศษในเรื่องภาพเปลือยและความรุนแรงทางกราฟิก เช่นเดียวกับการเปิดตัวใดๆ ความปลอดภัยไม่เคยเสร็จสิ้นและเป็นการลงทุนที่ต่อเนื่อง เมื่อเราได้เรียนรู้เพิ่มเติมเกี่ยวกับการใช้งานจริงของโมเดลนี้ เราจะปรับนโยบายของเราให้เหมาะสม

หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับแนวทางของเรา โปรดไปที่ภาคผนวกการสร้างภาพในการ์ดระบบ GPT‑4o

การใช้เหตุผลเพื่อเพิ่มความปลอดภัย
คล้ายกับงานการกำหนดแนวการทำงานที่รอบคอบของเรา เราได้ฝึก LLM ด้านการใช้เหตุผลให้ทำงานโดยตรงจากข้อกำหนดด้านความปลอดภัยที่เขียนโดยมนุษย์และสามารถตีความได้ เราใช้ LLM ที่ให้เหตุผลนี้ในระหว่างการพัฒนาเพื่อช่วยให้เราระบุและจัดการกับความคลุมเครือในนโยบายของเรา สิ่งนี้พร้อมด้วยความก้าวหน้าหลายโหมดและเทคนิคความปลอดภัยที่มีอยู่และได้รับการพัฒนาสำหรับ ChatGPT และ Sora ช่วยให้เราสามารถควบคุมดูแลทั้งข้อความอินพุตและรูปภาพเอาต์พุตให้เป็นไปตามนโยบายของเราได้

การเข้าถึงและความพร้อมให้บริการ

การสร้างภาพ 4o เริ่มเปิดตัวตั้งแต่วันนี้สำหรับผู้ใช้ Plus, Pro, Team และ Free โดยเป็นตัวสร้างภาพเริ่มต้นใน ChatGPT และจะเปิดให้ใช้งานใน Enterprise และ Edu ได้ในเร็วๆ นี้ นอกจากนี้ ยังมีให้ใช้ใน Sora สำหรับผู้ที่ชื่นชอบ DALL·E เป็นพิเศษ ก็ยังเข้าถึงได้ผ่าน DALL·E GPT โดยเฉพาะ

นักพัฒนาจะสามารถสร้างภาพด้วย GPT‑4o ผ่าน API ได้ในไม่ช้า โดยจะเริ่มเปิดตัวให้เข้าใช้งานได้ในอีกไม่กี่สัปดาห์ข้างหน้า

การสร้างและปรับแต่งภาพนั้นง่ายดายเหมือนกับการแชตโดยใช้ GPT‑4o เพียงแค่อธิบายสิ่งที่คุณต้องการ รวมถึงข้อมูลเฉพาะต่างๆ เช่น อัตราส่วนภาพ สีที่แน่นอนโดยใช้รหัสเลขฐานสิบหก หรือพื้นหลังที่โปร่งใส เนื่องจากโมเดลนี้สร้างภาพที่มีรายละเอียดมากขึ้น จึงใช้เวลาในการแสดงผลภาพนานขึ้น โดยมักจะใช้เวลาถึงหนึ่งนาที

credit creator: [Alex Duffy](https://every.to/@AlxAi)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#)
credit creator: Cassandra Ansara
credit creator: [Isa](https://www.instagram.com/isabelitavirtual/?igsh=ZHdoYjFwYzV6dzFi#)
credit creator: [Isa](https://www.instagram.com/isabelitavirtual/?igsh=ZHdoYjFwYzV6dzFi#)
credit creator: Les Morgan
credit creator: Les Morgan
credit creator: [Derya Unatmaz](https://x.com/deryatr_)
credit creator: [Derya Unatmaz](https://x.com/deryatr_)
credit creator: [Derya Unatmaz](https://x.com/deryatr_)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Elene Chekurishvili](https://www.instagram.com/th_ene_ighbor/?igsh=eDh2Z2kyOGhnaXA0#)
credit creator: [Eugenio Marongiu](https://www.instagram.com/katsukokoiso.ai/?igsh=YTduZnNjZ2RhdTM3#)
credit creator: [Eugenio Marongiu](https://www.instagram.com/katsukokoiso.ai/?igsh=YTduZnNjZ2RhdTM3#)
credit creator: Jesse Kramme
credit creator: Jesse Kramme
credit creator: Matthew Dear
credit creator: [Minh Do](https://www.instagram.com/minhsmind/?igsh=MTFscDRqZ3JiZHVveA%3D%3D#)
credit creator: [Niceaunties](https://www.instagram.com/niceaunties/?igsh=Nm1jZmV4YTF6MTQ%3D#)
credit creator: Eskcanta
credit creator: Eskcanta
credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
credit creator: [Roope Rainisto](https://www.instagram.com/never_ever_never_land/?igsh=MXh3N3EyOWdoMmNubg%3D%3D#)
credit creator: Shane Copenhagen
credit creator: Will Maberry
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: Manuel Sainsily
credit creator: [Alex Duffy](https://every.to/@AlxAi)

การรับชมไลฟ์สตรีมย้อนหลัง

ผู้เขียน

OpenAI

ภาวะผู้นำ

Gabriel Goh: การสร้างภาพ

Jackie Shannon: ผลิตภัณฑ์ ChatGPT

Mengchao Zhong, Wayne Chang: วิศวกรรม ChatGPT

Rohan Sahai: ผลิตภัณฑ์และวิศวกรรม Sora

Brendan Quinn, Tomer Kaftan: การอนุมาน

Prafulla Dhariwal: องค์กรแบบมัลติโหมด

การวิจัย

การวิจัยพื้นฐาน

Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal

การวิจัยหลัก

Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra

ผู้มีส่วนร่วมในการวิจัย

Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song

พฤติกรรมของโมเดล

Laurentia Romaniuk

องค์กรแบบมัลติโหมด

Andrew Gibiansky, Yang Lu

ข้อมูล

ผู้นำฝ่ายข้อมูล

Gildas Chabot, James Park Lennon

ข้อมูล

Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian

ผู้ดูแล

Hazel Byrne, Jennifer Luckenbill, Mariano López

ที่ปรึกษาด้านข้อมูลมนุษย์

Long Ouyang

การขยายผล

ลีดจากการอนุมาน

Brendan Quinn, Tomer Kaftan

การอนุมาน

Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh

ประยุกต์

ผู้นำฝ่ายผลิตภัณฑ์ ChatGPT

Jackie Shannon

ผู้นำด้านวิศวกรรม ChatGPT

Mengchao Zhong, Wayne Chang

ผู้นำฝ่ายออกแบบผลิตภัณฑ์

Matt Chan

วิทยาการข้อมูล

Xiaolin Hao

ChatGPT

Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian

Sora

ผู้นำด้านผลิตภัณฑ์ Sora

Rohan Sahai, Wesam Manassra

ฝ่ายผลิตภัณฑ์และวิศวกรรม Sora

Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra

ความปลอดภัย

ผู้นำฝ่ายความปลอดภัย

Somay Jain

ความปลอดภัย

Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson

กลยุทธ์

Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll

การตลาดและการสื่อสาร

ผู้นำฝ่ายการสื่อสารและการตลาด

Minnia Feng, Natalie Summers, Taya Christianson

การสื่อสาร

Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor

การออกแบบและความคิดสร้างสรรค์

ลีด

Kendra Rimbach, Veit Moeller

ดีไซน์

Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz

ขอบคุณเป็นพิเศษ

Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco