25 Μαρτίου 2025

Παρουσίαση μοντέλου δημιουργίας εικόνων 4o

Ξεκλειδώνοντας χρήσιμη και πολύτιμη παραγωγή εικόνων με ένα εγγενώς πολυτροπικό μοντέλο ικανό για ακριβή, φωτορεαλιστικά αποτελέσματα.

Δοκιμάστε το ChatGPT

Φόρτωση…

Στην OpenAI, πιστεύουμε εδώ και καιρό ότι η δημιουργία εικόνων πρέπει να είναι μια βασική ικανότητα των γλωσσικών μας μοντέλων. Γι' αυτό ενσωματώσαμε την πιο προηγμένη μας τεχνολογία δημιουργίας εικόνων στο GPT‑4o. Το αποτέλεσμα είναι δημιουργία εικόνων που δεν είναι μόνο όμορφες, αλλά και χρήσιμες.

A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt wiith a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer's reflection.

The text reads:

(left)
"Transfer between Modalities:

Suppose we directly model
p(text, pixels, sound) [equation]
with one big autoregressive transformer.

Pros:
* image generation augmented with vast world knowledge
* next-level text rendering
* native in-context learning
* unified post-training stack

Cons:
* varying bit-rate across modalities
* compute not adaptive"

(Right)
"Fixes:
* model compressed representations
* compose autoregressive prior with a powerful decoder"

On the bottom right of the board, she draws a diagram:
"tokens -> [transformer] -> [diffusion] -> pixels"

^{Best of 8}

selfie view of the photographer, as she turns around to high five him

^{Best of 8}

Χρήσιμη παραγωγή εικόνων

Από τις πρώτες ζωγραφιές σε σπήλαια μέχρι τα σύγχρονα infographics, οι άνθρωποι έχουν χρησιμοποιήσει οπτικές εικόνες για να επικοινωνούν, να πείθουν και να αναλύουν — όχι μόνο για να διακοσμούν. Τα σημερινά μοντέλα παραγωγής περιεχομένου μπορούν να δημιουργήσουν σουρεαλιστικές, εντυπωσιακές σκηνές, αλλά δυσκολεύονται με τις βασικές εικόνες που χρησιμοποιούν οι άνθρωποι για να μοιράζονται και να δημιουργούν πληροφορίες. Από τα λογότυπα έως τα διαγράμματα, οι εικόνες μπορούν να μεταφέρουν ακριβές νόημα, όταν ενισχύονται με σύμβολα που αναφέρονται σε κοινή γλώσσα και εμπειρία.

Η δημιουργία εικόνων GPT‑4o υπερέχει στην ακριβή απόδοση κειμένου, ακολουθώντας με ακρίβεια τις προτροπές και αξιοποιώντας την εγγενή βάση γνώσης και το περιβάλλον συνομιλίας του 4o—συμπεριλαμβανομένου του μετασχηματισμού των αποστελλόμενων εικόνων ή της χρήσης τους ως οπτικής έμπνευσης. Αυτές οι δυνατότητες κάνουν πιο εύκολη τη δημιουργία της εικόνας που φαντάζεσαι, βοηθώντας σε να επικοινωνείς πιο αποτελεσματικά μέσω εικαστικών στοιχείων και εξελίσσοντας τη δημιουργία εικόνων σε ένα πρακτικό εργαλείο με ακρίβεια και δύναμη.

Βελτιωμένες δυνατότητες

Εκπαιδεύσαμε τα μοντέλα μας στην κοινή κατανομή διαδικτυακών εικόνων και κειμένου, μαθαίνοντάς τα όχι μόνο πώς οι εικόνες σχετίζονται με τη γλώσσα, αλλά και πώς σχετίζονται μεταξύ τους. Σε συνδυασμό με την ενεργή εκπαίδευση μετά την αρχική εκπαίδευση, το μοντέλο που προκύπτει έχει εκπληκτική οπτική ευχέρεια, ικανό να δημιουργεί εικόνες που είναι χρήσιμες, συνεπείς και με επίγνωση του περιβάλλοντος.

Απόδοση κειμένου

Μια εικόνα αξίζει όσο χίλιες λέξεις, αλλά μερικές φορές η δημιουργία μερικών λέξεων στη σωστή θέση μπορεί να αναδείξει το νόημα μιας εικόνας. Η ικανότητα του 4o να συνδυάζει ακριβή σύμβολα με εικόνες μετατρέπει την παραγωγή εικόνων σε εργαλείο οπτικής επικοινωνίας.

Create a photorealistic image of two witches in their 20s (one ash balayage, one with long wavy auburn hair) reading a street sign.

Context:
a city street in a random street in Williamsburg, NY with a pole covered entirely by numerous detailed street signs (e.g., street sweeping hours, parking permits required, vehicle classifications, towing rules), including few ridiculous signs at the middle: (paraphrase it to make these legitimate street signs)"Broom Parking for Witches Not Permitted in Zone C" and "Magic Carpet Loading and Unloading Only (15-Minute Limit)" and "Reindeer Parking by Permit Only (Dec 24–25)
Violators will be placed on Naughty List." The signpost is on the right of a street. Do not repeat signs. Signs must be realistic.

Characters:
one witch is holding a broom and the other has a rolled-up magic carpet. They are in the foreground, back slightly turned towards the camera and head slightly tilted as they scrutinize the signs.

Composition from background to foreground:
streets + parked cars + buildings -> street sign -> witches. Characters must be closest to the camera taking the shot

^{Best of ~8}

Δημιουργία πολλαπλών γύρων

Επειδή η δημιουργία εικόνων είναι πλέον εγγενής στο GPT‑4o, μπορείς να βελτιώσεις τις εικόνες μέσω φυσικής συζήτησης. Το GPT‑4o μπορεί να βασιστεί σε εικόνες και κείμενο στο περιβάλλον συνομιλίας, διασφαλίζοντας συνέπεια καθ' όλη τη διαδικασία. Για παράδειγμα, αν σχεδιάζεις έναν χαρακτήρα βιντεοπαιχνιδιού, η εμφάνιση του χαρακτήρα παραμένει συνεπής σε πολλαπλές επαναλήψεις καθώς τη βελτιώνεις και πειραματίζεσαι.

Give this cat a detective hat and a monocle

^{Best of 1}

turn this into a triple A video games made with a 4k game engine and add some User interface as overlay from a mystery RPG where we can see a health bar and a minimap at the top as well as spells at the bottom with consistent and iconography

^{Best of 1}

update to a landscape image 16:9 ratio, add more spells in the UI, and unzoom the visual so that we see the cat in a third person view walking through a steampunk manhattan creating beautiful contrast and lighting like in the best triple A game, with cool-toned colors

^{Best of 2}

create the interface when the player opens the menu and we see the cat's character profile with his equipment and another page showing active quests (and it should make sense in relationship with the universe worldbuilding we are describing in the image)

^{Best of 8}

credit creator: Manuel Sainsily

Ακολουθήστε τις οδηγίες

Η δημιουργία εικόνων του GPT‑4o ακολουθεί λεπτομερείς προτροπές με προσοχή στη λεπτομέρεια. Ενώ άλλα συστήματα δυσκολεύονται με περίπου 5-8 αντικείμενα, το GPT‑4o μπορεί να διαχειριστεί έως και 10-20 διαφορετικά αντικείμενα. Η στενότερη σύνδεση των αντικειμένων με τα χαρακτηριστικά και τις σχέσεις τους επιτρέπει καλύτερο έλεγχο.

A square image containing a 4 row by 4 column grid containing 16 objects on a white background. Go from left to right, top to bottom. Here's the list:
1. a blue star
2. red triangle
3. green square
4. pink circle
5. orange hourglass
6. purple infinity sign
7. black and white polka dot bowtie
8. tiedye "42"
9. an orange cat wearing a black baseball cap
10. a map with a treasure chest
11. a pair of googly eyes
12. a thumbs up emoji
13. a pair of scissors
14. a blue and white giraffe
15. the word "OpenAI" written in cursive
16. a rainbow-colored lightning bolt

^{Best of 5}

Μάθηση στο περιβάλλον

Το GPT‑4o μπορεί να αναλύει και να μαθαίνει από εικόνες που αποστέλλουν οι χρήστες, ενσωματώνοντας απρόσκοπτα τις λεπτομέρειές τους στο περιβάλλον του για να βελτιώσει τη δημιουργία εικόνων.

draw a design for a vehicle with triangular wheels, using these images as reference.
label the front wheel, the back wheel, and at the of the diagram say (in small caps)
TRIANGLE WHEELED VEHICLE. English Patent. 2025. OPENAI.

^{Best of ~16}

now put this in a photo taken in new york city.

^{Best of ~16}

Παγκόσμια γνώση

Η εγγενής δημιουργία εικόνας ενεργοποιεί το 4o να δημιουργεί σύνδεσμο της γνώσης μεταξύ κειμένου και εικόνων, με αποτέλεσμα ένα μοντέλο που φαίνεται πιο έξυπνο και αποδοτικό.

Code Example (Three.js)

HTML

1<!DOCTYPE html>
2<html lang="en">
3  <head>
4    <meta charset="UTF-8" />
5    <title>OpenAI Banner</title>
6    <style>
7      body { margin: 0; overflow: hidden; }
8      canvas { display: block; }
9    </style>
10  </head>
11  <body>
12    <script type="module">
13      import * as THREE from 'https://cdn.jsdelivr.net/npm/three@0.160.0/build/three.module.js';
14      import { OrbitControls } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/controls/OrbitControls.js';
15      import { FontLoader } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/loaders/FontLoader.js';
16      import { TextGeometry } from 'https://cdn.jsdelivr.net/npm/three@0.160.0/examples/jsm/geometries/TextGeometry.js';
17
18      const scene = new THREE.Scene();
19      const camera = new THREE.PerspectiveCamera(45, window.innerWidth / window.innerHeight, 0.1, 1000);
20      const renderer = new THREE.WebGLRenderer({ antialias: true });
21      renderer.setSize(window.innerWidth, window.innerHeight);
22      document.body.appendChild(renderer.domElement);
23
24      // Lighting
25      const light = new THREE.AmbientLight(0xffffff, 1);
26      scene.add(light);
27
28      const dirLight = new THREE.DirectionalLight(0xffffff, 1);
29      dirLight.position.set(0, 5, 10);
30      scene.add(dirLight);
31
32      // Camera position
33      camera.position.z = 20;
34
35      // Controls
36      const controls = new OrbitControls(camera, renderer.domElement);
37
38      // Banner background
39      const bannerGeometry = new THREE.PlaneGeometry(20, 10);
40      const bannerMaterial = new THREE.MeshStandardMaterial({ color: 0x1a1a1a });
41      const banner = new THREE.Mesh(bannerGeometry, bannerMaterial);
42      scene.add(banner);
43
44      // OpenAI Logo texture (placeholder)
45      const loader = new THREE.TextureLoader();
46      loader.load('https://upload.wikimedia.org/wikipedia/commons/4/4d/OpenAI_Logo.svg', texture => {
47        const logoGeometry = new THREE.PlaneGeometry(4, 4);
48        const logoMaterial = new THREE.MeshBasicMaterial({ map: texture, transparent: true });
49        const logo = new THREE.Mesh(logoGeometry, logoMaterial);
50        logo.position.set(-5, 0, 0.1); // Slightly in front of the banner
51        scene.add(logo);
52      });
53
54      // Load font and add text
55      const fontLoader = new FontLoader();
56      fontLoader.load('https://threejs.org/examples/fonts/helvetiker_regular.typeface.json', font => {
57        const textGeometry = new TextGeometry("I am 4-o", {
58          font: font,
59          size: 1,
60          height: 0.2,
61          curveSegments: 12,
62          bevelEnabled: true,
63          bevelThickness: 0.02,
64          bevelSize: 0.02,
65          bevelOffset: 0,
66          bevelSegments: 5
67        });
68
69        textGeometry.center();
70
71        const textMaterial = new THREE.MeshStandardMaterial({ color: 0x00ffcc });
72        const textMesh = new THREE.Mesh(textGeometry, textMaterial);
73        textMesh.position.set(5, -0.5, 0.1); // Opposite side of logo
74        scene.add(textMesh);
75      });
76
77      // Resize handler
78      window.addEventListener('resize', () => {
79        camera.aspect = window.innerWidth / window.innerHeight;
80        camera.updateProjectionMatrix();
81        renderer.setSize(window.innerWidth, window.innerHeight);
82      });
83
84      // Render loop
85      function animate() {
86        requestAnimationFrame(animate);
87        controls.update();
88        renderer.render(scene, camera);
89      }
90
91      animate();
92    </script>
93  </body>
94</html>

make an image of what this means to you

Φωτορεαλισμός και στυλ

Η εκπαίδευση σε εικόνες που αντικατοπτρίζουν μια μεγάλη ποικιλία στυλ επιτρέπει στο μοντέλο να δημιουργεί ή να μεταμορφώνει εικόνες με πειστικό τρόπο.

A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.
A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.
A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.

A cat looking into a puddle of water on a street, but its reflection is that of a tiger, and both reflections are realistically distorted by ripples in the water — A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.
A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.
A candid paparazzi-style photo of Karl Marx hurriedly walking through the parking lot of the Mall of America, glancing over his shoulder with a startled expression as he tries to avoid being photographed. He’s clutching multiple glossy shopping bags filled with luxury goods. His coat flutters behind him in the wind, and one of the bags is swinging as if he’s mid-stride. Blurred background with cars and a glowing mall entrance to emphasize motion. Flash glare from the camera partially overexposes the image, giving it a chaotic, tabloid feel.

Περιορισμοί

Το μοντέλο μας δεν είναι τέλειο. Γνωρίζουμε ότι έχει πολλούς περιορισμούς αυτή τη στιγμή, τους οποίους θα προσπαθήσουμε να αντιμετωπίσουμε μέσω βελτιώσεων του μοντέλου μετά την αρχική κυκλοφορία.

Έχουμε παρατηρήσει ότι το GPT‑4o μπορεί περιστασιακά να περικόπτει μακρύτερες εικόνες, όπως αφίσες, πολύ στενά, ειδικά κοντά στο κάτω μέρος.

Ασφάλεια

Σύμφωνα με τις προδιαγραφές του μοντέλου μας, στοχεύουμε να μεγιστοποιήσουμε τη δημιουργική ελευθερία υποστηρίζοντας πολύτιμες περιπτώσεις χρήσης όπως η ανάπτυξη παιχνιδιών, η ιστορική εξερεύνηση και η εκπαίδευση, ενώ διατηρούμε ισχυρά πρότυπα ασφαλείας. Ταυτόχρονα, παραμένει εξίσου σημαντικό, όπως πάντα, να αποκλείουμε αιτήματα που παραβιάζουν αυτά τα πρότυπα. Παρακάτω θα βρείτε αξιολογήσεις πρόσθετων τομέων κινδύνου όπου εργαζόμαστε για να ενεργοποιήσουμε ασφαλές, υψηλής χρησιμότητας περιεχόμενο και να παρέχουμε υποστήριξη για ευρύτερη δημιουργική έκφραση προς τους χρήστες.

Προέλευση μέσω C2PA και εσωτερικής αναστρέψιμης αναζήτησης
Όλες οι δημιουργημένες εικόνες συνοδεύονται από μεταδεδομένα ⁠C2PA, τα οποία θα προσδιορίζουν μια εικόνα ως προερχόμενη από το GPT‑4o, για να παρέχουν διαφάνεια. Έχουμε επίσης δημιουργήσει ένα εσωτερικό εργαλείο αναζήτησης που χρησιμοποιεί τεχνικά χαρακτηριστικά παραγωγικών διαδικασιών, για να μας βοηθήσει να επαληθεύσουμε αν το περιεχόμενο προήλθε από το μοντέλο μας.

Αποκλεισμός των κακών στοιχείων
Συνεχίζουμε να μπλοκάρουμε αιτήματα για δημιουργούμενες εικόνες που μπορεί να παραβιάζουν τις πολιτικές περιεχομένου μας, όπως υλικό σεξουαλικής κακοποίησης παιδιών και σεξουαλικά deepfakes. Όταν οι εικόνες πραγματικών ανθρώπων βρίσκονται σε συγκεκριμένο περιβάλλον, επιβάλλουμε αυστηρότερους περιορισμούς σχετικά με το είδος των εικόνων που μπορούν να δημιουργηθούν, με ιδιαίτερα ισχυρές διασφαλίσεις που αφορούν το γυμνό και τη γραφική βία. Όπως σε κάθε νέα κυκλοφορία, η επιδίωξη της ασφάλειας δεν τελειώνει ποτέ και αποτελεί έναν συνεχή τομέα επένδυσης. Καθώς μαθαίνουμε περισσότερα για τη χρήση αυτού του μοντέλου στον πραγματικό κόσμο, θα προσαρμόσουμε τις πολιτικές μας ανάλογα.

Για περισσότερες πληροφορίες σχετικά με την προσέγγισή μας, επισκεφθείτε το παράρτημα για την παραγωγή εικόνων στην κάρτα συστήματος GPT‑4o⁠.

Χρηση του συλλογισμού για την ενίσχυση της ασφάλειας
Παρόμοια με την εργασία μας για την διαβουλευτική ευθυγράμμιση⁠, έχουμε εκπαιδεύσει ένα μοντέλο LLM συλλογισμού, ώστε να λειτουργεί απευθείας με βάση προδιαγραφές ασφαλείας που είναι γραμμένες και ερμηνεύσιμες από ανθρώπους. Χρησιμοποιήσαμε αυτό το LLM συλλογισμού κατά τη διάρκεια της ανάπτυξης, για να μας βοηθήσει να εντοπίσουμε και να αντιμετωπίσουμε τις ασάφειες στις πολιτικές μας. Μαζί με τις πολυτροπικές μας εξελίξεις και τις υπάρχουσες τεχνικές ασφαλείας που αναπτύχθηκαν για το ChatGPT και το Sora, αυτό μας επιτρέπει να συντονίζουμε⁠ τόσο το κείμενο εισαγωγής όσο και τις εικόνες αποτελέσματος σύμφωνα με τις πολιτικές μας.

Πρόσβαση και διαθεσιμότητα

Η 4η γενιά δημιουργίας εικόνων ξεκινά σήμερα για τους χρήστες Plus, Pro, Team και Free ως η προεπιλεγμένο εργαλείο δημιουργίας εικόνων στο ChatGPT και σύντομα θα δοθεί πρόσβαση σε χρήστες Enterprise και Edu. Είναι επίσης διαθέσιμη στο Sora. Για όσους έχουν αδυναμία στο DALL·E, μπορούν ακόμα να το προσπελάσουν μέσω ενός αποκλειστικού GPT DALL·E.

Οι προγραμματιστές θα μπορούν σύντομα να δημιουργούν εικόνες με το GPT‑4o μέσω του API, καθώς η πρόσβαση σε αυτή τη λειτουργία θα γίνει διαθέσιμη μέσα στις επόμενες εβδομάδες.

Η δημιουργία και η προσαρμογή εικόνων είναι απλή, σαν μια συνομιλία με το GPT‑4o. Απλώς περιέγραψε τι χρειάζεσαι, συμπεριλαμβανομένων τυχόν λεπτομερειών όπως η αναλογία διαστάσεων, ακριβή χρώματα με χρήση δεκαεξαδικών κωδικών ή ένα διαφανές φόντο. Επειδή αυτό το μοντέλο δημιουργεί πιο λεπτομερείς εικόνες, οι εικόνες χρειάζονται περισσότερο χρόνο για να αποδοθούν, συχνά μέχρι και ένα λεπτό.

credit creator: [Alex Duffy](https://every.to/@AlxAi)
credit creator: [Alex Duffy](https://every.to/@AlxAi)
credit creator: [Alex Duffy](https://every.to/@AlxAi)

credit creator: [August Kamp](https://www.instagram.com/august.kamp/?igsh=MTRpeG9xd3F2MzEyeg#) — credit creator: [Alex Duffy](https://every.to/@AlxAi)
credit creator: [Alex Duffy](https://every.to/@AlxAi)
credit creator: [Alex Duffy](https://every.to/@AlxAi)

Επανάληψη ζωντανής μετάδοσης

Συντάκτης

OpenAI

Ηγετική ομάδα

Gabriel Goh: Δημιουργία εικόνων

Jackie Shannon: Προϊόν ChatGPT

Mengchao Zhong, Wayne Chang: Μηχανική ChatGPT

Rohan Sahai: Προϊόν και μηχανική Sora

Brendan Quinn, Tomer Kaftan: Συμπερασματολογία

Prafulla Dhariwal: Πολυτροπική οργάνωση

Έρευνα

Θεμελιώδης έρευνα

Allan Jabri, David Medina, Gabriel Goh, Kenji Hata, Lu Liu, Prafulla Dhariwal

Βασική έρευνα

Aditya Ramesh, Alex Nichol, Casey Chu, Cheng Lu, Dian Ang Yap, Heewoo Jun, James Betker, Jianfeng Wang, Long Ouyang, Li Jing, Wesam Manassra

Συντελεστές έρευνας

Aiden Low, Brandon McKinzie, Charlie Nash, Huiwen Chang, Ishaan Gulrajani, Jamie Kiros, Ji Lin, Kshitij Gupta, Yang Song

Συμπεριφορά μοντέλου

Laurentia Romaniuk

Πολυτροπική οργάνωση

Andrew Gibiansky, Yang Lu

Δεδομένα

Επικεφαλής δεδομένων

Gildas Chabot, James Park Lennon

Δεδομένα

Arshi Bhatnagar, Dragos Oprica, Rohan Kshirsagar, Spencer Papay, Szi-chieh Yu, Wesam Manassra, Yilei Qian

Συντονιστές

Hazel Byrne, Jennifer Luckenbill, Mariano López

Σύμβουλοι ανθρώπινων δεδομένων

Long Ouyang

Κλιμάκωση

Επικεφαλής συμπερασματολογίας

Brendan Quinn, Tomer Kaftan

Συμπερασματολογία

Alyssa Huang, Jacob Menick, Nick Stathas, Ruslan Vasilev, Stanley Hsieh

Εφαρμοσμένα

Επικεφαλής προϊόντος ChatGPT

Jackie Shannon

Επικεφαλής μηχανικής ChatGPT

Mengchao Zhong, Wayne Chang

Επικεφαλής σχεδίασης προϊόντος

Matt Chan

Επιστήμη δεδομένων

Xiaolin Hao

ChatGPT

Andrew Sima, Annie Cheng, Benjamin Goh, Boyang Niu, Dian Ang Yap, Duc Tran, Edede Oiwoh, Eric Zhang, Ethan Chang, Jeffrey Dunham, Jay Chen, Kan Wu, Karen Li, Kelly Stirman, Mengyuan Xu, Michelle Qin, Ola Okelola, Pedro Aguilar, Rocky Smith, Rohit Ramchandani, Sara Culver, Sean Fitzgerald, Vlad Fomenko, Wanning Jiang, Wesam Manassra, Xiaolin Hao, Yilei Qian

Sora

Επικεφαλής προϊόντος Sora

Rohan Sahai, Wesam Manassra

Προϊόν και μηχανική Sora

Boyang Niu, David Schnurr, Gilman Tolle, Joe Taylor, Joey Flynn, Mike Starr, Rajeev Nayak, Rohan Sahai, Wesam Manassra

Ασφάλεια

Επικεφαλής ασφαλείας

Somay Jain

Ασφάλεια

Alex Beutel, Andrea Vallone, Botao Hao, Brendan Quinn, Cameron Raymond, Chong Zhang, David Robinson, Eric Wallace, Filippo Raso, Huiwen Chang, Ian Kivlichan, Irina Kofman, Keren Gu-Lemberg, Kristen Ying, Madelaine Boyd, Meghan Shah, Michael Lampe, Owen Campbell-Moore, Rohan Sahai, Rodrigo Riaza Perez, Sam Toizer, Sandhini Agarwal, Troy Peterson

Στρατηγική

Adam Cohen, Adam Wells, Ally Bennett, Ashley Pantuliano, Carolina Paz, Claudia Fischer, Declan Grabb, Gaby Sacramone-Lutz, Lauren Jonas, Ryan Beiermeister, Shiao Lee, Tom Stasi, Tyce Walters, Ziad Reslan, Zoe Stoll

Μάρκετινγκ & Επικοινωνίες

Επικοινωνίες και Επικεφαλής Μάρκετινγκ

Minnia Feng, Natalie Summers, Taya Christianson

Επικοινωνίες

Alex Baker-Whitcomb, Ashley Tyra, Bailey Richardson, Gaby Raila, Marselus Cayton, Scott Ethersmith, Souki Mansoor

Σχεδιασμός και δημιουργικό περιεχόμενο

Επικεφαλής

Kendra Rimbach, Veit Moeller

Σχεδιασμός

Adam Brandon, Adam Koppel, Angela Baek, Cary Hudson, Dana Palmie, Freddie Sulit, Jeffrey Sabin Matsumoto, Leyan Lo, Matt Nichols, Thomas Degry, Vanessa Antonia Schefke, Yara Khakbaz

Ιδιαίτερες ευχαριστίες

Aditya Ramesh, Aidan Clark, Alex Beutel, Ben Newhouse, Ben Rossen, Che Chang, Greg Brockman, Hannah Wong, Ishaan Singal, Jason Kwon, Jiacheng Feng, Jiahui Yu, Joanne Jang, Johannes Heidecke, Kevin Weil, Mark Chen, Mia Glaese, Nick Turley, Raul Puri, Reiichiro Nakano, Rui Shu, Sam Altman, Shuchao Bi, Vinnie Monaco

Παρουσίαση μοντέλου δημιουργίας εικόνων 4o

Χρήσιμη παραγωγή εικόνων

Βελτιωμένες δυνατότητες

Απόδοση κειμένου

Δημιουργία πολλαπλών γύρων

Ακολουθήστε τις οδηγίες

Μάθηση στο περιβάλλον

Παγκόσμια γνώση

HTML

Φωτορεαλισμός και στυλ

Περιορισμοί

Ασφάλεια

Πρόσβαση και διαθεσιμότητα

Επανάληψη ζωντανής μετάδοσης

Συντάκτης

Ηγετική ομάδα

Έρευνα

Δεδομένα

Κλιμάκωση

Εφαρμοσμένα

Sora

Ασφάλεια

Στρατηγική

Μάρκετινγκ &amp; Επικοινωνίες

Σχεδιασμός και δημιουργικό περιεχόμενο

Ιδιαίτερες ευχαριστίες

Μάρκετινγκ & Επικοινωνίες