Das neue ChatGPT Bilder ist da
Heute veröffentlichen wir eine neue Version von ChatGPT Bilder, die auf unserem neuen Flagship-Modell für die Bildgenerierung basiert. Egal, ob du etwas von Grund auf neu erstellst oder ein Foto bearbeitest – jetzt bekommst du das Ergebnis, das du dir vorstellst. Es nimmt präzise Bearbeitungen vor, wobei Details wie das Aussehen von Personen unverändert bleiben, und generiert Bilder bis zu viermal schneller. Gleichzeitig führen wir eine neue Bilder-Funktion in ChatGPT ein, die dafür sorgt, dass die Bildgenerierung Spaß macht – um Inspiration zu wecken und kreative Erkundungen mühelos zu gestalten
Das neue Bilder-Modell und die Funktion werden heute in ChatGPT für alle Benutzer:innen eingeführt und in der API als gpt-image-1.5 bereitgestellt.
Wenn du jetzt um Änderungen an einem hochgeladenen Bild bittest, hält sich das Modell zuverlässiger an deine Absicht – bis ins kleinste Detail. Es ändert nur das, was du verlangst, während es Elemente wie Beleuchtung, Komposition und das Aussehen von Personen in Eingaben, Ausgaben und nachfolgenden Bearbeitungen konsistent hält.
Das ermöglicht Resultate, die deiner Absicht entsprechen – nützlichere Fotobearbeitungen, glaubwürdigeres Anprobieren von Kleidung und Frisuren sowie stilistische Filter und konzeptionelle Transformationen, die das Wesen des ursprünglichen Bildes beibehalten. Zusammen bedeuten diese Verbesserungen, dass du ChatGPT als Kreativstudio in deiner Hosentasche nutzen kannst, das sowohl praktische Bearbeitungen als auch ausdrucksstarke Neugestaltungen ermöglicht.
Das Modell zeichnet sich durch verschiedene Arten der Bearbeitung aus – darunter Hinzufügen, Entfernen, Kombinieren, Mischen und Austauschen – sodass du die gewünschten Änderungen erhältst, ohne das zu verlieren, was das Bild besonders macht.
Die Kreativität des Modells zeigt sich in Transformationen, die Elemente verändern und hinzufügen – wie Text und Layout –, um Ideen zum Leben zu erwecken, während wichtige Details erhalten bleiben. Diese Transformationen funktionieren sowohl für einfache als auch für komplexere Konzepte und sind leicht auszuprobieren, indem voreingestellte Stile und Ideen in der neuen ChatGPT Bilder(wird in einem neuen Fenster geöffnet)-Funktion verwendet werden – kein schriftlicher Prompt erforderlich.
Das Modell befolgt Anweisungen zuverlässiger als unsere erste Version. Dies ermöglicht präzisere Bearbeitungen sowie komplexere Originalkompositionen, bei denen die Beziehungen zwischen den Elementen wie beabsichtigt erhalten bleiben.
Neu
Vorher
Bei der Textdarstellung macht das Modell einen weiteren Schritt nach vorn und ist nun in der Lage, dichteren und kleineren Text zu verarbeiten.
Das Modell verbessert sich auch in weiteren Aspekten, die zu sofort nutzbaren Ergebnissen führen, wie z. B. dem Rendern vieler kleiner Gesichter und der Natürlichkeit der Ausgaben.
Neu
Vorher
Zusätzlich zur Generierung von Bildern, indem du in einer Nachricht beschreibst, was du sehen möchtest, führen wir einen eigenen Bereich für Bilder(wird in einem neuen Fenster geöffnet) in ChatGPT ein – verfügbar in der Seitenleiste über die mobile App und auf chatgpt.com –, um das Erkunden und Ausprobieren von Bilder schneller und einfacher zu machen. Es enthält Dutzende von voreingestellten Filtern und Inspirations-Prompts, die regelmäßig aktualisiert werden, um aufkommende Trends widerzuspiegeln.
Zusammen ermöglichen dir diese Upgrades, Bilder zu erstellen, die besser zu deiner Vision passen, von kleinen Änderungen bis hin zu vollständigen Neugestaltungen.
Dieses Modell optimiert geschäftliche Workflows durch schnellere Bildgenerierung, präzise Bearbeitungen und konsistente visuelle Details über mehrere Iterationen hinweg. Teams können Ideen erkunden, gezielte Änderungen vornehmen und komplexe oder trockene Konzepte visualisieren, was Anwendungsfälle in den Bereichen Marketing, Design, E-Commerce und interne Kommunikation unterstützt.
Wir haben viele der Beispiele aus unserer ursprünglichen Einführung der Bildgenerierung erneut ausgeführt, um die Leistung zu bewerten. Das Modell zeigt deutliche Verbesserungen in diversen Fällen, auch wenn die Ergebnisse nach wie vor nicht perfekt sind. Obwohl diese Version bedeutende Fortschritte darstellt, gibt es noch erhebliches Verbesserungspotenzial für zukünftige Iterationen.
Neu
Vorher
Noch einige wissenschaftliche Ungenauigkeiten, aber zu etwa 70 % korrekt, und die Grafiken sind viel lebendiger, was ein vorzeitiges Beschneiden vermeidet.
gpt-image-1.5 in der API bietet dieselben Verbesserungen wie ChatGPT Bilder: Es ist besser bei der Beibehaltung und Bearbeitung von Bildinhalten als GPT Image 1.
Du wirst eine konsistentere Beibehaltung von Markenlogos und entscheidenden visuellen Inhalten über mehrere Bearbeitungen hinweg bemerken, was die Funktion gut geeignet für Marketing- und Markenarbeit wie die Erstellung von Grafiken und Logos sowie für E-Commerce-Teams macht, die vollständige Produktbildkataloge (Varianten, Szenen und Blickwinkel) auf Basis eines einzigen Quellbilds generieren.
Bildeingaben und -ausgaben sind jetzt in GPT Image 1.5 um 20 % günstiger im Vergleich zu GPT Image 1, sodass du mehr Bilder für dasselbe Budget generieren und iterieren kannst.
Du kannst das neue Modell im OpenAI Playground(wird in einem neuen Fenster geöffnet) ausprobieren oder den Prompt-Leitfaden(wird in einem neuen Fenster geöffnet) zur Inspiration lesen.
Unternehmen und Startups aus verschiedenen Branchen, darunter Kreativ-Tools, E-Commerce, Marketing-Software und mehr, verwenden GPT Image 1.5 bereits. Wir freuen uns, dir im Folgenden einige dieser Beispiele vorzustellen.
Neu
Vorher
„GPT Image 1.5 generiert qualitativ hochwertige Bilder mit starker Einhaltung der Prompts und bewahrt dabei Komposition, Beleuchtung und feine Details.“ Die Ergebnisse sind sauber, realistisch und zuverlässig und unterstützen so schnellere Konzept-zu-Produktion-Workflows auf Plattformen wie Wix. Basierend auf unseren Tests und den wichtigsten Anwendungsfällen, die wir bei Wix beobachten, machen die Konsistenz und Qualität dieses Modell zu einem der derzeit führenden Modelle für die Bildgenerierung.“
– Hila Gat, Head of AI Research and Data Science bei Wix
Das neue ChatGPT Bilder wird heute weltweit für alle ChatGPT‑Nutzer:innen und API-Nutzer:innen auf sämtlichen Oberflächen eingeführt. Es funktioniert Modell-übergreifend, sodass du nichts auswählen musst, um es zu nutzen.
Wir glauben, dass wir uns noch am Anfang dessen befinden, was die Bildgenerierung möglich machen kann. Das heutige Update ist ein bedeutender Schritt nach vorne, dem weitere folgen werden: von feineren Bearbeitungen bis hin zu komplexeren, detaillierteren Ausgaben in allen Sprachen.
Autor
Contributors
Project Leadership
Gabriel Goh — Research Lead
Adele Li — Product Lead
Bill Peebles — Sora Lead
Aditya Ramesh — World Simulation Lead
Mark Chen — Chief Research Officer
Prafulla Dhariwal — Multimodal Lead
Core Team
Alex Fang, Alex Yu, Ben Wang, Bing Liang, Boyuan Chen, Charlie Nash, David Medina, Dibya Bhattacharjee, Jianfeng Wang, Kenji Hata, Kiwhan Song, Mengchao Zhong, Mike Starr, Yuguang Yang
Research Contributors
Bram Wallace, Dmytro Okhonko, Haitang Hu, Kshitij Gupta, Li Jing, Lu Liu, Peter Zhokhov, Qiming Yuan, Senthil Purushwalkam, Yizhen Zhang
Core Inference
Adam Tart, Alyssa Huang, Andrew Braunstein, Jane Park, Karen Li, Tomer Kaftan
Research Collaborators
Aditya Ramesh, Alex Nichol, Andrew Kondrich, Andrew Liu, Benedikt Winter, Bill Peebles, Connor Holmes, Cyril Zhang, Daniel Geng, Eric Mintun, James Betker, Jamie Kiros, Manuka Stratta, Martin Li, Raoul de Liedekerke, Ricky Wang, Ruslan Vasilev, Vladimir Chalyshev, Welton Wang, Wyatt Thompson, Yaming Lin
Inference Collaborators
Jiayu Bai, Kevin King, Stanley Hsieh, Weiyi Zheng
Data & Evaluation
Alexandra Barr, Aparna Dutta, Arshi Bhatnagar, Chao Yu, Charlotte Cole, Dragos Oprica, Emma Tang, Gowrishankar Sunder, Henry Baer, Ian Sohl, James Park Lennon, Jason Xu, Peilin Yang, Somay Jain, Szi-chieh Yu, Wesam Manassra, Xiaolei Zhu, Yilei Qian
Applied
Affonso Reis, Alan Gou, Alexandra Vodopianova, Amandeep Grewal, Andi Liu, Andrew Sima, Angus Fletcher, Antonia Woodford, Arun Eswara, Benny Wong, Bharat Rangan, Boyang Niu, Bridget Collins, Bryan Brandow, Callie Riggins Zetino, Chris Wendel, Ethan Chang, Gilman Tolle, Greg Hochmuth, Ibrahim Okuyucu, Jesse Chand, Jesse Hendrickson, Jiayu Bai, Jimmy Lin, Johan Cervantes, Kan Wu, Liam Esparraguera, Maja Wichrowska, Matthew Ferrari, Murat Yesildal, Nikunj Handa, Nithanth Kudige, Ola Okelola, Osman Khwaja, Peter Argany, Peter Bakkum, Peter Vidani, Richard Zadorozny, Rohan Sahai, Savelii Bondini, Sean Chang, Vickie Duong, Victoria Huang, Xiaolin Hao, Xueqing Li
Safety, Safety Systems, Integrity, Policy & Trust
Abby Fanlo Susk, Adam Wells, Aleah Houze, Annie Cheng, Artyi Xu, Carolina Paz, David Abelman, Femi Alamu, Jay Wang, Jeremiah Currier, Jesika Haria, Mariya Guryeva, Max Burkhardt, Paige Walker, Pedro Aguilar, Rutsu Koshimizu, Sam Toizer, Savannah Heon, Tom Rubin, Tonia Osadebe, Willow Primack, Zoe Stoll
Product Operations, Program Management and Governance
Antonio Di Francesco, Filippo Raso, Grace Wu, Josh Metherd, Ruth Costigan
Legal
Ally Bennett, Tony Song, Tyce Walters
Communications, Marketing, Community, Design & Creative
Akash Iyer, Alex Baker-Whitcomb, Angie Luo, Anne Oburgh, Antonia Richmond, Annie Tsang, Ashley Tyra, Bailey Richardson, Brandon McGraw, Cary Hudson, Dana Palmie, Evan Corrigan, Gaby Raila, Indgila Samad Ali, James Anderson, Jeremy Schwartz, Jordan Liss, Juan Garza, Julie Steele, Kara Zichittella, Karn Piluntanadilok, Kendal Peirce, Kim Baschet, Leah Anise, Livvy Pierce, Maria Clara M. Fleury Osorio, Minnia Feng, Nick Ciffone, Nick Forland, Niko Felix, Paige Ford, Rachel Puckett, Rishabh Aggarwal, Rusty Rupprecht, Souki Mansoor, Tasia Potasinski, Taya Christianson, Vasundhara Mudgil, Whitney Ferris, Yara Khakbaz, Zach Brock, Zoë Silverman
Special Thanks
Amy Yang, Arvin Wu, Avital Oliver, Brandon McKinzie, Chak Li, Chris Lu, David Duxin, Dian Ang Yap, Gabriel Petersson, Guillaume Leclerc, Hazel Byrne, Henry Aspegren, Jennifer Luckenbill, Ji Lin, Joseph Mo, Julius Hochmuth, Liunian (Harold) Li, Long Ouyang, Mariano López, Michael Zhang, Ravi Teja Mullapudi, Suvansh Sanjeev, Varun Shetty, Wenda Zhou
Exec
Fidji Simo, Hannah Wong, Jakub Pachocki, Jason Kwon, Johannes Heidecke, Kate Rouch, Lauren Itow, Mark Chen, Mia Glaese, Nick Ryder, Nick Turley, Prafulla Dhariwal, Sam Altman, Sulman Choudhry






















