Liwati menyang isi utama
OpenAI

Submitted: 2 Februari 2024

Studi Global

Tanggapan atas Perintah Eksekutif NIST tentang AI

Permintaan informasi National Institute of Standards and Technology (NIST) terkait tugasnya berdasarkan bagian 4.1, 4.5, dan 11 dari Executive Order Concerning Artificial Intelligence.

OpenAI didirikan sebagai organisasi nirlaba pada 2015 untuk memastikan bahwa kecerdhasan umum tiruan—singkatnya, AI yang setidaknya sepintar manusia—memberi manfaat bagi seluruh umat manusia. Kami meneliti, mengembangkan, dan merilis teknologi AI tercanggih serta alat dan praktik terbaik untuk keselamatan, penyelarasan, dan tata kelola AI. Kami menyambut kesempatan ini untuk memberi masukan bagi pekerjaan NIST yang sedang berlangsung dan sangat penting terkait AI.

Di sini, kami berfokus pada tiga topik yang diangkat dalam RFI: (1) mengevaluasi dan mengaudit kapabilitas AI, (2) melakukan pengujian red teaming untuk memungkinkan penerapan sistem yang aman, terlindungi, dan dapat dipercaya, dan (3) media sintetis serta provenance.

Mengevaluasi kapabilitas berbahaya dalam sistem AI

Kami mengapresiasi fokus NIST pada “membuat panduan dan tolok ukur untuk mengevaluasi kapabilitas... yang dengannya AI dapat menyebabkan bahaya.” OpenAI telah berkomitmen pada Kerangka Kesiapan(mbukak ing jendhela anyar), sebuah pendekatan komprehensif untuk mengevaluasi, melacak, dan memitigasi risiko katastrofik berbahaya dari model AI saat ini dan masa depan. Kerangka Kesiapan saat ini melacak empat area risiko awal: keamanan siber; ancaman kimia, biologis, nuklir, dan radiologis (CBRN); persuasi; dan otonomi model. Kerangka ini juga mengikat kami untuk tetap waspada secara berkelanjutan terhadap risiko “unknown unknown” yang belum teridentifikasi. Sebagai bagian dari pekerjaan ini, OpenAI baru-baru ini membagikan satu evaluasi skala besar untuk CBRN: menilai kemampuan GPT‑4 untuk secara berarti meningkatkan akses pelaku jahat ke informasi berbahaya tentang pembuatan ancaman biologis, dibandingkan dengan garis dasar sumber daya yang sudah ada (yakni internet). Dalam evaluasi terbesar sejenisnya yang melibatkan ahli biologi dan mahasiswa, kami menemukan bahwa GPT‑4 paling jauh hanya memberikan peningkatan ringan dalam informasi pembuatan ancaman biologis. Meski peningkatan ini belum cukup besar untuk bersifat konklusif, kami berharap temuan ini menjadi titik awal bagi penelitian lanjutan dan musyawarah komunitas, yang kami harap akan dipimpin oleh NIST dan AI Safety Institute yang baru. Pekerjaan ini meningkatkan keyakinan kami pada beberapa prinsip utama untuk mengevaluasi risiko dari sistem AI:

  • Kontribusi sistem AI terhadap risiko harus diukur dalam hal perubahan relatif terhadap garis dasar yang sesuai.Banyak risiko yang dapat ditingkatkan oleh sistem AI saat ini dan masa depan (seperti dalam keamanan siber atau biosekuriti) sudah ada pada tingkat tertentu bahkan tanpa AI. Misalnya, pencarian internet sudah memungkinkan tingkat akses yang cukup besar ke informasi yang relevan dengan biosekuriti. Saat mengevaluasi kontribusi sistem AI terhadap risiko, praktik terbaik yang penting adalah menguji apakah AI meningkatkan risiko melampaui sumber daya yang ada. Dalam studi terbaru kami tentang biorisiko, kami mengoperasionalkan hal ini dengan menugaskan secara acak setengah peserta ke kelompok kontrol yang hanya boleh menggunakan sumber pengetahuan non-AI (termasuk basis data online, artikel, dan mesin pencari internet, serta pengetahuan mereka sebelumnya), dan menugaskan separuh lainnya ke kelompok perlakuan dengan akses penuh ke sumber daya tersebut dan model GPT‑4.
  • Bekerja dengan ahli domain sangat penting untuk memahami risiko.Sulit bagi satu entitas mana pun untuk mempekerjakan ahli kelas dunia di semua topik luas dan beragam yang relevan bagi keselamatan AI. Untuk mengakses keahlian standar emas, berguna untuk bermitra dengan pihak ketiga yang mempekerjakan ahli domain pada subjek yang relevan dengan evaluasi kapabilitas berbahaya. Selain itu, melibatkan ahli domain dalam penilaian studi membantu memberi keyakinan bahwa evaluasi dilakukan secara objektif. Sebagai contoh, dalam mengembangkan dan menjalankan evaluasi biorisiko, kami bekerja erat dengan ahli biosekuriti pihak ketiga dalam merancang tugas penelitian, menjalankan pelatihan keselamatan bagi peserta, dan menilai tugas yang telah diselesaikan. Demi kepentingan keselamatan AI, ekosistem ini perlu diperluas dan didiversifikasi.
  • Evaluasi yang menyeluruh juga memerlukan kerja sama dengan ahli AI untuk secara efektif memunculkan seluruh rentang kapabilitas model.Untuk memahami seluruh rentang risiko dari model AI, perlu memunculkan kapabilitas penuh model sedapat mungkin dalam evaluasi. Ini memerlukan pemahaman mendalam tentang sistem AI yang mendasarinya dan bagaimana sistem tersebut dapat dimanfaatkan secara efektif. Kami merekomendasikan agar evaluasi dirancang dalam kerja sama erat dengan ahli AI. Dalam studi biorisiko kami, ini termasuk memberikan pelatihan kepada subjek manusia tentang cara memperoleh kinerja lebih baik dari praktik terbaik pemunculan kapabilitas model bahasa, serta pendekatan teknis khusus untuk lebih baik memunculkan dan menguji kapabilitas model.
  • Kita memerlukan lebih banyak penelitian tentang cara menafsirkan hasil evaluasi risiko.Sebagai contoh, dalam kasus evaluasi peningkatan akses ke informasi biorisiko oleh model AI, belum jelas tingkat peningkatan akses informasi seperti apa yang akan diterjemahkan menjadi peningkatan biorisiko yang signifikan. Dampak sistem AI pada biorisiko dapat berubah seiring munculnya teknologi baru yang dapat menerjemahkan informasi online menjadi ancaman biologis fisik. Saat kami terus mengoperasionalkan Kerangka Kesiapan kami, kami antusias untuk bekerja sama dengan NIST dan AI Safety Institute guna membangun pemahaman yang lebih kuat tentang risiko dan metrik risiko.
  • Evaluasi subjek manusia berstandar emas itu mahal.Melakukan evaluasi manusia terhadap model bahasa memerlukan anggaran yang besar untuk kompensasi peserta, pengembangan perangkat lunak, dan keamanan. Dalam studi biorisiko kami, kami mengeksplorasi berbagai cara untuk mengurangi biaya ini, tetapi sebagian besar biaya tersebut diperlukan oleh (1) pertimbangan keamanan yang tidak dapat dinegosiasikan, atau (2) jumlah peserta yang diperlukan dan banyaknya waktu yang perlu dihabiskan tiap peserta untuk pemeriksaan menyeluruh. Hal ini perlu diperhitungkan saat merancang standar.

Informasi tambahan tersedia dalam posting blog kami tentang studi biorisiko terbaru: Membangun sistem peringatan dini untuk penciptaan ancaman biologis berbantuan LLM.

Red teaming kanggo memungkinkan penerapan sistem AI yang aman

Apa guna saka red teaming?

OpenAI mendefinisikan red teaming sebagai “proses terstruktur untuk menguji sistem dan produk AI guna mengidentifikasi kapabilitas berbahaya, output berbahaya, atau ancaman infrastruktur.”A
Ada berbagai metode yang kini muncul di bawah istilah payung red teaming, termasuk red teaming internal (dilakukan oleh tim internal khusus di laboratorium atau perusahaan), red teaming eksternal (dilakukan oleh pemangku kepentingan eksternal bekerja sama dengan laboratorium atau perusahaan), atau red teaming otomatis (menggunakan model AI untuk menghasilkan serangan otomatis dan mengklasifikasikan output). Dalam konteks dokumen ini, kami terutama merujuk pada upaya red teaming eksternal yang melibatkan OpenAI bekerja dengan para ahli domain eksternal untuk menilai kapabilitas dan risiko dari model atau sistem AI.

Pendekatan OpenAI terhadap red teaming tidak memandang serangan adversarial atau output model secara terpisah. Sebaliknya, ini adalah metode untuk memunculkan risiko secara kontekstual dan holistik melalui kolaborasi dengan para ahli domain.
B Selain penggunaan jahat dan metode untuk mengakali mitigasi keselamatan, red teaming juga mempertimbangkan risiko lain: input yang jinak atau diharapkan tetapi menghasilkan output berbahaya atau berisiko, peningkatan kapabilitas baru yang dapat mengubah lanskap risiko, dan bagaimana faktor di luar sistem itu sendiri dapat berinteraksi dengan output model hingga menimbulkan risiko atau bahaya. Penilaian di area-area ini sering mendapat manfaat dari keterlibatan manusia untuk menghasilkan contoh-contoh potensial, dan untuk memvalidasi output yang dihasilkan dalam konteks keahlian red teamer tertentu.

Red teaming migunani kanggo apa?

Red teaming AI membantu memahami potensi risiko yang terkait dengan model dan sistem baru yang:

  • Memerlukan bentuk interaksi yang mungkin berbeda dari sistem atau teknologi AI sebelumnya dan tidak tercakup dengan baik oleh evaluasi terprogram (misalnya, in painting pada DALL·E, GPTs).
  • Memiliki kapabilitas yang meningkat secara signifikan yang dapat memperkenalkan risiko baru yang belum dievaluasi (misalnya, domain ilmiah, persuasi, atau nalar).
  • Memerlukan konteks atau pengetahuan spesifik domain untuk pengujian dan verifikasi (misalnya, konten politik spesifik wilayah, bias budaya, atau domain ilmiah maupun ahli seperti hukum dan kedokteran).
  • Memerlukan pemahaman tentang alur pengguna atau kasus penggunaan tertentu, termasuk faktor yang mungkin berada di luar sistem itu sendiri (misalnya, menguji GPT‑4(V) untuk individu dengan low vision).

OpenAI memandang red teaming sebagai alat untuk menilai risiko pada level model maupun level sistem. Fitur sistem dapat mencakup: pengklasifikasi, filter prompt / daftar blokir, intervensi pada level antarmuka pengguna, praktik pemantauan dan evaluasi, serta mekanisme penegakan kebijakan lainnya. Kami kadang melakukan red teaming untuk produk baru bahkan ketika tidak ada model baru yang terlibat. Sebagai contoh, meskipun GPTs tidak memperkenalkan model dasar yang baru, GPTs memang memperkenalkan sistem baru tentang bagaimana pengguna berinteraksi dengan model.

OpenAI memandang upaya red teaming kami sebagai pelengkap bagi upaya red teaming spesifik domain lebih lanjut yang seharusnya dilakukan oleh pengembang yang membangun di atas teknologi kami. Misalnya, meskipun kami menjalankan red teaming pada model dan sistem kami pada titik waktu tertentu dalam kondisi tertentu, pengembang yang membangun di atas API kami sebaiknya mempertimbangkan pembelajaran tersebut, dan melakukan red teaming tambahan berdasarkan kondisi sistem dan konteks operasional yang mereka harapkan. Inilah salah satu alasan OpenAI menerbitkan temuan kunci dari upaya red teaming dalam kertu sistem (dan bentuk dokumentasi publik lainnya) agar pihak lain dapat belajar darinya dan membangunnya lebih lanjut.

Red teaming iteratif di OpenAI

Kami telah mendokumentasikan beberapa upaya red teaming kami untuk peluncuran model tercanggih dalam kertu sistem:

OpenAI telah memberi para red teamer ahli akses ke model yang telah dipralatih dengan tingkat fine-tuning dan post-training yang berbeda-beda serta tingkat kematangan mitigasi keselamatan yang bervariasi.

Tujuan dari hal ini adalah sebagai berikut:

  • Wawasan red teaming dapat memberi informasi bagi pengembangan mitigasi pada level post-training, mitigasi level sistem, kebijakan, dan evaluasi.
  • Wawasan red teaming dapat membantu memberi masukan bagi pengambilan keputusan pimpinan tentang merilis fitur tertentu, bagaimana merilisnya secara iteratif, dan efektivitas mitigasi keselamatan.
  • Hasil red teaming dapat dibagikan bersama materi peluncuran publik (seperti dalam kertu sistem atau format lain) untuk memberi informasi kepada calon pengguna dan pemangku kepentingan lain tentang risiko yang telah dimitigasi, risiko residual, dan kemungkinan risiko di masa depan.

Kami melibatkan red teamer sedini mungkin secara wajar dalam proses pengembangan, agar wawasan red teaming dapat langsung masuk ke upaya keselamatan dan pengambilan keputusan. Penting juga untuk mempelajari kapabilitas dasar model sebelum mitigasi keselamatan tambahan diterapkan, agar pengembang model dapat membuat keputusan yang terinformasi tentang tingkat risiko dasar model, dan demi pemahaman masyarakat tentang lanskap risiko yang terkait dengan sistem yang semakin kuat.

Setelah mitigasi keselamatan diterapkan, upaya red teaming dapat memfokuskan putaran tambahan red teaming pada identifikasi celah dan risiko residual yang tidak ditangani oleh mitigasi keselamatan, serta menilai ketangguhan mitigasi tersebut.

Pada akhirnya, meskipun ada sifat keselamatan penting yang perlu dipertimbangkan lebih hulu dalam proses pengembangan model, red teaming bertujuan mensimulasikan pengalaman yang sedekat mungkin dengan apa yang dirilis pengembang model kepada publik.

Watesan red teaming

Red teaming itu sendiri bukanlah latihan pengukuran risiko yang memadai. Dengan sendirinya, red teaming tidak akan mengukur probabilitas atau kecenderungan sebuah model untuk menghasilkan konten berbahaya atau risiko yang terkait dengan penggunaan sistem AI. Red teaming juga tidak memberikan informasi yang cukup untuk mengukur tingkat keparahan dari risiko atau bahaya yang telah diidentifikasi.

Meskipun sebagian besar upaya red teaming ahli OpenAI berlangsung sebelum penerapan besar model atau produk, model dan sistem cukup sering berkembang dalam produksi, dan karena itu, penting untuk memperhitungkan hal tersebut saat mengontekstualisasikan temuan red teaming. Demikian pula, pengembang yang membangun untuk kasus penggunaan tertentu di atas model dapat membuat keputusan desain yang mengubah profil keselamatan model atau sistem jika hal tersebut tidak melekat pada (atau tidak tak berubah dari) model atau sistem itu sendiri.

Red teaming meletakkan dasar bagi jenis pengujian dan evaluasi lanjutan, serta memberi beberapa arahan tentang vektor serangan atau isu yang perlu ditangani secara tangguh oleh mitigasi keselamatan.

Menelaah banyak contoh dan permutasi dari suatu isu dapat membantu menanamkan keyakinan tentang cara mengukur area risiko tertentu. Red teaming ahli secara desain bertujuan mencakup keluasan, bukan kedalaman area risiko, dan karena itu, dengan sendirinya belum tentu menghasilkan evaluasi yang memadai untuk mengukur risiko tertentu. Sebaliknya, red teaming dapat menghasilkan dataset yang dapat dianggap sebagai “benih” untuk evaluasi yang lebih menyeluruh. Dari sana, hasilnya dapat digunakan untuk menghasilkan lebih banyak contoh dari area isu tertentu yang terungkap, dan “golden set” contoh berlabel (biasanya oleh ahli domain) dapat digunakan untuk mengevaluasi model masa depan pada area isu yang telah diidentifikasi.

Komposisi red team dan prioritas domain

Sistem AI tujuan umum yang akan digunakan untuk banyak kasus penggunaan yang diperkirakan maupun yang tidak diperkirakan, dan dalam beragam konteks di seluruh dunia, menuntut cakupan berbagai bidang topik, dengan orang-orang yang mewakili beragam perspektif dan pandangan dunia.

OpenAI percaya pada perekrutan berbagai macam ahli untuk melakukan red teaming pada model kami. Tahun lalu, kami membuka pendaftaran untuk Jaringan Red Teaming. Kriteria seleksi mencakup:

  • Keahlian atau pengalaman yang terbukti dalam domain tertentu yang relevan dengan red teaming
  • Bersemangat untuk meningkatkan keamanan AI
  • Tidak memiliki konflik kepentingan
  • Latar belakang beragam dan kelompok yang secara tradisional kurang terwakili
  • Representasi geografis yang beragam
  • Fasih dalam lebih dari satu bahasa
  • Kemampuan teknis (membantu tetapi tidak diwajibkan)

Prioritas domain dapat diinformasikan oleh: penggunaan yang diharapkan dari sistem AI atau model, terutama dalam konteks dengan ambiguitas lebih tinggi atau kemungkinan risiko, evaluasi awal model di mana pengembang model mungkin mengharapkan peningkatan kapabilitas, area masalah kebijakan konten yang telah diketahui sebelumnya, serta konteks sosial-politik yang relevan (mis., 2024 adalah tahun pemilu besar di banyak tempat di seluruh dunia). Penting untuk dicatat bahwa setiap model atau sistem mungkin memerlukan kumpulan keahlian yang berbeda-beda, dan domain baru dapat dipertimbangkan berdasarkan kapabilitas yang terus maju serta kasus penggunaan baru dari model atau sistem. Karena itu, komposisi red team yang optimal akan berkembang seiring waktu.

Media Sintetis dan Provenance

  • Watermarking: Dalam pendekatan ini, media audiovisual hasil generasi itu sendiri memuat sinyal asal-usulnya—pola halus yang tidak tampak bagi penonton atau pendengar, tetapi dapat dideteksi oleh perangkat lunak. Ini bisa berupa sinyal yang hanya dapat dideteksi dengan bantuan kunci rahasia, atau sebagai alternatif, perangkat lunak untuk mendeteksi watermark dapat tersedia secara publik. Karena itu, jika OpenAI menambahkan watermark pada output kami, kolaborasi di seluruh rantai nilai AI akan diperlukan agar peserta lain, seperti platform media sosial yang mendistribusikan konten, dapat membuat watermark itu tampak dan berguna bagi pengguna. Jika proses deteksinya sendiri tidak bersifat publik, maka akses ke proses itu menjadi pertanyaan kebijakan yang kompleks. Ada juga tantangan teknis. Meskipun watermark mungkin lebih sulit dihapus dibanding metode provenance lain, media yang ditandai masih bisa kehilangan watermark-nya jika dipotong, diubah ukurannya, atau dimodifikasi dengan cara lain. Karena alasan ini, watermark masih dapat dihindari, terutama oleh pelaku adversarial yang termotivasi. Selain itu, dampak watermarking mungkin terbatas mengingat pelaku jahat dapat mengakses model yang tidak memberi watermark pada outputnya.
  • Pengklasifikasi (model terlatih yang membedakan output hasil generasi AI dari media lain, dan mungkin mendeteksi model atau layanan mana yang menghasilkan output tertentu): Ketika efektif, pendekatan ini sangat menarik karena tidak bergantung pada kerja sama dari orang yang menyebarkan gambar atau dari pihak lain mana pun. Namun, pendekatan ini bisa membuat kesalahan—baik positif palsu maupun negatif palsu—dan mungkin memerlukan komputasi intensif untuk diterapkan dalam skala besar. Positif palsu dapat, misalnya, secara keliru menggambarkan karya seniman manusia sebagai output AI. Sebaliknya, negatif palsu dapat secara keliru menandai gambar sebagai bukan hasil generasi AI, padahal sebenarnya iya.

  • Pendekatan berbasis metadata(seperti standar saat ini milik C2PA(mbukak ing jendhela anyar)): Dalam pendekatan ini, metadata yang menyertai media tertentu ditandatangani secara kriptografis untuk memberikan pengesahan atas asal-usul media.

    Ini dapat memberdayakan orang yang ingin membuktikan asal media, baik yang dihasilkan AI maupun bukan. Sebagai contoh, C2PA dapat memungkinkan penerbit berita menunjukkan, dan pemirsa menegaskan, bahwa penerbit memang menerbitkan gambar atau video tertentu dan menjamin akurasi gambar atau video tersebut. Demikian pula, jika diterapkan pada sistem AI generatif, teknik ini dapat membantu seorang seniman menunjukkan bahwa ia menghasilkan gambar atau video sintetis tertentu. Pendekatan ini tampaknya memiliki manfaat berupa memberikan visibilitas kepada konsumen atau publik terhadap provenance konten. Selain itu, pendekatan ini memiliki keunggulan karena tidak memerlukan sumber daya besar untuk diterapkan.

    Namun, metadata dapat dengan mudah dihapus dari gambar atau video dasarnya, sehingga teknik ini tidak menciptakan hambatan yang berarti bagi pelaku jahat (misalnya mereka yang terlibat dalam kampanye disinformasi) yang mungkin ingin menyamarkan konten hasil generasi sebagai konten nyata.

    Agar pendekatan metadata dapat memberi manfaat luas bagi publik, peramban dan platform distribusi, seperti platform media sosial, perlu mendeteksi dan menampilkan metadata tersebut. Karena itu, keberhasilan penerapan pendekatan berbasis metadata memerlukan kolaborasi di seluruh rantai nilai: tidak cukup jika materi audiovisual memiliki metadata yang ditandatangani secara kriptografis, tetapi platform distribusi harus mampu mendeteksi metadata yang dimaksud dan menampilkannya agar pengguna akhir dapat memverifikasi asal-usul media.

Pendekatan OpenAI terhadap provenance

Karena setiap metode provenance memiliki kelebihan dan keterbatasan, OpenAI telah mengeksplorasi berbagai pendekatan terhadap provenance untuk media audiovisual yang dihasilkan AI.

Metadata C2PA kanggo gambar DALL·E 3

Pada 15 Januari tahun ini, OpenAI mengumumkan bahwa kami akan menerapkan pendekatan metadata C2PA untuk gambar yang dihasilkan menggunakan model teks-ke-gambar kami DALL·E 3. Spesifikasi C2PA adalah standar teknis terbuka yang memberi penerbit, kreator, dan konsumen kemampuan untuk melacak asal dari berbagai jenis media.

Spesifikasi ini memungkinkan metadata dilampirkan pada sebuah file. Metadata ini mencakup informasi tentang sumber sebuah gambar (dalam kasus kami, bahwa gambar tersebut berasal dari DALL·E) dan waktu pembuatannya. Anggota masyarakat dapat menguji metadata ini dan, jika metadata tersebut ada, mengonfirmasi bahwa sebuah gambar dihasilkan oleh DALL·E 3.

Ini akan membantu kami memberdayakan pengguna untuk menunjukkan asal gambar yang mereka hasilkan menggunakan DALL·E 3. Namun, metadata ini dapat dihapus dengan cukup mudah: pelaku jahat yang termotivasi dapat menghapus metadata C2PA yang menyertai gambar apa pun. Selain itu, platform berbagi gambar umum seperti platform media sosial saat ini menghapusnya secara default, alih-alih mendeteksi dan menampilkannya kepada pengguna. Mengingat betapa mudahnya C2PA dihapus, masyarakat tidak dapat mengasumsikan bahwa setiap gambar DALL·E yang mereka lihat pasti akan memiliki data semacam itu.

Namun, C2PA bukan hanya untuk gambar AI, dan ini dapat memberi manfaat penting jika diadopsi lebih luas. Ini juga sedang diadopsi oleh produsen kamera, organisasi berita, dan pihak lain untuk menjamin asal gambar. Kami percaya adopsi yang lebih luas atas metode pengungkapan, dan mendorong pengguna untuk mencari sinyal-sinyal ini, merupakan langkah penting menuju peningkatan keterpercayaan informasi digital.

Pengklasifikasi eksperimental kanggo gambar DALL·E 3

Pada 19 Oktober 2023, kami mengumumkan pekerjaan berkelanjutan kami pada pengklasifikasi provenance, alat internal baru untuk mendeteksi gambar yang dihasilkan oleh sistem DALL·E 3 kami. Kami mengukur akurasi pengklasifikasi ini menggunakan tolok ukur internal yang telah menunjukkan hasil menjanjikan, bahkan ketika gambar telah mengalami jenis modifikasi umum, seperti pemotongan, pengubahan ukuran, kompresi JPEG, atau ketika teks atau potongan dari gambar nyata ditumpangtindihkan ke bagian kecil dari gambar hasil generasi. Meski hasil pengujian internal ini kuat, pengklasifikasi tersebut hanya dapat memberi tahu kami bahwa sebuah gambar kemungkinan dihasilkan oleh DALL·E, dan belum memungkinkan kami menarik kesimpulan yang pasti.

Kami terus menguji ketahanan pengklasifikasi kami dan, pada kuartal pertama 2024, kami berencana menyediakannya kepada mitra eksternal untuk mendapatkan masukan. Pada tahun mendatang, kami berharap mulai memperluas eksperimen kami dengan pengklasifikasi gambar ini, dengan mengundang pihak eksternal terpilih untuk bergabung dengan kami dalam menilai kinerja dan kegunaannya.

Pengklasifikasi ini disesuaikan untuk model tersebut dan hanya mampu mengklasifikasikan apakah sebuah gambar kemungkinan dihasilkan oleh DALL·E, dan karena itu, bahkan jika sepenuhnya akurat dalam klasifikasinya, pengklasifikasi ini tidak dapat digunakan untuk menentukan apakah sebuah gambar dihasilkan oleh alat generatif lain.

Kami menyambut baik kesempatan untuk berkolaborasi dengan Anda seiring berlanjutnya pekerjaan Anda di bidang ini.

Hormat kami,

Anna Adeola Makanju
VP Studi Global
OpenAI

Catatan kaki

  1. A

    Lihat definisi(mbukak ing jendhela anyar) red teaming dari Frontier Model Forum.

  2. B

    Kami menggunakan istilah “ahli” untuk merujuk pada keahlian yang dibentuk oleh berbagai pengetahuan domain dan pengalaman hidup.