Liwati menyang isi utama
OpenAI

4 Maret 2026

Studi Global

Piranti anyar kanggo mangerteni AI lan asil sinau

Ngembangake cara ngukur dampak AI ing macem-macem lingkungan sinau

Pendhidhikan minangka salah siji saka ranah tercanggih AI sing paling njanjekake. Kanthi piranti kaya ChatGPT, dhukungan sinau sing dipersonalisasi bisa kasedhiya kanggo siswa apa wae, ing ngendi wae, kapan wae.

Nanging, sektor pendhidhikan isih ana ing tahap awal kanggo mangerteni dampak AI marang asil sinau. Taun kepungkur, tim kami miwiti nyinaoni panggunaan piranti kaya mode sinau lan nemokake asil awal sing njanjekake tumrap kinerja siswa. Nanging riset kami uga nuwuhake pitakonan penting: kepiye carane kita bisa netepake pengaruh AI marang kemajuan siswa saka wektu ke wektu, ora mung ing ujian pungkasan?

Iki tantangan ekosistem sing luwih amba. Nganti saiki, akèh metode riset fokus marang sinyal kinerja sing sempit—kayata skor tes—lan durung nduweni kemampuan kanggo netepake kepiye siswa tenan sinau nganggo AI ing kahanan nyata, lan kepiye panggunaan kuwi mbentuk asil saka wektu ke wektu.

Kanggo ngatasi kesenjangan iki, kami ngembangake Learning Outcomes Measurement Suite, yaiku kerangka kerja sing digawe bareng Universitas Tartu ing Estonia lan Inisiatif SCALE ing Stanford Accelerator for Learning kanggo ndhukung pangukuran longitudinal asil sinau ing macem-macem konteks pendhidhikan.

Validasi ekstensif saiki lagi lumaku liwat uji coba acak terkontrol, lan riset luwih lanjut direncanakake karo organisasi pendiri ing Learning Lab, ekosistem riset sinau OpenAI, kalebu peneliti saka Arizona State University, UCL Knowledge Lab, lan MIT Media Lab (nerusake studi kolaboratif sadurunge).

Dina iki, kami nuduhake ringkesan babagan cara kerja measurement suite iki lan kenapa iki penting. Saka wektu ke wektu, kami arep nerbitake luwih akeh riset lan ngluncurake measurement suite iki minangka sumber daya umum kanggo sekolah, universitas, lan sistem pendhidhikan ing saindenging donya.

“Riset iki ngidini kita sinau kanthi cepet, sekaligus mbangun dhasar kanggo pangerten sing luwih jero babagan carane AI bisa diintegrasikake kanthi wicaksana menyang sekolah kanthi cara sing tenan wigati. Kita pengin ngerti carane piranti iki bisa ndhukung sinau akademik sing ketat, bebarengan karo ngembangake pamikiran tingkat dhuwur, kreativitas, rasa penasaran, lan kapercayan siswa marang awake dhewe minangka pamelajar.”
–Susanna Loeb, Profesor Pendhidhikan lan Direktur Fakultas, Inisiatif SCALE ing Universitas Stanford

Ringkesan poin utama

  • Metode riset saiki babagan dampak AI marang sinau nuduhake sinyal sing njanjekake babagan kinerja, nanging durung nyekel gambaran lengkap babagan kepiye AI mengaruhi asil sinau saka wektu ke wektu.
  • Learning Outcomes Measurement Suite bakal, kanggo pisanan, nyedhiyakake kerangka standar kanggo studi longitudinal sing mbantu pendidik, peneliti, lan institusi mangerteni kepiye AI mbentuk sinau lan asil ing macem-macem konteks.
  • Learning Lab saka OpenAI minangka ekosistem riset anyar sing fokus kanggo majokake karya iki. OpenAI bakal nerbitake temuan bebarengan karo macem-macem mitra sakwise bidang iki terus berkembang.

Asal-usul lan riset awal

Nalika siswa nggunakake piranti AI kanggo sinau, tegese bisa maneka warna—wiwit saka njaluk jawaban cepet saka AI nganti nggunakake AI kanggo ngrampungake masalah langkah demi langkah kanthi tuntunan kaya tutor. Kanggo nyengkuyung pangguna supaya sesambungan karo ChatGPT kanthi cara sing ndhukung pangerten sing luwih jero lan pambangunan katrampilan, OpenAI ngenalake mode sinau taun kepungkur. Ing balik layar, mode sinau didhukung dening instruksi sistem khusus sing kami tulis bebarengan karo guru, ilmuwan, lan ahli pedagogi kanggo nggambarake sakumpulan prilaku inti sing ndhukung sinau sejati, ora mung jawaban—kanthi nggunakke scaffolding, mriksa pangerten, lan latihan terpandu.

Kanggo nguji apa gaya interaksi AI sing selaras karo pedagogi iki bisa nuntun marang asil sinau sing luwih apik, kami nganakake studi acak karo luwih saka 300 mahasiswa sing lagi nyiapake ujian ilmu saraf lan mikroekonomi. Sanajan analisis isih lumaku, asil awal menehi kapercayan marang kami manawa gaya interaksi AI sing selaras karo pedagogi, sing didhukung liwat fitur kaya mode sinau, bisa ningkatake asil sinau. Nanging, riset iki uga ngungkap kasunyatan penting: sing paling wigati yaiku apa peningkatan lan prilaku produktif sing gegandhengan kuwi tetep awet saka wektu ke wektu.

Rancangan studi

Partisipan dipérang dadi salah siji saka telung klompok: klompok kontrol sinau nganggo sumber daya online tradisional kayata Google Search lan YouTube, kanthi fitur ringkesan gawean AI dipateni, déné rong klompok tambahan diwenehi akses menyang salah siji saka rong varian mode sinau sing dirancang kanggo nuntun siswa liwat proses sinau kanthi cara sing rada beda. Kuis dasar lan survei onboarding diklumpukake sadurunge kanggo nyetel bedane paparan kuliah sadurunge, kabiasaan sinau, kapercayan akademik, lan akrabé karo piranti AI. Siswa ngrampungake sesi mode sinau sing diwatesi wektu sadurunge saben ujian, kanthi loro varian mode sinau diimbangi silang ing antarane mata pelajaran.

Setelan iki dirancang kanggo nggambarake kahanan sinau ing donya nyata tinimbang lingkungan laboratorium sing dikontrol ketat. Partisipasi ora digandhengake karo kinerja ujian, lan ora kabeh siswa nggunakake mode sinau kanthi tingkat sing padha sajrone sesi nominal 40 menit. Iki ngidini kami ngukur lan nglaporake efek intention-to-treat (ITT), yaiku dampak saka diwenehi akses marang piranti kasebut ing kahanan peluncuran sing realistis—kanthi tembung liya, dampak kausal saka ditawani mode sinau, kanthi ngakoni manawa keterlibatan bisa beda-beda ing praktik.

Temuan

Kami ngukur kinerja ing saben ujian kanthi kapisah. Ing studi acak kami, peningkatan ora seragam ing kabeh mata pelajaran, lan tingkat keterlibatan karo mode sinau beda-beda antarpartisipan.

  • Ilmu saraf (ITT utama): Kami mirsani bedane sing arahé positif kanggo mode sinau dibandhingake karo kontrol, nanging asilé ora bisa dibédakaké saka siswa sing sinau nganggo sumber daya online tradisional. Sawetara masalah onboarding lan teknis mengaruhi wektu sinau siswa sing nggunakake mode sinau.
  • Mikroekonomi (ITT utama): Kami mirsani peningkatan sing migunani ing kinerja ujian ing antarane siswa sing diwenehi akses menyang mode sinau dibandhingake klompok kontrol tanpa AI—kira-kira skor relatif 15% luwih dhuwur.

Mode sinau (varian A & B) vs Kontrol (klompok tanpa AI): Rata-rata skor ujian sing disetel

Efek iki tetep konsisten nalika saben varian mode sinau dibandhingake dhewe-dhewe karo kontrol.

Sanajan iki nggambarake variasi ing donya nyata, iki nyorot watesan sing luwih jero babagan cara asil sinau biasane diukur.

Akèh pendekatan evaluasi sing wis ana gumantung marang intervensi tetep sing dinilai sajrone jendhela wektu sing cekak, nggunakake asil kayata skor tes utawa esai akhir minangka sinyal utama. Cara-cara iki ora dirancang kanggo nyekel mekanisme inti sing ndadekake AI mengaruhi sinau ing praktik: interaksi pribadi sing terus-terusan lan berkembang bareng strategi, preferensi, lan kabiasaan sinau siswa dhewe. Uga ora nuduhake apa peningkatan ing siji kapabilitas, kayata éling jangka cekak, bisa teka bareng karo tukar-tambah ing kapabilitas liya, kayata ketekunan, motivasi otonom, utawa pemecahan masalah kreatif. Akibate, pendekatan iki kélangan efek kognitif longitudinal sing pungkasane nemtokake apa AI tenan ningkatake sinau kanthi makna.

Amarga lingkungan sinau beda-beda banget ing antarane negara, kurikulum, lan tujuan institusi, asil saka studi siji-sijiné arang bisa digeneralisasi menyang kabeh sistem. Mula, pendekatan pangukuran kudu cukup fleksibel supaya sistem pendhidhikan sing beda bisa nemtokake kaya apa sukses ing konteksé, ngevaluasi AI miturut standaré dhewe, lan nindakake iterasi sabanjuré.

Mbangun sistem pangukuran sing luwih apik

Adhedhasar pelajaran saka riset mode sinau OpenAI, kami wis mbangun sistem pangukuran terstruktur kanggo ngukur dampak AI marang siswa kanthi skala gedhe, lan nggawe mekanisme kanggo ningkatake model adhedhasar asil kasebut. Sistem iki didhasarake marang telung sinyal—kepiye model tumindak, kepiye tanggapan siswa, lan asil kognitif apa sing bisa diukur saka wektu ke wektu. Isiné kalebu:

  • Instruksi sistem kanggo nyaring prilaku model: panggunaan basa alami kanggo ngganti prilaku baku model supaya luwih selaras karo pendekatan pedagogis tartamtu.
  • Klasifier interaksi sinau: iki kanthi otomatis ndeteksi “momen sinau” ing interaksi siswa–model nyata sing wis diilangi identitasé lan menehi label karakteristik penting kayata keterlibatan lan koreksi kesalahan.
  • Penilai kualitas sinau: iki ngevaluasi lan menehi skor kanggo saben momen sinau kasebut adhedhasar apa siswa bisa nggayuh tujuane lan sepira interaksi kasebut ngetutake prinsip pedagogis sing kuwat, kalebu ngenali mode kegagalan.
  • Penilai sinau longitudinal: iki nglacak owah-owahan ing interaksi siswa sing padha karo model saka wektu ke wektu—kalebu keterlibatan, ketekunan, lan strategi metakognitif—ing tingkat individu lan kohort.
  • Ukuran kognitif lan metakognitif sing distandardisasi: iki minangka instrumen pihak katelu sing wis divalidasi lan dikirim liwat ChatGPT sadurunge/sajrone/sawise akses kanggo netepake garis dasar lan ngukur owah-owahan ing kapabilitas dhasar kayata pamikiran kritis, kreativitas, lan memori.

Nalika digabung, kami nyebut sistem pangukuran iki minangka Learning Outcomes Measurement Suite.

Sistem iki ngasilake sinyal penting sing bisa digunakake ekosistem pendhidhikan: tampilan terstruktur babagan momen sinau, dashboard sing nuduhake kepiye asil owah saka wektu ke wektu ing antarane kohort, indikator kinerja model miturut rubrik ngajar lan tutoring, lan ukuran asil sing selaras karo asesmen terstandar lan kuesioner cekak kanggo siswa. Yen kasedhiya, sistem iki bisa nggabungake ground truth sing diwenehake mitra kayata skor ujian, observasi kelas, utawa kehadiran.

Diagram sing nggambarake alur kerja pangukuran asil sinau nalika AI ngolah data liwat langkah analisis, evaluasi, lan verifikasi sadurunge menehi wawasan kanggo ndhukung siswa.

Kabeh data wis diilangi identitasé

Sistem iki uga ngidini mitra kami mangerteni dampak kognitif sing luwih jero saka panggunaan AI kanggo sinau saka wektu ke wektu, amarga liwat sistem iki kami uga bisa nglacak dampak marang kapabilitas kayata:

  • Motivasi Otonom: tingkat nalika siswa mbentuk sinaué dhewe tinimbang mung diarahkan model
  • Keterlibatan Produktif: frekuensi, variasi, lan kualitas interaksi pedagogis
  • Ketekunan Tugas: tingkat nalika siswa tetep ngadhepi lan ngliwati tantangan kognitif
  • Metakognisi: frekuensi lan kualitas upaya siswa kanggo ngrancang, merefleksikake, lan ngawasi pendekatan sinaué
  • Éling maneh: akurasi nalika siswa bisa ngelingi isi saka interaksi sadurunge

Iki nggambarake upaya umum kami supaya ora mung fokus marang definisi asil sinau sing sempit (skor tes mundhak), nanging uga kapabilitas holistik sing dadi pondhasine sinau. Iki uga nggambarake kapercayan kami manawa ora bakal ana solusi tunggal babagan apa sing kudu dioptimalake: sistem lan pendidik kudu diwenehi daya kanggo nuntun tukar-tambah sing selaras karo praktik lan pendekatan pedagogis sing paling apik.

Langkah sabanjuré

Kami lagi validasi Learning Outcomes Measurement Suite liwat studi skala gedhe sadurunge nggawe kasedhiya kanthi amba. Karya iki lagi lumaku karo Universitas Tartu lan Inisiatif SCALE saka Stanford ing antarane mitra skala nasional kaya Estonia, ing ngendi measurement suite iki lagi diteliti karo meh 20.000 siswa umur 16–18 taun sajrone sawetara sasi. Panggunaan déning siswa bakal kelakon kanthi kolaborasi raket karo pimpinan lokal, kanggo njamin keamanan lan keselarasan karo kurikulum lokal.

“Estonia tansah nyedhaki pendhidhikan dudu minangka bab sing statis, nanging minangka sistem sing terus dandan. Kanthi AI dadi bagéan saka gambaran iki, pitakonan gedhene yaiku kepiye kita ngukur dampak jangka panjang AI marang sinau. Kuwi sing lagi digoleki bareng OpenAI. Siswa antusias melu ing proses pangembangan, lan akeh sing pengin sinau carane ndhukung sinau nganggo AI. Iki krasa kaya titik balik tenan, lan kita bungah bisa nyumbang metode sing bisa digunakake maneh lan dikembangaké déning sistem pendhidhikan liyané.”
–Jaan Aru, Profesor Madya ing Institut Ilmu Komputer, Universitas Tartu

Karya iki dibangun saka kumpulan riset kolaboratif sing luwih amba sing saiki lagi lumaku. Saliyane riset asil sing ditindakake liwat mitra pendiri ing Learning Lab, OpenAI ndhukung studi ing persimpangan antarane sinau lan tenaga kerja—nyinaoni kepiye AI mbentuk jalur akademik siswa, keputusan karier, lan cara institusi bisa ndhukung adopsi sing tanggung jawab. Riset iki kedadeyan ing Bocconi University, Innova Schools, Tuck School of Business ing Dartmouth, San Diego State University, Stony Brook University, lan liya-liyané.

Nalika kami nindakake studi jangka luwih dawa babagan kepiye siswa paling apik sinau nganggo AI, kami arep nuduhake temuan lan kerja bareng ekosistem pendhidhikan sing luwih amba kanggo mesthekake AI migunani kanggo siswa ing endi wae.

Sing kepengin nampa kabar anyar babagan karya iki bisa ndhaptar ing kene.

Pangarang

OpenAI