Liwati menyang isi utama
OpenAI

28 Mei 2020

Tonggak

Model basa iku pamelajar conto sithik

Lagi dimuat…

Karya anyar wis nuduhake paningkatan gedhe ing akeh tugas lan tolok ukur NLP liwat latihan awalan ing korpus teks gedhe banjur fine-tuning ing tugas tartamtu. Senajan arsitekture biasane ora gumantung tugas, cara iki isih mbutuhake dataset fine-tuning khusus tugas sing isine ewonan utawa puluhan ewu conto. Kosok baline, manungsa umume bisa nindakake tugas basa anyar mung saka sawetara conto utawa saka pandhuan prasaja - prekara sing nganti saiki isih angel ditindakake dening sistem NLP. Ing kene, kita nuduhake manawa nggedhekake model basa banget nambah kinerja conto sithik sing ora gumantung tugas, kadhang malah nganti bisa saingan karo pendekatan fine-tuning paling apik sadurunge. Kanthi luwih rinci, kita nglatih GPT‑3, model basa autoregresif kanthi 175 milyar parameter, 10x luwih akeh tinimbang model basa non-sparse sadurunge, lan nyoba kinerjane ing setelan conto sithik. Kanggo kabeh tugas, GPT‑3 ditrapake tanpa nganyari gradien utawa fine-tuning, kanthi tugas lan demonstrasi conto sithik ditemtokake mung liwat interaksi teks karo model. GPT‑3 ngasilake kinerja sing kuwat ing akeh dataset NLP, kalebu terjemahan, tanya-jawab, lan tugas cloze, uga sawetara tugas sing mbutuhake nalar langsung utawa adaptasi domain, kayata ngurutake maneh tembung acak, nggunakake tembung anyar ing ukara, utawa nindakake aritmetika 3 digit. Ing wektu sing padha, kita uga ngenali sawetara dataset sing sinau conto sithik GPT‑3 isih angel, uga sawetara dataset sing nuduhake GPT‑3 ngadhepi masalah metodologis gegayutan karo latihan ing korpus web gedhe. Pungkasan, kita nemokake manawa GPT‑3 bisa ngasilake conto artikel warta sing angel dibedakake dening evaluator manungsa saka artikel sing ditulis manungsa. Kita ngrembug dampak sosial sing luwih amba saka temuan iki lan saka GPT‑3 umume.

Penulis

Tom Brown, Benjamin Mann, Nick Ryder, Melanie Subbiah, Jared Kaplan, Prafulla Dhariwal, Arvind Neelakantan, Pranav Shyam, Girish Sastry, Amanda Askell, Sandhini Agarwal, Ariel Herbert-Voss, Gretchen Krueger, Tom Henighan, Rewon Child, Aditya Ramesh

Penulis

Daniel Ziegler, Jeffrey Wu, Clemens Winter, Christopher Hesse, Mark Chen, Eric Sigler, Mateusz Litwin, Scott Gray, Benjamin Chess, Jack Clark, Christopher Berner, Sam McCandlish, Alec Radford, Ilya Sutskever, Dario Amodei