Ag tabhairt isteach ChatGPT
Tá samhail darb ainm ChatGPT oilte againn a idirghníomhaíonn ar bhealach comhráiteach. Fágann an fhormáid chomhrá gur féidir le ChatGPT ceisteanna leantacha a fhreagairt, a chuid botún a admháil, dúshlán a thabhairt do réamhthuairimí míchearta, agus iarratais mhíchuí a dhiúltú.
Is samhail ghaolmhar le InstructGPT é ChatGPT, agus cuirtear oiliúint air chun treoir i leid a leanúint agus freagra mionsonraithe a sholáthar.
Táimid ar bís ChatGPT a chur i láthair chun aiseolas úsáideoirí a fháil agus foghlaim faoina láidreachtaí agus a laigí. Le linn an réamhamhairc taighde, tá úsáid ChatGPT saor in aisce. Bain triail as anois ag chatgpt.com(osclaíonn i bhfuinneog nua).
Samplaí
resultWorkerErr := make(chan error)
defer close(resultWorkerErr)
go func() {
defer cancel()
resultWorkerErr <- b.resultWorker(ctx)
}()
err := b.worker(ctx)
cancel()
if err == nil {
return <-resultWorkerErr
}
return multierror.Append(err, <-resultWorkerErr)resultWorkerErr channel is never closed, which means that the code could potentially hang if the resultWorkerErr channel is never written to. This could happen if b.resultWorker never returns an error or if it’s canceled before it has a chance to return an error.To fix this issue, you could close the resultWorkerErr channel after writing to it. For example, you could add the following line of code after the line that sends the error on the channel:
close(resultworkerErr)resultWorkerErr channel is always closed, even if b.resultWorker never returns an error. Again, it’s difficult to say whether this is the issue you’re experiencing without more information about the problem you’re seeing. Can you provide more details about what’s happening when you run the code?Chuireamar oiliúint ar an tsamhail seo ag úsáid Foghlaim Atreisiúcháin ó Aiseolas Daonna (RLHF), ag úsáid na modhanna céanna le InstructGPT, ach le difríochtaí beaga i socrú an bhailithe sonraí. Chuireamar oiliúint ar shamhail tosaigh ag úsáid mionchoigeartú faoi mhaoirseacht: chuir oiliúnóirí daonna AI comhráite ar fáil ina raibh siad ag imirt an dá thaobh — an t-úsáideoir agus cúntóir AI. Thugamar rochtain do na hoiliúnóirí ar mholtaí a scríobh an tsamhail chun cabhrú leo a gcuid freagraí a chumadh. Mheascamar an tacar sonraí nua comhrá seo le tacar sonraí InstructGPT, ar athraíomar go formáid chomhrá é.
Chun samhail luaíochta a chruthú le haghaidh foghlaim atreisiúcháin, bhí orainn sonraí comparáide a bhailiú, a bhí comhdhéanta de dhá fhreagra samhla nó níos mó rangaithe de réir cáilíochta. Chun na sonraí seo a bhailiú, thógamar comhráite a bhí ag oiliúnóirí AI leis an gcomhrá-róbó. Roghnaíomar teachtaireacht a scríobh an tsamhail go randamach, samplálamar roinnt críochnuithe malartacha, agus d'iarramar ar oiliúnóirí AI iad a rangú. Ag úsáid na samhlacha luaíochta seo, is féidir linn an tsamhail a mhionchoigeartú ag úsáid Optamú Neasach Polasaí. Rinneamar roinnt atriallta den phróiseas seo.

Rinneadh mionchoigeartú ar ChatGPT ó shamhail sa tsraith GPT‑3.5, ar chríochnaigh a traenáil go luath in 2022. Is féidir leat tuilleadh a fhoghlaim faoin tsraith 3.5 anseo(osclaíonn i bhfuinneog nua). Cuireadh oiliúint ar ChatGPT agus GPT‑3.5 ar bhonneagar sár-ríomhaireachta Azure AI.
- Uaireanta scríobhann ChatGPT freagraí atá inchreidte ó thaobh fuaime de ach atá mícheart nó gan chiall. Tá sé dúshlánach an fhadhb seo a réiteach, mar: (1) le linn traenála RL, níl aon fhoinse fírinne ann faoi láthair; (2) má chuirtear oiliúint ar an tsamhail a bheith níos cúramaí, diúltaíonn sí ceisteanna is féidir léi a fhreagairt i gceart; agus (3) cuireann traenáil faoi mhaoirseacht an tsamhail amú toisc go mbraitheann an freagra idéalach ar a bhfuil ar eolas ag an tsamhail(osclaíonn i bhfuinneog nua), seachas ar a bhfuil ar eolas ag an taispeántóir daonna.
- Tá ChatGPT íogair d'athruithe beaga ar fhoclaíocht an ionchuir nó don iarracht chéanna leis an leid chéanna a dhéanamh arís agus arís. Mar shampla, le leagan amháin de cheist, féadfaidh an tsamhail a mhaíomh nach bhfuil an freagra ar eolas aici, ach le hathfhriotal beag, féadfaidh sí freagairt i gceart.
- Is minic a bhíonn an tsamhail rófhoclach agus baineann sí ró-úsáid as frásaí áirithe, amhail a rá arís gur samhail teanga í atá oilte ag OpenAI. Eascraíonn na fadhbanna seo as claontaí sna sonraí traenála (is fearr leis na hoiliúnóirí freagraí níos faide a bhfuil cuma níos cuimsithí orthu) agus as fadhbanna ró-optamaithe atá aitheanta go maith.1, 2
- Go hidéalach, chuirfeadh an tsamhail ceisteanna soiléirithe nuair a chuirfeadh an t-úsáideoir fiosrúchán débhríoch ar fáil. Ina ionad sin, is gnách go ndéanann ár samhlacha reatha buille faoi thuairim faoi cad a bhí i gceist ag an úsáideoir.
- Cé go ndearnamar iarrachtaí an tsamhail a chur ag diúltú d'iarratais mhíchuí, freagróidh sí treoracha díobhálacha uaireanta nó léireoidh sí iompar claonta. Táimid ag úsáid an Moderation API chun cineálacha áirithe ábhair neamhshábháilte a rabhadh nó a bhlocáil, ach táimid ag súil go mbeidh roinnt diúltach dearfach agus dearfach bréagach aige faoi láthair. Tá fonn orainn aiseolas úsáideoirí a bhailiú chun cabhrú lenár gcuid oibre leanúnaí an córas seo a fheabhsú.
Is é eisiúint taighde an lae inniu de ChatGPT an chéim is déanaí in imscaradh atriallach OpenAI de chórais AI atá ag éirí níos sábháilte agus níos úsáidí. Chuir go leor ceachtanna ó imscaradh samhlacha níos luaithe cosúil le GPT‑3 agus Codex leis na maoluithe sábháilteachta atá i bhfeidhm don eisiúint seo, lena n-áirítear laghduithe suntasacha ar aschuir dhíobhálacha agus mhífhírinneacha a baineadh amach trí fhoghlaim atreisiúcháin ó aiseolas daonna (RLHF).
Tá a fhios againn go bhfuil go leor teorainneacha fós ann mar a pléadh thuas agus tá sé beartaithe againn nuashonruithe rialta samhla a dhéanamh chun feabhas a chur ar réimsí mar seo. Ach tá súil againn freisin, trí chomhéadan inrochtana a chur ar fáil do ChatGPT, go bhfaighidh muid aiseolas luachmhar ó úsáideoirí ar shaincheisteanna nach bhfuil ar eolas againn cheana.
Spreagtar úsáideoirí aiseolas a thabhairt ar aschuir fhadhbacha samhla tríd an gcomhéadan úsáideora, chomh maith le dearfacha/diúltacha bréagacha ón scagaire seachtrach ábhair atá mar chuid den chomhéadan freisin. Tá suim ar leith againn in aiseolas maidir le haschuir dhíobhálacha a d'fhéadfadh tarlú i ndálaí fíorshaoil neamh-choimhlinteacha, chomh maith le haiseolas a chuidíonn linn rioscaí nua agus maoluithe féideartha a aimsiú agus a thuiscint. Is féidir leat roghnú dul isteach sa Chomórtas Aiseolais ChatGPT(osclaíonn i bhfuinneog nua)3 le deis suas le $500 i gcreidmheasanna API a bhuachan.A Is féidir iontrálacha a chur isteach tríd an bhfoirm aiseolais atá nasctha i gcomhéadan ChatGPT.
Táimid ar bís na ceachtanna ón eisiúint seo a thabhairt linn chuig imscaradh córas níos cumasaí, díreach mar a chuir imscaradh níos luaithe leis an gceann seo.
Fonótaí
- A
Níl aon cheannach riachtanach, neamhbhailí áit a bhfuil cosc air. Ní mór a bheith 18 mbliana d'aois ar a laghad chun páirt a ghlacadh. Le haghaidh sonraí an chomórtais, féach ar na Rialacha Oifigiúla(osclaíonn i bhfuinneog nua).
Tagairtí
- 1
Stiennon, Nisan, et al. “Ag foghlaim achoimriú le haiseolas daonna(osclaíonn i bhfuinneog nua).” Advances in Neural Information Processing Systems 33 (2020): 3008-3021.
- 2
Gao, Leo, John Schulman, and Jacob Hilton. “Dlíthe Scálaithe d'Ró-Optamú Samhla Luaíochta(osclaíonn i bhfuinneog nua).” arXiv preprint arXiv:2210.10760 (2022).
- 3
Tagann an inspioráid don chomórtas seo i bpáirt ó obair le Kenway, Josh, Camille François, Sasha Costanza-Chock, Inioluwa Deborah Raji, agus Joy Buolamwini. Deolchairí Fabhtanna do Dhíobhálacha Algartamacha? Ceachtanna ó Nochtadh Leochaileachtaí Cibearshlándála maidir le Fionnachtain, Nochtadh agus Ceartú Díobhálacha Algartamacha. Washington, DC: Algorithmic Justice League. Eanáir 2022. Ar fáil ag https://ajl.org/bugs(osclaíonn i bhfuinneog nua). Féach freisin obair le Brundage, Miles, Avin, Shahar, Wang, Jasmine, Belfield, Haydn, agus Gretchen Krueger et al. “I dTreo Fhorbairt Iontaofa AI: Meicníochtaí chun Tacú le hÉilimh Inbhraite,” Aibreán 2020. Ar fáil ag https://arxiv.org/abs/2004.07213(osclaíonn i bhfuinneog nua). Féach sampla níos luaithe de chomórtas den sórt sin ag HackerOne. 2021b. “Claonadh Algartamach Twitter.” HackerOne. https://hackerone.com/twitter-algorithmic-bias?type=team(osclaíonn i bhfuinneog nua). Ar deireadh, féach obair fhoilsithe luath ar an ábhar seo ó Rubinovitz, JB, “Cláir Dhuais Claonta mar Mhodh chun Claonadh in AI a Chomhrac,” Lúnasa 2018. Ar fáil ag https://rubinovitz.com/2018/08/01/bias-bounty-programs-as-a-method-of-combatting(osclaíonn i bhfuinneog nua).
Údar
Admhálacha
John Schulman, Barret Zoph, Christina Kim, Jacob Hilton, Jacob Menick, Jiayi Weng, Juan Felipe Ceron Uribe, Liam Fedus, Luke Metz, Michael Pokorny, Rapha Gontijo Lopes, Shengjia Zhao, Arun Vijayvergiya, Eric Sigler, Adam Perelman, Chelsea Voss, Mike Heaton, Joel Parish, Dave Cummings, Rajeev Nayak, Valerie Balcom, David Schnurr, Tomer Kaftan, Chris Hallacy, Nicholas Turley, Noah Deutsch, Vik Goel, Jonathan Ward, Aris Konstantinidis, Wojciech Zaremba, Long Ouyang, Leonard Bogdonoff, Joshua Gross, David Medina, Sarah Yoo, Teddy Lee, Ryan Lowe, Dan Mossing, Joost Huizinga, Roger Jiang, Carroll Wainwright, Diogo Almeida, Steph Lin, Marvin Zhang, Kai Xiao, Katarina Slama, Steven Bills, Alex Gray, Jan Leike, Jakub Pachocki, Phil Tillet, Shantanu Jain, Greg Brockman, Nick Ryder, Alex Paino, Qiming Yuan, Clemens Winter, Ben Wang, Mo Bavarian, Igor Babuschkin, Szymon Sidor, Ingmar Kanitscheider, Mikhail Pavlov, Matthias Plappert, Nik Tezak, Heewoo Jun, William Zhuk, Vitchyr Pong, Lukasz Kaiser, Jerry Tworek, Andrew Carr, Lilian Weng, Sandhini Agarwal, Karl Cobbe, Vineet Kosaraju, Alethea Power, Stanislas Polu, Jesse Han, Raul Puri, Shawn Jain, Benjamin Chess, Christian Gibson, Oleg Boiko, Emy Parparita, Amin Tootoonchian, Kyle Kosic, Christopher Hesse


