Táimid ag tabhairt isteach trí shamhail fuaime san API a osclaíonn aicme nua aipeanna gutha d’fhorbróirí. Leis na samhlacha seo, is féidir le forbróirí eispéiris ghutha a thógáil a bhraitheann níos nádúrtha, a fhreagraíonn ar bhealach níos cliste, agus a dhéanann gníomh i bhfíor-am:
- GPT‑Realtime‑2, ár gcéad shamhail ghutha le réasúnaíocht ar leibhéal GPT‑5 ar féidir léi iarratais níos deacra a láimhseáil agus an comhrá a thabhairt ar aghaidh go nádúrtha.
- GPT‑Realtime‑Translate, samhail nua aistriúcháin bheo a aistríonn urlabhra ó bhreis agus 70 teanga ionchuir go 13 theanga aschuir agus í ag coinneáil suas leis an gcainteoir.
- GPT‑Realtime‑Whisper, sruthú nua cainte-go-téacs a thras-scríobhann urlabhra beo de réir mar a labhraíonn an cainteoir.
Bain triail as GPT-Realtime-2
Cad is féidir liom a fhiafraí?
Tar éis duit an seisiún a thosú, bain triail as ceann díobh seo a rá:
- Táim ag óstáil dinnéir ar ghearrfhógra anocht. Tá 30 nóiméad agam, beirt chairde veigeatóracha, duine amháin nach maith leis beacáin, agus cistin bheag bídeach. Cabhraigh liom biachlár simplí a phleanáil.
- Táim ag cur fáilte roimh aíonna chuig imeacht beo sa tSeapáin. Abair fáilte chroíúil nádúrtha i Seapáinis — mar a bheadh óstach ag cur tús le rud éigin speisialta.
- Is í Orbit-742Q uimhir m’ordaithe. Abair ar ais go soiléir é ionas gur féidir liom a dheimhniú go bhfuil sé ceart.
- Cabhraigh liom cleachtadh a dhéanamh ar insint do mo fhoireann gur shroicheamar ár gcloch mhíle seolta. Ar dtús, abair é le muinín chiúin, agus ansin le níos mó spleodair.
- Táim ag pleanáil tráth na gceist do thuras bóthair. Tabhair dom trí cheist chleasa a chloiseann go mealltach simplí, agus ansin mínigh gach freagra in aon abairt amháin.
Tá teorainn ama leis an taispeántas seo. Trí úsáid a bhaint as, aontaíonn sibh le Téarmaí OpenAI agus admhaíonn sibh ár Polasaí Príobhaídeachais.
Tá guth ag éirí ar cheann de na bealaí is nádúrtha do dhaoine bogearraí a úsáid. Ligeann sé do dhuine cabhair a iarraidh agus é ag tiomáint, plean taistil a athrú agus é ag siúl trí aerfort, tacaíocht a fháil sa teanga is fearr leis, nó dul trí thasc gan stad chun clóscríobh.
Ach chun táirgí gutha úsáideacha a thógáil teastaíonn níos mó ná sealanna sciobtha nó guth nádúrtha. Ní mór do ghníomhaire gutha tuiscint a fháil ar a bhfuil i gceist ag duine, súil a choinneáil ar an gcomhthéacs, teacht chuige féin nuair a athraíonn iarratas, uirlisí a úsáid fad is a leanann an comhrá, agus freagairt ar bhealach a oireann don nóiméad.
Le chéile, bogann na samhlacha atá á seoladh againn fuaim fíor-ama ó ghlaoch-agus-freagra simplí i dtreo comhéadain ghutha ar féidir leo obair a dhéanamh i ndáiríre: éisteacht, réasúnaíocht a dhéanamh, aistriú, tras-scríobh agus gníomhú de réir mar a fhorbraíonn comhrá.
De réir mar a éiríonn guth ina bhealach níos nádúrtha chun bogearraí a úsáid, táimid ag feiceáil forbróirí ag tógáil timpeall ar thrí phatrún atá ag teacht chun cinn in AI gutha:
- Guth-go-gníomh, áit ar féidir le daoine cur síos a dhéanamh ar a bhfuil de dhíth orthu agus ar féidir leis an gcóras réasúnaíocht a dhéanamh faoin iarratas, uirlisí a úsáid agus an tasc a chur i gcrích. Mar shampla, tá Zillow ag tógáil cúntóra ar féidir leis éisteacht, réasúnaíocht a dhéanamh agus gníomhú ar iarratais ar nós: “aimsigh tithe dom laistigh de mo BuyAbility, seachain sráideanna gnóthacha, agus sceideal turas don Satharn.”
- Córais-go-guth, áit ar féidir le bogearraí comhthéacs a iompú ina threoir labhartha bheo. Mar shampla, d’fhéadfadh aip taistil a rá go réamhghníomhach le taistealaí: “Tá moill ar d’eitilt isteach, ach is féidir leat do nasc a dhéanamh fós. D’aimsigh mé an geata nua, mhapáil mé an bealach is tapúla tríd an teirminéal, agus táthar ag súil go n-aistreofar do mhála fós.”
- Guth-go-guth, áit ar féidir le AI cabhrú le comhráite beo leanúint ar aghaidh trasna teangacha, tascanna nó comhthéacs atá ag athrú. Mar shampla, tá Deutsche Telekom ag tógáil eispéiris tacaíochta gutha inar féidir le custaiméirí labhairt sa teanga is compordaí dóibh, fad is a aistríonn an tsamhail an comhrá i bhfíor-am.
Is féidir leis na patrúin seo oibriú le chéile freisin. Tá Priceline ag obair i dtreo todhchaí inar féidir le taistealaithe turais iomlána a bhainistiú le guth: eitiltí agus óstáin a chuardach go comhráiteach, athruithe a láimhseáil amhail áirithint óstáin a choigeartú tar éis moille eitilte nó nuashonruithe fíor-ama a fháil ar amanna feithimh TSA, agus comhráite a aistriú nuair atá taistealaithe ar an talamh.
Tá GPT‑Realtime‑2 tógtha le haghaidh idirghníomhaíochtaí gutha beo ina gcoinníonn an tsamhail an comhrá ag bogadh agus í ag déanamh réasúnaíochta faoi iarratas, ag glaoch ar uirlisí, ag láimhseáil ceartúchán nó cur isteach, agus ag freagairt ar bhealach a oireann don nóiméad.
- Réamhfhocail: Is féidir le forbróirí frásaí gearra a chumasú roimh phríomhfhreagra, ar nós “lig dom é sin a sheiceáil” nó “nóiméad amháin agus mé ag breathnú air,” ionas go mbeidh a fhios ag úsáideoirí go bhfuil an gníomhaire ag obair ar an iarratas.
- Glaonna uirlisí comhthreomhara agus trédhearcacht uirlisí: Is féidir leis an tsamhail glaoch ar uirlisí éagsúla ag an am céanna agus na gníomhartha sin a dhéanamh inchloiste le frásaí ar nós “ag seiceáil do fhéilire” nó “ag féachaint air sin anois,” rud a chabhraíonn le gníomhairí fanacht freagrúil agus tascanna á gcur i gcrích.
- Iompar aisghabhála níos láidre: Is féidir leis an tsamhail teacht chuige féin ar bhealach níos galánta trí rudaí a rá ar nós “Tá deacracht agam leis sin faoi láthair,” in ionad teip go ciúin nó an comhrá a bhriseadh.
- Comhthéacs níos faide do shreafaí oibre gníomhaireacha: Táimid ag méadú na fuinneoige comhthéacs ó 32K go 128K chun tacú le seisiúin níos faide, níos comhleanúnaí agus le sreafaí tascanna níos casta.
- Tuiscint fearainn níos láidre: Coinníonn an tsamhail téarmaíocht speisialaithe, ainmneacha dílse, téarmaí sláinte, agus foclóir eile atá tábhachtach i suíomhanna táirgthe níos fearr.
- Tón agus seachadadh níos inrialaithe: Is féidir leis an tsamhail a ton a choigeartú níos fearr—ag labhairt go socair agus saincheist á réiteach, go comhbhách nuair atá úsáideoir míshásta, nó go fuinniúil nuair atá gníomh rathúil á dheimhniú.
- Iarracht réasúnaíochta inchoigeartaithe: Is féidir le forbróirí roghnú anois as leibhéil réasúnaíochta minimal, low, medium, high, and xhigh, le low as the default, rud a chothromaíonn moille níos ísle d’idirghníomhaíochtaí díreacha le réasúnaíocht níos coinsiasaí d’iarratais chasta.
Léirítear na gnóthachain i meastóireachtaí fuaime a mheaitseálann go dlúth le gníomhairí gutha táirgthe: scórálann GPT‑Realtime‑2 (high) 15.2% níos airde ar Big Bench Audio maidir le hintleacht fuaime ná GPT‑Realtime‑1.5. Scórálann GPT‑Realtime‑2 (xhigh) 13.8% níos airde ar Audio MultiChallenge maidir le treoracha a leanúint, ag feabhsú ar GPT‑Realtime‑1.5 agus ag léiriú réasúnaíocht, bainistiú comhthéacs agus rialú níos láidre i gcomhráite beo.
Big Bench Audio déanann sé cumais dhúshlánacha réasúnaíochta a mheas i samhlacha teanga a thacaíonn le hionchur fuaime. Déanann Audio MultiChallenge(osclaíonn i bhfuinneog nua) faisnéis chomhrá ilchasta i gcórais idirphlé labhartha a mheas, lena n-áirítear treoracha a leanúint, comhtháthú comhthéacs, féin-chomhsheasmhacht, agus ceartúcháin nádúrtha cainte a láimhseáil.
Léirítear draíocht GPT‑Realtime‑2 i réimse cásanna úsáide éagsúla:
Le linn tástála luaithe, d’úsáid gnólachtaí GPT‑Realtime‑2 chun gníomhairí gutha a thógáil a chuidíonn le custaiméirí agus le fostaithe rudaí a chur i gcrích trí chomhrá nádúrtha:
“Tá lucht tógála ag iarraidh dul chun cinn leanúnach, ní atriall gan deireadh. Briseann GPT-5.5 trí na ballaí a mbuaileann daoine leo de ghnáth ar thascanna níos casta, amhail sreafaí fíordheimhnithe agus sioncronú fíor-ama, i bhfad níos lú babhtaí. Lonraíonn an tsamhail go fírinneach nuair a éiríonn an obair crua, agus í ag láimhseáil tascanna deacra le i bhfad níos lú anonn is anall.”
Cabhraíonn GPT‑Realtime‑Translate le forbróirí eispéiris ghutha bheo ilteangacha a thógáil inar féidir le gach duine labhairt sa teanga is fearr leo agus an comhrá a chloisteáil aistrithe i bhfíor-am agus na tras-scríbhinní fíor-ama a léamh. Tacaíonn sé le breis agus 70 teanga ionchuir agus 13 theanga aschuir, rud a fhágann go bhfuil sé úsáideach do thacaíocht do chustaiméirí, díolacháin trasteorann, oideachas, imeachtaí, na meáin, agus ardáin chruthaitheoirí a fhreastalaíonn ar lucht féachana domhanda.
I gcás forbróirí, ní mór d’aistriúchán beo brí a chaomhnú agus coinneáil suas leis an gcainteoir, fiú nuair a labhraíonn daoine go nádúrtha, nuair a athraíonn siad comhthéacs, nó nuair a úsáideann siad fuaimniú réigiúnach agus teanga a bhaineann go sonrach le fearann. Mar shampla, tá Deutsche Telekom ag tástáil na samhla le haghaidh idirghníomhaíochtaí gutha ilteangacha, áit ar féidir le moille níos ísle agus líofacht níos láidre comhráite tras-teanga a dhéanamh níos nádúrtha.
Sa fhíseán seo, taispeánann Vimeo conas is féidir le GPT‑Realtime‑Translate físeán oideachais táirge a aistriú beo agus é á sheinm, ionas gur féidir le custaiméirí domhanda nuashonruithe a chloisteáil sa teanga is fearr leo gan fanacht le leagan ar leithligh táirgthe.
“Ciallaíonn AI gutha a thógáil don India déileáil le foghraíocht réigiúnach éagsúil. Inár meastóireachtaí ar Hiondúis, Tamailis, agus Teileagúis, sheachaid GPT-Realtime-Translate Rátaí Earráide Focal 12.5% níos ísle ná aon tsamhail eile a thástáil muid, mar aon le rátaí cúltaca níos ísle, críochnú tascanna níos airde, agus foighne a choinnigh comhrá nádúrtha ar bun. Socraíonn sé caighdeán nua d’AI gutha ilteangach.”
Is samhail nua tras-scríofa sruthaithe í GPT‑Realtime‑Whisper atá tógtha le haghaidh cainte-go-téacs ísealmhoille. Tras-scríobhann sí fuaim de réir mar a labhraíonn daoine, ionas gur féidir le táirgí beo a bheith níos tapa, níos freagrúla, agus níos nádúrtha—ó fhotheidil a thagann chun cinn sa nóiméad, go nótaí cruinnithe a choinníonn suas leis an gcomhrá.
Déanann an tsamhail caint bheo inúsáidte laistigh de shreafaí oibre gnó de réir mar a tharlaíonn sí. Is féidir le foirne fotheidil a chumhachtú do chruinnithe, seomraí ranga, craoltaí agus imeachtaí; nótaí agus achoimrí a ghiniúint fad is atá comhráite fós ar siúl; gníomhairí gutha a thógáil a gcaithfidh úsáideoirí a thuiscint go leanúnach; agus sreafaí oibre leantacha níos tapúla a chruthú do thacaíocht do chustaiméirí, sláinte, díolacháin, earcaíocht, agus idirghníomhaíochtaí labhartha ardtoirte eile.
Ionchorpraíonn an Realtime API ilshraitheanna cosaintí agus maoluithe chun cabhrú le mí-úsáid a chosc. Bainimid úsáid as aicmitheoirí gníomhacha thar sheisiúin Realtime API, rud a chiallaíonn gur féidir comhráite áirithe a stopadh má aimsítear go sáraíonn siad ár dtreoirlínte maidir le hábhar díobhálach. Is féidir le forbróirí a ráillí cosanta sábháilteachta breise féin a chur leis go héasca freisin ag úsáid an Agents SDK.(osclaíonn i bhfuinneog nua)
Cuireann ár polasaithe úsáide cosc ar aschuir ónár seirbhísí a athúsáid nó a dháileadh le haghaidh turscair, meabhlaireachta, nó cuspóirí díobhálacha eile. Ní mór d’fhorbróirí a chur in iúl go soiléir d’úsáideoirí deiridh freisin nuair atá siad ag idirghníomhú le AI, mura bhfuil sé sin soiléir ón gcomhthéacs cheana féin.
Tacaíonn an Realtime API go hiomlán le Cónaitheacht Sonraí AE(osclaíonn i bhfuinneog nua) d’fheidhmchláir atá lonnaithe san AE agus tá sé cumhdaithe ag ár ngealltanais phríobháideachais fiontair.
Tá GPT‑Realtime‑2, GPT‑Realtime‑Translate agus GPT‑Realtime‑Whisper ar fáil san Realtime API. Tá praghas $32 / 1M téacschomhartha ionchuir fuaime ag GPT‑Realtime‑2 ($0.40 do théacschomhartha ionchuir i dtaisce) agus $64 / 1M téacschomhartha aschuir fuaime. Tá praghas $0.034 sa nóiméad ar GPT‑Realtime‑Translate. Tá praghas $0.017 sa nóiméad ar GPT‑Realtime‑Whisper.
Is féidir leat na samhlacha nua gutha fíor-ama a thástáil sa Playground(osclaíonn i bhfuinneog nua).
Chun tosú ag tógáil, oscail an leid seo in Codex chun GPT‑Realtime‑2 a chur le haip atá ann cheana féin nó ceann nua a thosú. Mura bhfuil Codex agat fós, íoslódáil an aip Codex ar dtús.


