Léim go dtí an príomhábhar
OpenAI

29 Eanáir 2026

Innealtóireacht

Taobh istigh de ghníomhaire sonraí intí OpenAI

Le Bonnie Xu, Aravind Suresh, agus Emma Tang

Ag lódáil…

Cumhachtaíonn sonraí an chaoi a bhfoghlaimíonn córais, a dtagann táirgí chun cinn, agus a ndéanann cuideachtaí cinntí. Ach is minic atá sé níos deacra ná mar ba chóir freagraí a fháil go tapa, i gceart, agus leis an gcomhthéacs ceart. Chun é seo a dhéanamh níos éasca de réir mar a fhásann OpenAI, thógamar ár ngníomhaire sonraí AI saincheaptha intí féin a dhéanann iniúchadh ar ár n-ardán féin agus a dhéanann réasúnaíocht air.

Uirlis shaincheaptha inmheánach amháin atá inár ngníomhaire (ní tairiscint sheachtrach é), tógtha go sonrach timpeall ar shonraí, cheadanna agus shreafaí oibre OpenAI. Táimid ag taispeáint mar ar thógamar é agus mar a úsáidimid é chun samplaí a thabhairt de na bealaí fíora, tionchair a bhféadann AI tacú le hobair laethúil ar fud ár bhfoirne. Is iad na huirlisí OpenAI a d’úsáideamar chun é a thógáil agus a rith (Codex, ár samhail shuaitheanta GPT‑5, an Evals API(osclaíonn i bhfuinneog nua), agus an Embeddings API(osclaíonn i bhfuinneog nua)) na huirlisí céanna a chuirimid ar fáil d’fhorbróirí i ngach áit.

Ligeann ár ngníomhaire sonraí d’fhostaithe dul ó cheist go léargas i gceann cúpla nóiméad, ní laethanta. Laghdaíonn sé seo an tairseach chun sonraí agus anailís mhionchúiseach a tharraingt ar fud gach feidhme, ní hamháin ag ár bhfoireann sonraí. Inniu, bíonn foirne ar fud na hInnealtóireachta, na hEolaíochta Sonraí, an Chuir ar an Margadh, an Airgeadais agus an Taighde ag OpenAI ag brath ar an ngníomhaire chun ceisteanna sonraí ardtionchair a fhreagairt. Mar shampla, is féidir leis cabhrú le freagairt conas seoltaí a mheas agus sláinte an ghnó a thuiscint, trí fhormáid iomasach na teanga nádúrtha. Comhcheanglaíonn an gníomhaire eolas tábla ar leibhéal an tábla faoi thiomáint ag Codex le comhthéacs táirge agus eagraíochta. Ciallaíonn a chóras Cuimhne, atá ag foghlaim go leanúnach, go bhfeabhsaíonn sé le gach casadh freisin.

Gabháil scáileáin a thaispeánann úsáideoir ag iarraidh WAU ChatGPT ar 6 DFómh 2025 i gcomparáid le DevDay 2023. Tuairiscíonn an gníomhaire ≈800M WAU do 2025 agus ≈100M do 2023, le nótaí a thaispeánann athrú +700M agus méadú ~8×, agus comhthéacs míniúcháin ina dhiaidh sin.

Sa phost seo, míneoimid cén fáth a raibh gníomhaire sonraí AI saincheaptha de dhíth orainn, cad a dhéanann a chomhthéacs sonraí saibhrithe le cód agus a fhéinfhoghlaim chomh húsáideach sin, agus na ceachtanna a d’fhoghlaimíomar ar an mbealach.

Cén fáth a raibh uirlis shaincheaptha de dhíth orainn

Freastalaíonn ardán sonraí OpenAI ar níos mó ná 3.5k úsáideoir inmheánach atá ag obair ar fud na hInnealtóireachta, an Táirge agus an Taighde, agus níos mó ná 600 peitibheart de shonraí ar fud 70k tacar sonraí. Ag an scála sin, d’fhéadfadh sé gur ceann de na codanna is mó ama d’aon anailís é an tábla ceart a aimsiú.

Mar a chuir úsáideoir inmheánach amháin é:

“Tá a lán táblaí againn atá measartha cosúil lena chéile, agus caithim an-chuid ama ag iarraidh a dhéanamh amach conas atá siad difriúil agus cé acu ba chóir a úsáid. Áirítear úsáideoirí atá logáilte amach i gcuid acu, ní áirítear i gcuid eile. Tá forluí idir réimsí áirithe; tá sé deacair a rá cad é cad.”

Fiú agus na táblaí cearta roghnaithe, d’fhéadfadh sé a bheith dúshlánach torthaí cearta a tháirgeadh. Ní mór d’anailísithe réasúnaíocht a dhéanamh faoi shonraí táblaí agus faoi ghaolta idir táblaí chun a chinntiú go gcuirtear claochluithe agus scagairí i bhfeidhm i gceart. Is féidir le modhanna coitianta teipe—ceangail go leor le go leor, earráidí brú anuas scagaire, agus nullanna gan láimhseáil—torthaí a chur ó bhail go ciúin. Ag scála OpenAI, níor cheart d’anailísithe am a chur amú ag dífhabhtú séimeantaic SQL ná feidhmíocht ceisteanna: ba cheart a bhfócas a bheith ar mhéadrachtaí a shainiú, boinn tuisceana a bhailíochtú, agus cinntí atá bunaithe ar shonraí a dhéanamh.

Gabháil scáileáin de chód SQL a shainmhíníonn dhá CTE—order_enriched agus monthly_segment—a nascann sonraí tíreolaíochta custaiméirí, a dhíorthaíonn réimsí míosa ordaithe, agus a ríomhann comhiomláin mhíosúla amhail comhaireamh orduithe, ollioncam, ioncam le cáin, agus meánlaethanta ó sheoladh go fáil.

Tá 180+ líne sa ráiteas SQL seo. Níl sé éasca a fhios a bheith againn an bhfuilimid ag nascadh na dtáblaí cearta agus ag ceistiú na gcolún ceart.

Conas a oibríonn sé

Siúlfaimid anois tríd an ngníomhaire atá againn, an chaoi a gcoimeádann sé comhthéacs, agus an chaoi a bhfeabhsaíonn sé é féin.

Tá ár ngníomhaire faoi thiomáint ag GPT‑5.2 agus tá sé deartha chun réasúnaíocht a dhéanamh ar ardán sonraí OpenAI. Tá sé ar fáil cibé áit a n-oibríonn fostaithe cheana féin: mar ghníomhaire Slack, trí chomhéadan gréasáin, taobh istigh d’IDEanna, sa Codex CLI via MCP(osclaíonn i bhfuinneog nua), agus go díreach in aip inmheánach ChatGPT OpenAI trí nascóir MCP(osclaíonn i bhfuinneog nua).

Léaráid dar teideal “Conas a oibríonn an gníomhaire sonraí.” Cothaíonn pointí iontrála—Agent-UI, Local Agent-MCP, Remote Agent-MCP, agus Slack Agent—isteach in Agent-API. Nascann an API le heolas sonraí inmheánach agus comhthéacs cuideachta, sioncronaíonn sé le stóras sonraí agus foinsí ardáin, agus malartaíonn sé iarratais leis an tsamhail GPT-5.2 trí Agent-MCP.

Is féidir le húsáideoirí ceisteanna casta oscailte a chur a d’éileodh de ghnáth roinnt babhtaí iniúchta láimhe. Tóg an leid shamplach seo, a úsáideann tacar sonraí tástála: “Maidir le turais tacsaithe NYC, cé na péirí ZIP ó phiocadh suas go fágáil amach is neamhiontaofa, leis an mbearna is mó idir gnáth-amanna taistil agus na hamanna sa chás is measa, agus cathain a tharlaíonn an éagsúlacht sin?”

Láimhseálann an gníomhaire an anailís ó cheann ceann go ceann eile, ó thuiscint na ceiste go hiniúchadh na sonraí, reáchtáil ceisteanna, agus sintéisiú torthaí.

Gabháil scáileáin a thaispeánann úsáideoir ag fiafraí cé na péirí ZIP bailithe→seachadta tacsaí NYC is “neamhiontaofa” is mó. Míníonn an gníomhaire go n-úsáideann sé ~21k turas ó samples.nyctaxi.trips, sainmhíníonn sé gnáthchás (p50) i gcomparáid leis an gcás is measa (p95), cuireann sé scagairí i bhfeidhm, agus déanann sé cur síos ar an gcaoi a n-aithníonn sé cathain a tharla an turas is faide do gach péire ZIP.

Freagra an ghníomhaire ar an gceist.

Ceann de mhórchumais an ghníomhaire is ea an chaoi a ndéanann sé réasúnaíocht trí fhadhbanna. In ionad script sheasta a leanúint, déanann an gníomhaire a dhul chun cinn féin a mheas. Má bhreathnaíonn toradh idirmheánach mícheart (m.sh., má tá nialas sraitheanna ann de bharr ceangail nó scagaire mícheart), fiosraíonn an gníomhaire cad a chuaigh mícheart, coigeartaíonn sé a chur chuige, agus déanann iarracht eile. Le linn an phróisis seo, coimeádann sé an comhthéacs iomlán agus tugann sé an fhoghlaim leis ar aghaidh idir céimeanna. Aistríonn an próiseas lúb dúnta féinfhoghlama seo an t-atriall ón úsáideoir isteach sa ghníomhaire féin, rud a chumasaíonn torthaí níos tapúla agus anailísí ar chaighdeán níos airde go seasta ná sreafaí oibre láimhe.

Gabháil scáileáin de shreabhadh oibre tasc a thaispeánann plean céim ar chéim gníomhaire AI chun fadanna turais tacsaí NYC a anailísiú. Áirítear ann spriocanna, cuardaigh inmheánacha, iniúchadh scéime, blúirí cód, agus réasúnaíocht faoi leathadh p50/p95 a ríomh, péirí ZIP neamhiontaofa a aithint, agus ceisteanna SQL a phleanáil.

Réasúnaíocht an ghníomhaire chun na péirí bailithe–seachadta tacsaí NYC is neamhiontaofa a aithint.

Clúdaíonn an gníomhaire an sreabhadh iomlán anailíse: sonraí a aimsiú, SQL a rith, agus leabhair nótaí agus tuarascálacha a fhoilsiú. Tuigeann sé eolas inmheánach na cuideachta, is féidir leis cuardach gréasáin a dhéanamh ar fhaisnéis sheachtrach, agus feabhsaíonn sé le himeacht ama trí úsáid fhoghlamtha agus Cuimhne.

Is é an comhthéacs gach rud

Braitheann freagraí ardcháilíochta ar chomhthéacs saibhir, cruinn. Gan chomhthéacs, is féidir fiú le samhlacha láidre torthaí míchearta a tháirgeadh, amhail líon úsáideoirí a rómheastachán go mór nó téarmaíocht inmheánach a mhíthuiscint.

Gabháil scáileáin d’úsáideoir ag fiafraí, “Cad é an DAU logáilte isteach de ChatGPT Image Gen le 30 lá anuas?” le líne stádais thíos a thaispeánann go bhfuil an gníomhaire “Ag obair ar feadh 22n 41s,” ag léiriú go bhfuil ceist fhada á rith.

An gníomhaire gan Cuimhne, gan a bheith in ann ceistiú go héifeachtach.

Gabháil scáileáin a thaispeánann úsáideoir ag fiafraí, “Cad é an DAU logáilte isteach de ChatGPT Image Gen le 30 lá anuas?” Faoin teachtaireacht, deir líne stádais “D’oibrigh ar feadh 1n 22s,” ag léiriú go bhfuil an cheist fós ag rith agus go bhfuil sí ag glacadh i bhfad lena cur i gcrích.

Cuireann Cuimhne an ghníomhaire ceisteanna níos tapúla ar chumas trí na táblaí cearta a aimsiú.

Chun na modhanna teipe seo a sheachaint, tá an gníomhaire tógtha timpeall ar shraitheanna iomadúla comhthéacs a thugann bunús dó i sonraí OpenAI agus in eolas institiúideach.

Léaráid dar teideal “Sraitheanna comhthéacs an ghníomhaire sonraí” a thaispeánann sé shraith chruachta: 1) Úsáid Tábla, 2) Anótálacha Daonna, 3) Saibhriú Codex, 4) Eolas Institiúideach, 5) Cuimhne, agus 6) Comhthéacs Ama Rite. Feictear gach sraith mar bharra cothrománach i gcruth pirimide.

Sraith #1: Úsáid Tábla

  • Bunús meiteashonraí: Braitheann an gníomhaire ar mheiteashonraí scéime (ainmneacha colún agus cineálacha sonraí) chun eolas a chur ar scríobh SQL agus úsáideann sé líneáil táblaí (m.sh. gaolta táblaí réamhtheachtacha agus iartheachtacha) chun comhthéacs a thabhairt faoin gcaoi a mbaineann táblaí éagsúla lena chéile.
  • Tátal ceiste: Cabhraíonn ionghabháil ceisteanna stairiúla leis an ngníomhaire tuiscint a fháil ar conas a cheisteanna féin a scríobh agus cé na táblaí a cheanglaítear le chéile de ghnáth.

Sraith #2: Nótaí Daonna

  • Cur síos coimeádta ar tháblaí agus ar cholúin a sholáthraíonn saineolaithe fearainn, a ghabhann cuspóir, séimeantaic, brí ghnó, agus rabhadh aitheanta nach féidir a bhaint go héasca as scéimeanna ná as ceisteanna roimhe seo.

Ní leor meiteashonraí leo féin. Chun idirdhealú ceart a dhéanamh idir táblaí, ní mór duit tuiscint a fháil ar conas a cruthaíodh iad agus cén bunús atá leo.

Sraith #3: Saibhriú le Codex

  • Trí shainmhíniú tábla ar leibhéal an chóid a dhíorthú, tógann an gníomhaire tuiscint níos doimhne ar a bhfuil sna sonraí i ndáiríre. 
    • Soláthraíonn mionsonraí faoin méid a stóráiltear sa tábla agus faoin gcaoi a ndíorthaítear é ó imeacht anailíse faisnéis bhreise. Mar shampla, is féidir leis comhthéacs a thabhairt faoi uathúlacht luachanna, cé chomh minic a nuashonraítear sonraí an tábla, scóip na sonraí (m.sh. má fhágann an tábla réimsí áirithe ar lár, tá an leibhéal gráinneachta seo aige), srl.
  • Soláthraíonn sé seo comhthéacs úsáide feabhsaithe trí a thaispeáint conas a úsáidtear an tábla thar SQL i Spark, Python, agus i gcórais sonraí eile.
  • Ciallaíonn sé seo gur féidir leis an ngníomhaire idirdhealú a dhéanamh idir táblaí a bhreathnaíonn cosúil lena chéile ach atá éagsúil ar bhealaí criticiúla. Mar shampla, is féidir leis a rá an n-áiríonn tábla trácht ChatGPT céadpháirtí amháin. Déantar an comhthéacs seo a athnuachan go huathoibríoch freisin, ionas go bhfanann sé cothrom le dáta gan cothabháil láimhe.
Diagram titled “Codex-enriched knowledge pipeline.” Popular tables feed into multiple Codex tasks, which extract details from the OpenAI codebase, including a table’s purpose, grain and primary keys, downstream usage patterns, alternate table options, and data freshness.

Sraith #4: Eolas Institiúideach 

  • Is féidir leis an ngníomhaire rochtain a fháil ar Slack, Google Docs, agus Notion, a ghabhann comhthéacs criticiúil na cuideachta amhail seoltaí, teagmhais iontaofachta, ainmneacha cód inmheánacha agus uirlisí, agus na sainmhínithe canónacha agus an loighic ríofa do phríomh-mhéadrachtaí.
  • Déantar na cáipéisí seo a ionghabháil, a leabú, agus a stóráil le meiteashonraí agus ceadanna. Láimhseálann seirbhís aisghabhála rialú rochtana agus taisceadh ag am rite, rud a chuireann ar a chumas don ghníomhaire an fhaisnéis seo a tharraingt isteach go héifeachtúil agus go sábháilte.
Gabháil scáileáin d’úsáideoir ag fiafraí cén fáth ar thit úsáid chónascairí i mí na Nollag. Míníonn an gníomhaire gur tharla an titim mar gheall ar fhadhb logála a thosaigh ar 13 Samhain 2025, rud a d’fhág gur ró-íseal a comhaireadh úsáid i ndiaidh sheoladh ChatGPT 5.1. D’fhan teiliméadracht oidhreachta folamh go dtí gur tháinig imeacht níos nuaí chun bheith ina fhoinse fírinne.

Sraith #5: Cuimhne

  • Nuair a thugtar ceartúcháin don ghníomhaire nó nuair a aimsíonn sé mionsonraí faoi cheisteanna sonraí áirithe, is féidir leis na foghlamaí sin a shábháil don chéad uair eile, rud a ligeann dó feabhsú i gcónaí lena úsáideoirí. 
    • Mar thoradh air sin, tosaíonn freagraí amach anseo ó bhonnlíne níos cruinne seachas dul i ngleic leis na saincheisteanna céanna arís agus arís eile.
    • Is é cuspóir na Cuimhne ceartúcháin, scagairí agus srianta neamhshoiléire a choinneáil agus a athúsáid atá ríthábhachtach do chruinneas sonraí ach deacair a bhaint as na sraitheanna eile amháin. 
    • Mar shampla, i gcás amháin, ní raibh a fhios ag an ngníomhaire conas scagadh do thurgnamh anailíse ar leith (bhraith sé ar mheaitseáil le sreang ar leith a sainíodh i ngeata turgnaimh). Bhí Cuimhne fíorthábhachtach anseo chun a chinntiú go bhféadfadh sé scagadh i gceart, in ionad iarracht a dhéanamh meaitseáil doiléir a dhéanamh ar shreanga.
  • Nuair a thugann tú ceartúchán don ghníomhaire nó nuair a fhaigheann sé foghlaim ó do chomhrá, iarrfaidh sé ort an chuimhne sin a shábháil don chéad uair eile. 
    • Is féidir le húsáideoirí cuimhní a chruthú agus a chur in eagar de láimh freisin.
    • Tá cuimhní teoranta don leibhéal domhanda agus pearsanta, agus déanann uirlisiú an ghníomhaire éasca iad a chur in eagar.
Meirge fógra a thaispeánann “Tá gníomhaire sonraí ag iarraidh 2 fhoghlaim a shábháil i gCuimhne,” le mír lipéadaithe “Méadrachtaí Barrleibhéil ChatGPT” agus teachtaireacht deimhnithe ar dheis a léann “Sábháilte i gcuimhne dhomhanda” le tic ghlas.

Sraith #6: Comhthéacs Am Rite

  • Nuair nach bhfuil comhthéacs roimh ré ann do thábla nó nuair atá faisnéis atá ann sean, is féidir leis an ngníomhaire ceisteanna beo a eisiúint chuig an stóras sonraí chun an tábla a iniúchadh agus a cheistiú go díreach. Ligeann sé seo dó scéimeanna a bhailíochtú, na sonraí a thuiscint i bhfíor-am, agus freagairt dá réir.
  • Tá an gníomhaire in ann labhairt le córais eile an Ardáin Sonraí freisin (seirbhís meiteashonraí, Airflow, Spark) de réir mar is gá chun comhthéacs sonraí níos leithne a fháil atá ann taobh amuigh den stóras.

We run a daily offline pipeline that aggregates table usage, human annotations, and Codex-derived enrichment into a single, normalized representation. This enriched context is then converted into embeddings using the OpenAI embeddings API(osclaíonn i bhfuinneog nua) and stored for retrieval. At query time, the agent pulls only the most relevant embedded context via retrieval-augmented generation(osclaíonn i bhfuinneog nua) (RAG) instead of scanning raw metadata or logs. This makes table understanding fast and scalable, even across tens of thousands of tables, while keeping runtime latency predictable and low. Runtime queries are issued to our data warehouse live as needed.

Léaráid dar teideal “Aisghabháil comhthéacs sa ghníomhaire sonraí.” Cothaíonn sraitheanna réamhphróiseála as líne—úsáid táblaí, anótálacha daonna, saibhriú Codex, eolas institiúideach, agus Cuimhne—leabuithe RAG. Taispeánann aisghabháil bheo an gníomhaire ag ceistiú bunachair sonraí trí chuardach séimeantach nó aisghabháil téacs bheacht chun comhthéacs ama rite a tháirgeadh.

Together, these layers ensure the agent’s reasoning is grounded in OpenAI’s data, code, and institutional knowledge, dramatically reducing errors and improving answer quality.

Built to think and work like a teammate

One-shot answers work when the problem is clear, but most questions aren’t. More often, arriving at the correct result requires back-and-forth refinement and some course correction.

The agent is built to behave like a teammate you can reason with. It’s a conversational, always-on and handles both quick answers and iterative exploration.

It carries over complete context across turns, so users can ask follow-up questions, adjust their intent, or change direction without restating everything. If the agent starts heading down the wrong path, users can interrupt mid-analysis and redirect it, just like working with a human collaborator who listens instead of plowing ahead.

When instructions are unclear or incomplete, the agent proactively asks clarifying questions. If no response is provided, it applies sensible defaults to make progress. For example, if a user asks about business growth with no date range specified, it may assume the last seven or 30 days. These priors allow it to stay responsive and non-blocking while still converging on the right outcome.

The result is an agent that works well both when you know exactly what you want (e.g., “Tell me about this table”) and just as strong when you’re exploring (e.g., “I’m seeing a dip here, can we break this down by customer type and timeframe?”). 

After rollout, we observed that users frequently ran the same analyses for routine repetitive work. To expedite this, the agent's workflows package recurring analyses into reusable instruction sets. Examples include workflows for weekly business reports and table validations. By encoding context and best practices once, workflows streamline repeat analyses and ensure consistent results across users.

Barra ionchuir UI leis an téacs áitritheora “Cuir ceist sonraí.” Faoi bhun tá cnaipe lipéadaithe “Úsáid sreabhadh oibre,” agus ar dheis tá deilbhíní micreafóin agus seolta. Tá coirnéil chruinne ar an mbarra agus tá sé suite i gcoinne cúlra dorcha.

Moving fast without breaking trust

Building an always-on, evolving agent means quality can drift just as easily as it can improve. Without a tight feedback loop, regressions are inevitable and invisible. The only way to scale capability without breaking trust is through systematic evaluation.

In this section, we’ll discuss how we leverage OpenAI’s Evals API(osclaíonn i bhfuinneog nua) to measure and protect the agent’s response quality.

Its Evals are built on curated sets of question-answer pairs. Each question targets an important metric or analytical pattern we care deeply about getting right, paired with a manually authored “golden” SQL query that produces the expected result. For each eval, we send the natural language question to its query-generation endpoint, execute the generated SQL, and compare the output against the result of the expected SQL.

Léaráid dar teideal “Píblíne meastóireachta an ghníomhaire sonraí.” Téann péirí ceisteanna agus freagraí meastóireachta le SQL ionchais isteach i gcéim ghiniúna a tháirgeann SQL agus torthaí. Déanann OpenAI Evals comparáid idir torthaí ginte agus torthaí ionchais ag úsáid comparáide dataframe agus SQL, agus as sin tagann scór agus réasúnaíocht.

Evaluation doesn’t rely on naive string matching. Generated SQL can differ syntactically while still being correct, and result sets may include extra columns that don’t materially affect the answer. To account for this, we compare both the SQL and the resulting data, and feed these signals into OpenAI’s Evals grader. The grader produces a final score along with an explanation, capturing both correctness and acceptable variation.

These evals are like unit tests that run continuously during development to identify regressions as canaries in production; this allows us to catch issues early and confidently iterate as the agent's capabilities expand.

Agent security

Our agent plugs directly into OpenAI’s existing security and access-control model. It operates purely as an interface layer, inheriting and enforcing the same permissions and guardrails that govern OpenAI’s data. 

All of the agent’s access is strictly pass-through, meaning users can only query tables they already have permission to access. When access is missing, it flags this or falls back to alternative datasets the user is authorized to use.

Finally, it's built for transparency. Like any system, it can make mistakes. It exposes its reasoning process by summarizing assumptions and execution steps alongside each answer. When queries are executed, it links directly to the underlying results, allowing users to inspect raw data and verify every step of the analysis.

Lessons learned

Building our agent from scratch surfaced practical lessons about how agents behave, where they struggle, and what actually makes them reliable at scale.

Lesson #1: Less is More

Early on, we exposed our full tool set to the agent, and quickly ran into problems with overlapping functionality. While this redundancy can be helpful for specific custom cases and is more obvious to a human when manually invoking, it’s confusing to agents. To reduce ambiguity and improve reliability, we restricted and consolidated certain tool calls.

Lesson #2: Guide the Goal, Not the Path

We also discovered that highly prescriptive prompting degraded results. While many questions share a general analytical shape, the details vary enough that rigid instructions often pushed the agent down incorrect paths. By shifting to higher-level guidance and relying on GPT‑5’s reasoning to choose the appropriate execution path, the agent became more robust and produced better results.

Lesson #3: Meaning Lives in Code

Schemas and query history describe a table’s shape and usage, but its true meaning lives in the code that produces it. Pipeline logic captures assumptions, freshness guarantees, and business intent that never surface in SQL or metadata. By crawling the codebase with Codex, our agent understands how datasets are actually constructed and is able to better reason about what each table actually contains. It can answer “what’s in here” and “when can I use it” far more accurately than from warehouse signals alone. 

Same vision, new tools

We’re constantly working to improve our agent by increasing its ability to handle ambiguous questions, improving its reliability and accuracy with stronger validations, and integrating it more deeply into workflows. We believe it should blend naturally into how people already work, instead of functioning like a separate tool.

While our tooling will keep benefiting from underlying improvements in agent reasoning, validation, and self-correction, our team’s mission remains the same: seamlessly deliver fast, trustworthy data analysis across OpenAI’s data ecosystem.

Údar

Bonnie Xu, Aravind Suresh, Emma Tang

Buíochais

Buíochas speisialta leis na foirne Táirgiúlachta Sonraí agus Eolaíochta Sonraí, chomh maith lenár n-iliomad úsáideoirí trasfheidhmeacha as a gcuid turgnamh agus aiseolais.