Taobh istigh de ghníomhaire sonraí intí OpenAI
Le Bonnie Xu, Aravind Suresh, agus Emma Tang
Cumhachtaíonn sonraí an chaoi a bhfoghlaimíonn córais, a dtagann táirgí chun cinn, agus a ndéanann cuideachtaí cinntí. Ach is minic atá sé níos deacra ná mar ba chóir freagraí a fháil go tapa, i gceart, agus leis an gcomhthéacs ceart. Chun é seo a dhéanamh níos éasca de réir mar a fhásann OpenAI, thógamar ár ngníomhaire sonraí AI saincheaptha intí féin a dhéanann iniúchadh ar ár n-ardán féin agus a dhéanann réasúnaíocht air.
Uirlis shaincheaptha inmheánach amháin atá inár ngníomhaire (ní tairiscint sheachtrach é), tógtha go sonrach timpeall ar shonraí, cheadanna agus shreafaí oibre OpenAI. Táimid ag taispeáint mar ar thógamar é agus mar a úsáidimid é chun samplaí a thabhairt de na bealaí fíora, tionchair a bhféadann AI tacú le hobair laethúil ar fud ár bhfoirne. Is iad na huirlisí OpenAI a d’úsáideamar chun é a thógáil agus a rith (Codex, ár samhail shuaitheanta GPT‑5, an Evals API(osclaíonn i bhfuinneog nua), agus an Embeddings API(osclaíonn i bhfuinneog nua)) na huirlisí céanna a chuirimid ar fáil d’fhorbróirí i ngach áit.
Ligeann ár ngníomhaire sonraí d’fhostaithe dul ó cheist go léargas i gceann cúpla nóiméad, ní laethanta. Laghdaíonn sé seo an tairseach chun sonraí agus anailís mhionchúiseach a tharraingt ar fud gach feidhme, ní hamháin ag ár bhfoireann sonraí. Inniu, bíonn foirne ar fud na hInnealtóireachta, na hEolaíochta Sonraí, an Chuir ar an Margadh, an Airgeadais agus an Taighde ag OpenAI ag brath ar an ngníomhaire chun ceisteanna sonraí ardtionchair a fhreagairt. Mar shampla, is féidir leis cabhrú le freagairt conas seoltaí a mheas agus sláinte an ghnó a thuiscint, trí fhormáid iomasach na teanga nádúrtha. Comhcheanglaíonn an gníomhaire eolas tábla ar leibhéal an tábla faoi thiomáint ag Codex le comhthéacs táirge agus eagraíochta. Ciallaíonn a chóras Cuimhne, atá ag foghlaim go leanúnach, go bhfeabhsaíonn sé le gach casadh freisin.

Sa phost seo, míneoimid cén fáth a raibh gníomhaire sonraí AI saincheaptha de dhíth orainn, cad a dhéanann a chomhthéacs sonraí saibhrithe le cód agus a fhéinfhoghlaim chomh húsáideach sin, agus na ceachtanna a d’fhoghlaimíomar ar an mbealach.
Freastalaíonn ardán sonraí OpenAI ar níos mó ná 3.5k úsáideoir inmheánach atá ag obair ar fud na hInnealtóireachta, an Táirge agus an Taighde, agus níos mó ná 600 peitibheart de shonraí ar fud 70k tacar sonraí. Ag an scála sin, d’fhéadfadh sé gur ceann de na codanna is mó ama d’aon anailís é an tábla ceart a aimsiú.
Mar a chuir úsáideoir inmheánach amháin é:
“Tá a lán táblaí againn atá measartha cosúil lena chéile, agus caithim an-chuid ama ag iarraidh a dhéanamh amach conas atá siad difriúil agus cé acu ba chóir a úsáid. Áirítear úsáideoirí atá logáilte amach i gcuid acu, ní áirítear i gcuid eile. Tá forluí idir réimsí áirithe; tá sé deacair a rá cad é cad.”
Fiú agus na táblaí cearta roghnaithe, d’fhéadfadh sé a bheith dúshlánach torthaí cearta a tháirgeadh. Ní mór d’anailísithe réasúnaíocht a dhéanamh faoi shonraí táblaí agus faoi ghaolta idir táblaí chun a chinntiú go gcuirtear claochluithe agus scagairí i bhfeidhm i gceart. Is féidir le modhanna coitianta teipe—ceangail go leor le go leor, earráidí brú anuas scagaire, agus nullanna gan láimhseáil—torthaí a chur ó bhail go ciúin. Ag scála OpenAI, níor cheart d’anailísithe am a chur amú ag dífhabhtú séimeantaic SQL ná feidhmíocht ceisteanna: ba cheart a bhfócas a bheith ar mhéadrachtaí a shainiú, boinn tuisceana a bhailíochtú, agus cinntí atá bunaithe ar shonraí a dhéanamh.

Tá 180+ líne sa ráiteas SQL seo. Níl sé éasca a fhios a bheith againn an bhfuilimid ag nascadh na dtáblaí cearta agus ag ceistiú na gcolún ceart.
Siúlfaimid anois tríd an ngníomhaire atá againn, an chaoi a gcoimeádann sé comhthéacs, agus an chaoi a bhfeabhsaíonn sé é féin.
Tá ár ngníomhaire faoi thiomáint ag GPT‑5.2 agus tá sé deartha chun réasúnaíocht a dhéanamh ar ardán sonraí OpenAI. Tá sé ar fáil cibé áit a n-oibríonn fostaithe cheana féin: mar ghníomhaire Slack, trí chomhéadan gréasáin, taobh istigh d’IDEanna, sa Codex CLI via MCP(osclaíonn i bhfuinneog nua), agus go díreach in aip inmheánach ChatGPT OpenAI trí nascóir MCP(osclaíonn i bhfuinneog nua).
Is féidir le húsáideoirí ceisteanna casta oscailte a chur a d’éileodh de ghnáth roinnt babhtaí iniúchta láimhe. Tóg an leid shamplach seo, a úsáideann tacar sonraí tástála: “Maidir le turais tacsaithe NYC, cé na péirí ZIP ó phiocadh suas go fágáil amach is neamhiontaofa, leis an mbearna is mó idir gnáth-amanna taistil agus na hamanna sa chás is measa, agus cathain a tharlaíonn an éagsúlacht sin?”
Láimhseálann an gníomhaire an anailís ó cheann ceann go ceann eile, ó thuiscint na ceiste go hiniúchadh na sonraí, reáchtáil ceisteanna, agus sintéisiú torthaí.

Freagra an ghníomhaire ar an gceist.
Ceann de mhórchumais an ghníomhaire is ea an chaoi a ndéanann sé réasúnaíocht trí fhadhbanna. In ionad script sheasta a leanúint, déanann an gníomhaire a dhul chun cinn féin a mheas. Má bhreathnaíonn toradh idirmheánach mícheart (m.sh., má tá nialas sraitheanna ann de bharr ceangail nó scagaire mícheart), fiosraíonn an gníomhaire cad a chuaigh mícheart, coigeartaíonn sé a chur chuige, agus déanann iarracht eile. Le linn an phróisis seo, coimeádann sé an comhthéacs iomlán agus tugann sé an fhoghlaim leis ar aghaidh idir céimeanna. Aistríonn an próiseas lúb dúnta féinfhoghlama seo an t-atriall ón úsáideoir isteach sa ghníomhaire féin, rud a chumasaíonn torthaí níos tapúla agus anailísí ar chaighdeán níos airde go seasta ná sreafaí oibre láimhe.

Réasúnaíocht an ghníomhaire chun na péirí bailithe–seachadta tacsaí NYC is neamhiontaofa a aithint.
Clúdaíonn an gníomhaire an sreabhadh iomlán anailíse: sonraí a aimsiú, SQL a rith, agus leabhair nótaí agus tuarascálacha a fhoilsiú. Tuigeann sé eolas inmheánach na cuideachta, is féidir leis cuardach gréasáin a dhéanamh ar fhaisnéis sheachtrach, agus feabhsaíonn sé le himeacht ama trí úsáid fhoghlamtha agus Cuimhne.
Braitheann freagraí ardcháilíochta ar chomhthéacs saibhir, cruinn. Gan chomhthéacs, is féidir fiú le samhlacha láidre torthaí míchearta a tháirgeadh, amhail líon úsáideoirí a rómheastachán go mór nó téarmaíocht inmheánach a mhíthuiscint.

An gníomhaire gan Cuimhne, gan a bheith in ann ceistiú go héifeachtach.

Cuireann Cuimhne an ghníomhaire ceisteanna níos tapúla ar chumas trí na táblaí cearta a aimsiú.
Chun na modhanna teipe seo a sheachaint, tá an gníomhaire tógtha timpeall ar shraitheanna iomadúla comhthéacs a thugann bunús dó i sonraí OpenAI agus in eolas institiúideach.
- Bunús meiteashonraí: Braitheann an gníomhaire ar mheiteashonraí scéime (ainmneacha colún agus cineálacha sonraí) chun eolas a chur ar scríobh SQL agus úsáideann sé líneáil táblaí (m.sh. gaolta táblaí réamhtheachtacha agus iartheachtacha) chun comhthéacs a thabhairt faoin gcaoi a mbaineann táblaí éagsúla lena chéile.
- Tátal ceiste: Cabhraíonn ionghabháil ceisteanna stairiúla leis an ngníomhaire tuiscint a fháil ar conas a cheisteanna féin a scríobh agus cé na táblaí a cheanglaítear le chéile de ghnáth.
- Cur síos coimeádta ar tháblaí agus ar cholúin a sholáthraíonn saineolaithe fearainn, a ghabhann cuspóir, séimeantaic, brí ghnó, agus rabhadh aitheanta nach féidir a bhaint go héasca as scéimeanna ná as ceisteanna roimhe seo.
Ní leor meiteashonraí leo féin. Chun idirdhealú ceart a dhéanamh idir táblaí, ní mór duit tuiscint a fháil ar conas a cruthaíodh iad agus cén bunús atá leo.
- Trí shainmhíniú tábla ar leibhéal an chóid a dhíorthú, tógann an gníomhaire tuiscint níos doimhne ar a bhfuil sna sonraí i ndáiríre.
- Soláthraíonn mionsonraí faoin méid a stóráiltear sa tábla agus faoin gcaoi a ndíorthaítear é ó imeacht anailíse faisnéis bhreise. Mar shampla, is féidir leis comhthéacs a thabhairt faoi uathúlacht luachanna, cé chomh minic a nuashonraítear sonraí an tábla, scóip na sonraí (m.sh. má fhágann an tábla réimsí áirithe ar lár, tá an leibhéal gráinneachta seo aige), srl.
- Soláthraíonn sé seo comhthéacs úsáide feabhsaithe trí a thaispeáint conas a úsáidtear an tábla thar SQL i Spark, Python, agus i gcórais sonraí eile.
- Ciallaíonn sé seo gur féidir leis an ngníomhaire idirdhealú a dhéanamh idir táblaí a bhreathnaíonn cosúil lena chéile ach atá éagsúil ar bhealaí criticiúla. Mar shampla, is féidir leis a rá an n-áiríonn tábla trácht ChatGPT céadpháirtí amháin. Déantar an comhthéacs seo a athnuachan go huathoibríoch freisin, ionas go bhfanann sé cothrom le dáta gan cothabháil láimhe.
- Is féidir leis an ngníomhaire rochtain a fháil ar Slack, Google Docs, agus Notion, a ghabhann comhthéacs criticiúil na cuideachta amhail seoltaí, teagmhais iontaofachta, ainmneacha cód inmheánacha agus uirlisí, agus na sainmhínithe canónacha agus an loighic ríofa do phríomh-mhéadrachtaí.
- Déantar na cáipéisí seo a ionghabháil, a leabú, agus a stóráil le meiteashonraí agus ceadanna. Láimhseálann seirbhís aisghabhála rialú rochtana agus taisceadh ag am rite, rud a chuireann ar a chumas don ghníomhaire an fhaisnéis seo a tharraingt isteach go héifeachtúil agus go sábháilte.

- Nuair a thugtar ceartúcháin don ghníomhaire nó nuair a aimsíonn sé mionsonraí faoi cheisteanna sonraí áirithe, is féidir leis na foghlamaí sin a shábháil don chéad uair eile, rud a ligeann dó feabhsú i gcónaí lena úsáideoirí.
- Mar thoradh air sin, tosaíonn freagraí amach anseo ó bhonnlíne níos cruinne seachas dul i ngleic leis na saincheisteanna céanna arís agus arís eile.
- Is é cuspóir na Cuimhne ceartúcháin, scagairí agus srianta neamhshoiléire a choinneáil agus a athúsáid atá ríthábhachtach do chruinneas sonraí ach deacair a bhaint as na sraitheanna eile amháin.
- Mar shampla, i gcás amháin, ní raibh a fhios ag an ngníomhaire conas scagadh do thurgnamh anailíse ar leith (bhraith sé ar mheaitseáil le sreang ar leith a sainíodh i ngeata turgnaimh). Bhí Cuimhne fíorthábhachtach anseo chun a chinntiú go bhféadfadh sé scagadh i gceart, in ionad iarracht a dhéanamh meaitseáil doiléir a dhéanamh ar shreanga.
- Nuair a thugann tú ceartúchán don ghníomhaire nó nuair a fhaigheann sé foghlaim ó do chomhrá, iarrfaidh sé ort an chuimhne sin a shábháil don chéad uair eile.
- Is féidir le húsáideoirí cuimhní a chruthú agus a chur in eagar de láimh freisin.
- Tá cuimhní teoranta don leibhéal domhanda agus pearsanta, agus déanann uirlisiú an ghníomhaire éasca iad a chur in eagar.

- Nuair nach bhfuil comhthéacs roimh ré ann do thábla nó nuair atá faisnéis atá ann sean, is féidir leis an ngníomhaire ceisteanna beo a eisiúint chuig an stóras sonraí chun an tábla a iniúchadh agus a cheistiú go díreach. Ligeann sé seo dó scéimeanna a bhailíochtú, na sonraí a thuiscint i bhfíor-am, agus freagairt dá réir.
- Tá an gníomhaire in ann labhairt le córais eile an Ardáin Sonraí freisin (seirbhís meiteashonraí, Airflow, Spark) de réir mar is gá chun comhthéacs sonraí níos leithne a fháil atá ann taobh amuigh den stóras.
We run a daily offline pipeline that aggregates table usage, human annotations, and Codex-derived enrichment into a single, normalized representation. This enriched context is then converted into embeddings using the OpenAI embeddings API(osclaíonn i bhfuinneog nua) and stored for retrieval. At query time, the agent pulls only the most relevant embedded context via retrieval-augmented generation(osclaíonn i bhfuinneog nua) (RAG) instead of scanning raw metadata or logs. This makes table understanding fast and scalable, even across tens of thousands of tables, while keeping runtime latency predictable and low. Runtime queries are issued to our data warehouse live as needed.
Together, these layers ensure the agent’s reasoning is grounded in OpenAI’s data, code, and institutional knowledge, dramatically reducing errors and improving answer quality.
One-shot answers work when the problem is clear, but most questions aren’t. More often, arriving at the correct result requires back-and-forth refinement and some course correction.
The agent is built to behave like a teammate you can reason with. It’s a conversational, always-on and handles both quick answers and iterative exploration.
It carries over complete context across turns, so users can ask follow-up questions, adjust their intent, or change direction without restating everything. If the agent starts heading down the wrong path, users can interrupt mid-analysis and redirect it, just like working with a human collaborator who listens instead of plowing ahead.
When instructions are unclear or incomplete, the agent proactively asks clarifying questions. If no response is provided, it applies sensible defaults to make progress. For example, if a user asks about business growth with no date range specified, it may assume the last seven or 30 days. These priors allow it to stay responsive and non-blocking while still converging on the right outcome.
The result is an agent that works well both when you know exactly what you want (e.g., “Tell me about this table”) and just as strong when you’re exploring (e.g., “I’m seeing a dip here, can we break this down by customer type and timeframe?”).
After rollout, we observed that users frequently ran the same analyses for routine repetitive work. To expedite this, the agent's workflows package recurring analyses into reusable instruction sets. Examples include workflows for weekly business reports and table validations. By encoding context and best practices once, workflows streamline repeat analyses and ensure consistent results across users.

Building an always-on, evolving agent means quality can drift just as easily as it can improve. Without a tight feedback loop, regressions are inevitable and invisible. The only way to scale capability without breaking trust is through systematic evaluation.
In this section, we’ll discuss how we leverage OpenAI’s Evals API(osclaíonn i bhfuinneog nua) to measure and protect the agent’s response quality.
Its Evals are built on curated sets of question-answer pairs. Each question targets an important metric or analytical pattern we care deeply about getting right, paired with a manually authored “golden” SQL query that produces the expected result. For each eval, we send the natural language question to its query-generation endpoint, execute the generated SQL, and compare the output against the result of the expected SQL.
Evaluation doesn’t rely on naive string matching. Generated SQL can differ syntactically while still being correct, and result sets may include extra columns that don’t materially affect the answer. To account for this, we compare both the SQL and the resulting data, and feed these signals into OpenAI’s Evals grader. The grader produces a final score along with an explanation, capturing both correctness and acceptable variation.
These evals are like unit tests that run continuously during development to identify regressions as canaries in production; this allows us to catch issues early and confidently iterate as the agent's capabilities expand.
Our agent plugs directly into OpenAI’s existing security and access-control model. It operates purely as an interface layer, inheriting and enforcing the same permissions and guardrails that govern OpenAI’s data.
All of the agent’s access is strictly pass-through, meaning users can only query tables they already have permission to access. When access is missing, it flags this or falls back to alternative datasets the user is authorized to use.
Finally, it's built for transparency. Like any system, it can make mistakes. It exposes its reasoning process by summarizing assumptions and execution steps alongside each answer. When queries are executed, it links directly to the underlying results, allowing users to inspect raw data and verify every step of the analysis.
Building our agent from scratch surfaced practical lessons about how agents behave, where they struggle, and what actually makes them reliable at scale.
Early on, we exposed our full tool set to the agent, and quickly ran into problems with overlapping functionality. While this redundancy can be helpful for specific custom cases and is more obvious to a human when manually invoking, it’s confusing to agents. To reduce ambiguity and improve reliability, we restricted and consolidated certain tool calls.
We also discovered that highly prescriptive prompting degraded results. While many questions share a general analytical shape, the details vary enough that rigid instructions often pushed the agent down incorrect paths. By shifting to higher-level guidance and relying on GPT‑5’s reasoning to choose the appropriate execution path, the agent became more robust and produced better results.
Schemas and query history describe a table’s shape and usage, but its true meaning lives in the code that produces it. Pipeline logic captures assumptions, freshness guarantees, and business intent that never surface in SQL or metadata. By crawling the codebase with Codex, our agent understands how datasets are actually constructed and is able to better reason about what each table actually contains. It can answer “what’s in here” and “when can I use it” far more accurately than from warehouse signals alone.
We’re constantly working to improve our agent by increasing its ability to handle ambiguous questions, improving its reliability and accuracy with stronger validations, and integrating it more deeply into workflows. We believe it should blend naturally into how people already work, instead of functioning like a separate tool.
While our tooling will keep benefiting from underlying improvements in agent reasoning, validation, and self-correction, our team’s mission remains the same: seamlessly deliver fast, trustworthy data analysis across OpenAI’s data ecosystem.
Údar
Buíochais
Buíochas speisialta leis na foirne Táirgiúlachta Sonraí agus Eolaíochta Sonraí, chomh maith lenár n-iliomad úsáideoirí trasfheidhmeacha as a gcuid turgnamh agus aiseolais.


