ప్రధాన కంటెంట్‌కి దాటండి
OpenAI

29 జనవరి, 2026

ఇంజనీరింగ్

OpenAI యొక్క ఇన్-హౌస్ డేటా ఏజెంట్ లోపల

బోనీ జు, అరవింద్ సురేష్ మరియు ఎమ్మా టాంగ్ ద్వారా

లోడ్ అవుతోంది…

వ్యవస్థలు ఎలా నేర్చుకుంటాయో, ఉత్పత్తులు ఎలా అభివృద్ధి చెందుతాయో మరియు కంపెనీలు ఎలా ఎంపికలు చేసుకుంటాయో డేటా శక్తివంతం చేస్తుంది. కానీ త్వరగా, సరిగ్గా మరియు సరైన సందర్భంతో సమాధానాలు పొందడం తరచుగా ఉండాల్సిన దానికంటే కష్టం. OpenAI స్కేల్స్‌గా దీన్ని సులభతరం చేయడానికి, మేము మా స్వంత ప్లాట్‌ఫామ్‌పై అన్వేషించే మరియు కారణాలను వివరించే మా స్వంత బెస్పోక్ ఇన్-హౌస్ AI డేటా ఏజెంట్‌ను నిర్మించాము.

మా ఏజెంట్ అనేది OpenAI యొక్క డేటా, అనుమతులు మరియు వర్క్‌ఫ్లోల చుట్టూ ప్రత్యేకంగా రూపొందించబడిన కస్టమ్ అంతర్గత-మాత్రమే సాధనం (బాహ్య సమర్పణ కాదు). మా బృందాలలో రోజువారీ పనికి AI మద్దతు ఇవ్వగల నిజమైన, ప్రభావవంతమైన మార్గాల ఉపరితల ఉదాహరణలకు సహాయపడటానికి మేము దానిని ఎలా నిర్మించాము మరియు ఉపయోగించామో చూపిస్తున్నాము. మేము దీన్ని నిర్మించడానికి మరియు అమలు చేయడానికి ఉపయోగించిన OpenAI సాధనాలు (Codex, మా GPT‑5 ఫ్లాగ్‌షిప్ మోడల్, Evals API(కొత్త విండోలో తెరుచుకుంటుంది) మరియు ఎంబెడ్డింగ్స్ API(కొత్త విండోలో తెరుచుకుంటుంది)) మేము ప్రతిచోటా డెవలపర్‌లకు అందుబాటులో ఉంచే సాధనాలే.

మా డేటా ఏజెంట్ ఉద్యోగులను రోజుల్లో కాదు, నిమిషాల్లో ప్రశ్న నుండి అంతర్దృష్టికి వెళ్ళేలా చేస్తుంది. ఇది మా డేటా బృందం ద్వారానే కాకుండా అన్ని ఫంక్షన్లలో డేటా మరియు సూక్ష్మ విశ్లేషణను లాగడానికి బార్‌ను తగ్గిస్తుంది. నేడు, OpenAI లోని ఇంజనీరింగ్, డేటా సైన్స్, గో-టు-మార్కెట్, ఫైనాన్స్ మరియు పరిశోధన బృందాలు అధిక-ప్రభావ డేటా ప్రశ్నలకు సమాధానం ఇవ్వడానికి ఏజెంట్‌పై ఆధారపడతాయి. ఉదాహరణకు, సహజ భాష యొక్క సహజమైన ఆకృతి ద్వారా లాంచ్‌లను ఎలా మూల్యాంకనం చేయాలి మరియు వ్యాపార ఆరోగ్యాన్ని ఎలా అర్థం చేసుకోవాలి అనేదానికి సమాధానం ఇవ్వడానికి ఇది సహాయపడుతుంది. ఈ ఏజెంట్ Codex-ఆధారిత టేబుల్-స్థాయి జ్ఞానాన్ని ఉత్పత్తి మరియు సంస్థాగత సందర్భంతో మిళితం చేస్తాడు. దీని నిరంతరం నేర్చుకునే జ్ఞాపకశక్తి వ్యవస్థ అంటే ప్రతి మలుపుతోనూ ఇది మెరుగుపడుతుంది.

DevDay 2023 తో పోలిస్తే అక్టోబర్ 6, 2025న ChatGPT WAU కోసం అడుగుతున్న వినియోగదారుని చూపిస్తున్న స్క్రీన్‌షాట్. ఏజెంట్ 2025 కి ≈800M WAU మరియు 2023 కి ≈100M ని నివేదిస్తున్నారు, గమనికలు +700M మార్పు మరియు ~8× పెరుగుదలను చూపుతున్నాయి, తరువాత వివరణాత్మక సందర్భం ఉంది.

ఈ పోస్ట్‌లో, మనకు అనుకూలీకరించిన AI డేటా ఏజెంట్ ఎందుకు అవసరమో, దాని కోడ్-సుసంపన్నమైన డేటా సందర్భం మరియు స్వీయ-అభ్యాసాన్ని ఎందుకు ఉపయోగకరంగా చేస్తుంది మరియు ఆ మార్గంలో మనం నేర్చుకున్న పాఠాలను వివరిస్తాము.

మనకు కస్టమ్ సాధనం ఎందుకు అవసరం

OpenAI యొక్క డేటా ప్లాట్‌ఫామ్ ఇంజనీరింగ్, ఉత్పత్తి మరియు పరిశోధనలలో పనిచేస్తున్న 3.5k కంటే ఎక్కువ అంతర్గత వినియోగదారులకు సేవలు అందిస్తుంది, 70k డేటాసెట్‌లలో 600 పెటాబైట్‌లకు పైగా డేటాను విస్తరించి ఉంది. ఆ పరిమాణంలో, సరైన పట్టికను కనుగొనడం అనేది విశ్లేషణ చేయడంలో ఎక్కువ సమయం తీసుకునే భాగాలలో ఒకటి కావచ్చు.

ఒక అంతర్గత వినియోగదారు చెప్పినట్లుగా:

[[ఇండెంట్]]“మా దగ్గర చాలా సారూప్యమైన పట్టికలు ఉన్నాయి మరియు అవి ఎలా భిన్నంగా ఉన్నాయో మరియు దేనిని ఉపయోగించాలో తెలుసుకోవడానికి నేను టన్నుల కొద్దీ సమయాన్ని వెచ్చిస్తాను. కొన్నింటిలో లాగ్-అవుట్ చేసిన వినియోగదారులు ఉన్నారు, మరికొన్నింటిలో లాగ్-అవుట్ చేయరు. కొన్నింటికి అతివ్యాప్తి చెందుతున్న ఫీల్డ్‌లు ఉన్నాయి; ఏది ఏమిటో చెప్పడం కష్టం.”

సరైన పట్టికలను ఎంచుకున్నప్పటికీ, సరైన ఫలితాలను ఉత్పత్తి చేయడం సవాలుగా ఉంటుంది. పరివర్తనలు మరియు ఫిల్టర్‌లు సరిగ్గా వర్తింపజేయబడతాయని నిర్ధారించుకోవడానికి విశ్లేషకులు టేబుల్ డేటా మరియు టేబుల్ సంబంధాల గురించి తర్కించుకోవాలి. సాధారణ వైఫల్య మోడ్‌లు—చాలా నుండి చాలా వరకు జాయిన్‌లు, ఫిల్టర్ పుష్‌డౌన్ ఎర్రర్‌లు మరియు హ్యాండిల్ చేయని శూన్యాలు—ఫలితాలను నిశ్శబ్దంగా చెల్లనివిగా చేస్తాయి. OpenAI స్థాయిలో, విశ్లేషకులు SQL సెమాంటిక్స్ లేదా ప్రశ్న పనితీరును డీబగ్ చేయడానికి సమయం కేటాయించాల్సిన అవసరం లేదు: వారి దృష్టి కొలమానాలను నిర్వచించడం, అంచనాలను ధృవీకరించడం మరియు డేటా ఆధారిత నిర్ణయాలు తీసుకోవడంపై ఉండాలి.

కస్టమర్ భౌగోళిక డేటాను చేరే, ఆర్డర్-నెల ఫీల్డ్‌లను పొందే మరియు ఆర్డర్ గణనలు, స్థూల ఆదాయం, పన్నుతో ఆదాయం మరియు సగటు షిప్-టు-రిసీప్ట్ రోజులు వంటి నెలవారీ అగ్రిగేట్‌లను గణించే రెండు CTEలను—ఆర్డర్_ఎన్రిచ్డ్ మరియు మంత్లీ_సెగ్మెంట్—నిర్వచించే SQL కోడ్ యొక్క స్క్రీన్‌షాట్.

ఈ SQL స్టేట్‌మెంట్ 180+ లైన్ల పొడవు ఉంది. మనం సరైన పట్టికలను కలుపుతున్నామా మరియు సరైన నిలువు వరుసలను ప్రశ్నిస్తున్నామా అని తెలుసుకోవడం అంత సులభం కాదు.

ఇది ఎలా పనిచేస్తుంది

మన ఏజెంట్ ఎవరు, అతను సందర్భాన్ని ఎలా క్యూరేట్ చేస్తాడు మరియు అతను ఎలా స్వీయ-మెరుగుదల సాధిస్తూ ఉంటాడో చూద్దాం.

మా ఏజెంట్ GPT‑5.2 ద్వారా ఆధారితమైనది మరియు OpenAI యొక్క డేటా ప్లాట్‌ఫారమ్‌పై తర్కించటానికి రూపొందించబడింది. ఇది ఉద్యోగులు ఇప్పటికే పనిచేస్తున్న ప్రతిచోటా అందుబాటులో ఉంటుంది: స్లాక్ ఏజెంట్‌గా, వెబ్ ఇంటర్‌ఫేస్ ద్వారా, IDEల లోపల, MCP ద్వారా Codex CLI(కొత్త విండోలో తెరుచుకుంటుంది)లో మరియు MCP కనెక్టర్ ద్వారా నేరుగా OpenAI యొక్క అంతర్గత ChatGPT యాప్‌లో(కొత్త విండోలో తెరుచుకుంటుంది).

“డేటా ఏజెంట్ ఎలా పనిచేస్తుంది” అనే శీర్షికతో కూడిన రేఖాచిత్రం. ఎంట్రీ పాయింట్‌లు—ఏజెంట్-UI, లోకల్ ఏజెంట్-MCP, రిమోట్ ఏజెంట్-MCP, మరియు స్లాక్ ఏజెంట్—ఒక ఏజెంట్-APIలోకి ఫీడ్ అవుతాయి. API అంతర్గత డేటా జ్ఞానం మరియు కంపెనీ సందర్భానికి కనెక్ట్ అవుతుంది, డేటా గిడ్డంగి మరియు ప్లాట్‌ఫామ్ మూలాలతో సమకాలీకరిస్తుంది మరియు GPT-5.2 తో అభ్యర్థనలను మార్పిడి చేస్తుంది. ఏజెంట్-MCP ద్వారా మోడల్.

వినియోగదారులు సంక్లిష్టమైన, ఓపెన్-ఎండ్ ప్రశ్నలను అడగవచ్చు, వీటికి సాధారణంగా బహుళ రౌండ్ల మాన్యువల్ అన్వేషణ అవసరం. ఈ ఉదాహరణ ప్రాంప్ట్‌ను తీసుకోండి, ఇది పరీక్ష డేటా సెట్‌ను ఉపయోగిస్తుంది: “NYC టాక్సీ ట్రిప్‌ల కోసం, ఏ పికప్-టు-డ్రాప్-ఆఫ్ జిప్ జతలు అత్యంత నమ్మదగనివి, సాధారణ మరియు చెత్త ప్రయాణ సమయాల మధ్య అతిపెద్ద అంతరం ఉంటుంది మరియు ఆ వైవిధ్యం ఎప్పుడు సంభవిస్తుంది?”

ఏజెంట్ ప్రశ్నను అర్థం చేసుకోవడం నుండి డేటాను అన్వేషించడం, ప్రశ్నలను అమలు చేయడం మరియు ఫలితాలను సంశ్లేషణ చేయడం వరకు విశ్లేషణను పూర్తి స్థాయిలో నిర్వహిస్తాడు.

ఏ NYC టాక్సీ పికప్ → డ్రాప్‌ఆఫ్ జిప్ జతలు అత్యంత “నమ్మదగనివి” అని అడుగుతున్న వినియోగదారుని చూపుతున్న స్క్రీన్‌షాట్. samples.nyctaxi.trips నుండి ~21k ట్రిప్పులను ఉపయోగించి ఏజెంట్ వివరిస్తాడు, సాధారణ (p50) vs చెత్త-సందర్భం (p95) నిర్వచిస్తుంది, ఫిల్టర్‌లను వర్తింపజేస్తుంది మరియు ప్రతి జిప్ జత యొక్క పొడవైన ట్రిప్ ఎప్పుడు జరిగిందో అది ఎలా గుర్తిస్తుందో వివరిస్తుంది.

ప్రశ్నకు ఏజెంట్ యొక్క సమాధానం.

ఏజెంట్ యొక్క సూపర్ పవర్స్‌లో ఒకటి అతను సమస్యల ద్వారా ఎలా కారణమవుతాడు అనేది. స్థిర స్క్రిప్ట్‌ను అనుసరించడానికి బదులుగా, ఏజెంట్ తన పురోగతిని తానే అంచనా వేసుకుంటాడు. ఇంటర్మీడియట్ ఫలితం తప్పుగా కనిపిస్తే (ఉదాహరణకు, తప్పు జాయిన్ లేదా ఫిల్టర్ కారణంగా దానికి సున్నా వరుసలు ఉంటే), ఏజెంట్ ఏమి తప్పు జరిగిందో పరిశోధించి, దాని విధానాన్ని సర్దుబాటు చేసి, మళ్ళీ ప్రయత్నిస్తాడు. ఈ ప్రక్రియ అంతటా, ఇది పూర్తి సందర్భాన్ని నిలుపుకుంటుంది మరియు దశల మధ్య అభ్యాసాలను ముందుకు తీసుకువెళుతుంది. ఈ క్లోజ్డ్-లూప్, స్వీయ-అభ్యాస ప్రక్రియ వినియోగదారు నుండి ఏజెంట్‌లోకి పునరుక్తిని మారుస్తుంది, మాన్యువల్ వర్క్‌ఫ్లోల కంటే వేగవంతమైన ఫలితాలను మరియు స్థిరంగా అధిక-నాణ్యత విశ్లేషణలను అనుమతిస్తుంది.

NYC టాక్సీ ట్రిప్ వ్యవధులను విశ్లేషించడానికి AI ఏజెంట్ యొక్క దశల వారీ ప్రణాళికను చూపించే టాస్క్ వర్క్‌ఫ్లో యొక్క స్క్రీన్‌షాట్. ఇందులో లక్ష్యాలు, అంతర్గత శోధనలు, స్కీమా తనిఖీ, కోడ్ స్నిప్పెట్‌లు మరియు p50/p95 స్ప్రెడ్‌లను కంప్యూటింగ్ చేయడం, నమ్మదగని జిప్ జతలను గుర్తించడం మరియు SQL ప్రశ్నలను ప్లాన్ చేయడం గురించి రిజనింగ్ ఉంటాయి.

అత్యంత నమ్మదగని NYC టాక్సీ పికప్–డ్రాప్ఆఫ్ జతలను గుర్తించడానికి ఏజెంట్ యొక్క రిజనింగ్.

ఏజెంట్ పూర్తి విశ్లేషణ వర్క్‌ఫ్లోను కవర్ చేస్తాడు: డేటాను కనుగొనడం, SQLను అమలు చేయడం మరియు నోట్‌బుక్‌లు మరియు నివేదికలను ప్రచురించడం. ఇది అంతర్గత కంపెనీ జ్ఞానాన్ని అర్థం చేసుకుంటుంది, బాహ్య సమాచారం కోసం వెబ్ శోధన చేయగలదు మరియు నేర్చుకున్న వినియోగం మరియు జ్ఞాపకశక్తి ద్వారా కాలక్రమేణా మెరుగుపడుతుంది.

సందర్భమే అంతా

అధిక-నాణ్యత సమాధానాలు గొప్ప, ఖచ్చితమైన సందర్భంపై ఆధారపడి ఉంటాయి. సందర్భం లేకుండా, బలమైన మోడల్‌లు కూడా తప్పుడు ఫలితాలను ఇవ్వగలవు, ఉదాహరణకు వినియోగదారు గణనలను తప్పుగా అంచనా వేయడం లేదా అంతర్గత పరిభాషను తప్పుగా అర్థం చేసుకోవడం.

“గత 30 రోజులుగా ChatGPT ఇమేజ్ జెన్ లాగిన్ అయిన DAU ఏమిటి?” అని అడుగుతున్న వినియోగదారుడి స్క్రీన్‌షాట్, ఏజెంట్ “22m 41s కోసం పనిచేస్తున్నారు” అని చూపించే స్టేటస్ లైన్ క్రింద ఉంది, ఇది చాలా కాలంగా కొనసాగుతున్న ప్రశ్న పురోగతిలో ఉందని సూచిస్తుంది.

మెమరీ లేని ఏజెంట్, సమర్థవంతంగా ప్రశ్నించలేకపోయాడు.

“గత 30 రోజులుగా ChatGPT ఇమేజ్ జెన్ లాగిన్ అయిన DAU ఏమిటి?” అని వినియోగదారు అడుగుతున్న స్క్రీన్‌షాట్‌ను చూపిస్తుంది. సందేశం కింద, “1m 22s పనిచేసింది” అనే స్టేటస్ లైన్ ఉంది, ఇది ప్రశ్న ఇంకా నడుస్తోందని మరియు పూర్తి కావడానికి చాలా సమయం పడుతుందని సూచిస్తుంది.

ఏజెంట్ మెమరీ సరైన పట్టికలను గుర్తించడం ద్వారా వేగవంతమైన ప్రశ్నలను అనుమతిస్తుంది.

ఈ వైఫల్య విధానాలను నివారించడానికి, ఏజెంట్ OpenAI యొక్క డేటా మరియు సంస్థాగత పరిజ్ఞానంపై ఆధారపడిన బహుళ పొరల సందర్భం చుట్టూ నిర్మించబడింది.

“డేటా ఏజెంట్ యొక్క సందర్భోచిత పొరలు” అనే శీర్షికతో కూడిన రేఖాచిత్రం ఆరు పేర్చబడిన శ్రేణులను చూపిస్తుంది: 1) పట్టిక వినియోగం, 2) మానవ ఉల్లేఖనాలు, 3) Codex ఎన్‌రిచ్‌మెంట్, 4) సంస్థాగత జ్ఞానం, 5) మెమరీ మరియు 6) రన్‌టైమ్ సందర్భం. ప్రతి పొర పిరమిడ్ ఆకారంలో క్షితిజ సమాంతర పట్టీలా కనిపిస్తుంది.

లేయర్ #1: టేబుల్ వాడకం

  • మెటాడేటా గ్రౌండింగ్: SQL రచనను తెలియజేయడానికి ఏజెంట్ స్కీమా మెటాడేటా (కాలమ్ పేర్లు మరియు డేటా రకాలు)పై ఆధారపడతాడు మరియు విభిన్న పట్టికలు ఎలా సంబంధం కలిగి ఉన్నాయో సందర్భాన్ని అందించడానికి టేబుల్ వంశాన్ని (ఉదా., అప్‌స్ట్రీమ్ మరియు డౌన్‌స్ట్రీమ్ టేబుల్ సంబంధాలు) ఉపయోగిస్తాడు.
  • ప్రశ్న అనుమితి: చారిత్రక ప్రశ్నలను తీసుకోవడం వలన ఏజెంట్ తన సొంత ప్రశ్నలను ఎలా వ్రాయాలో మరియు ఏ పట్టికలు సాధారణంగా కలిసి ఉంటాయో అర్థం చేసుకోవడానికి సహాయపడుతుంది.

లేయర్ #2: మానవ ఉల్లేఖనాలు

  • డొమైన్ నిపుణులు అందించిన పట్టికలు మరియు నిలువు వరుసల యొక్క క్యూరేటెడ్ వివరణలు, స్కీమాలు లేదా గత ప్రశ్నల నుండి సులభంగా ఊహించలేని ఉద్దేశం, అర్థశాస్త్రం, వ్యాపార అర్థం మరియు తెలిసిన హెచ్చరికలను సంగ్రహించడం.

మెటాడేటా ఒక్కటే సరిపోదు. పట్టికలను నిజంగా వేరు చేయడానికి, అవి ఎలా సృష్టించబడ్డాయో మరియు అవి ఎక్కడ ఉద్భవించాయో మీరు అర్థం చేసుకోవాలి.

లేయర్ #3: Codex ఎన్‌రిచ్‌మెంట్

  • పట్టిక యొక్క కోడ్-స్థాయి నిర్వచనాన్ని పొందడం ద్వారా, ఏజెంట్ డేటా వాస్తవానికి ఏమి కలిగి ఉందో లోతైన అవగాహనను ఏర్పరుస్తాడు. 
    • పట్టికలో ఏమి నిల్వ చేయబడుతుందో మరియు అది విశ్లేషణ ఈవెంట్ నుండి ఎలా పొందబడిందో అనే దానిపై సూక్ష్మ నైపుణ్యాలు అదనపు సమాచారాన్ని అందిస్తాయి. ఉదాహరణకు, ఇది విలువల ప్రత్యేకత, టేబుల్ డేటా ఎంత తరచుగా నవీకరించబడుతుందో, డేటా యొక్క పరిధి (ఉదా., టేబుల్ కొన్ని ఫీల్డ్‌లను మినహాయించినట్లయితే, అది ఈ స్థాయి గ్రాన్యులారిటీని కలిగి ఉంటుంది) మొదలైన వాటిపై సందర్భాన్ని ఇవ్వగలదు.
  • ఇది స్పార్క్, పైథాన్ మరియు ఇతర డేటా సిస్టమ్‌లలో SQL దాటి పట్టిక ఎలా ఉపయోగించబడుతుందో చూపించడం ద్వారా మెరుగైన వినియోగ సందర్భాన్ని అందిస్తుంది.
  • దీని అర్థం ఏజెంట్ సారూప్యంగా కనిపించే కానీ కీలకమైన మార్గాల్లో భిన్నంగా ఉండే పట్టికల మధ్య తేడాను గుర్తించగలడు. ఉదాహరణకు, ఒక టేబుల్‌లో ఫస్ట్-పార్టీ ChatGPT ట్రాఫిక్ మాత్రమే ఉందో లేదో అది చెప్పగలదు. ఈ సందర్భం కూడా స్వయంచాలకంగా రిఫ్రెష్ చేయబడుతుంది, కాబట్టి ఇది మాన్యువల్ నిర్వహణ లేకుండా తాజాగా ఉంటుంది.
"Codex-సుసంపన్నమైన జ్ఞాన పైప్‌లైన్" అనే శీర్షికతో కూడిన రేఖాచిత్రం. జనాదరణ పొందిన పట్టికలు బహుళ Codex టాస్క్‌లలోకి ఫీడ్ అవుతాయి, ఇవి OpenAI కోడ్‌బేస్ నుండి వివరాలను సంగ్రహిస్తాయి, వీటిలో టేబుల్ యొక్క ఉద్దేశ్యం, గ్రెయిన్ మరియు ప్రాథమిక కీలు, డౌన్‌స్ట్రీమ్ వినియోగ నమూనాలు, ప్రత్యామ్నాయ పట్టిక ఎంపికలు మరియు డేటా తాజాదనం ఉన్నాయి.

లేయర్ #4: సంస్థాగత జ్ఞానం 

  • ఏజెంట్ స్లాక్, గూగుల్ డాక్స్ మరియు నోషన్‌లను యాక్సెస్ చేయగలడు, ఇవి లాంచ్‌లు, విశ్వసనీయత సంఘటనలు, అంతర్గత కోడ్‌నేమ్‌లు మరియు సాధనాలు మరియు కీలక మెట్రిక్‌ల కోసం కానానికల్ నిర్వచనాలు మరియు గణన తర్కం వంటి కీలకమైన కంపెనీ సందర్భాన్ని సంగ్రహిస్తాయి.
  • ఈ పత్రాలు మెటాడేటా మరియు అనుమతులతో అంతర్గ్రహించబడతాయి, పొందుపరచబడతాయి మరియు నిల్వ చేయబడతాయి. ఒక రిట్రీవల్ సర్వీస్ రన్‌టైమ్‌లో యాక్సెస్ కంట్రోల్ మరియు కాషింగ్‌ను నిర్వహిస్తుంది, ఏజెంట్ ఈ సమాచారాన్ని సమర్థవంతంగా మరియు సురక్షితంగా లాగడానికి వీలు కల్పిస్తుంది.
డిసెంబర్‌లో కనెక్టర్ వాడకం ఎందుకు తగ్గిందని అడిగే వినియోగదారుడి స్క్రీన్‌షాట్. నవంబర్ 13, 2025 నుండి ప్రారంభమయ్యే లాగింగ్ సమస్య కారణంగా ఈ తగ్గుదల జరిగిందని, దీని వలన ChatGPT 5.1 లాంచ్ తర్వాత వినియోగం తక్కువగా ఉందని ఏజెంట్ వివరించారు. కొత్త సంఘటన సత్యానికి మూలంగా మారే వరకు లెగసీ టెలిమెట్రీ ఖాళీగా ఉంది.

లేయర్ #5: మెమరీ

  • ఏజెంట్‌కు దిద్దుబాట్లు ఇచ్చినప్పుడు లేదా కొన్ని డేటా ప్రశ్నల గురించి సూక్ష్మ నైపుణ్యాలను కనుగొన్నప్పుడు, అది ఈ అభ్యాసాలను తదుపరి సారి సేవ్ చేయగలదు, తద్వారా దాని వినియోగదారులతో నిరంతరం మెరుగుపడటానికి వీలు కల్పిస్తుంది. 
    • ఫలితంగా, భవిష్యత్తు సమాధానాలు ఒకే సమస్యలను పదే పదే ఎదుర్కోవడం కంటే మరింత ఖచ్చితమైన బేస్‌లైన్ నుండి ప్రారంభమవుతాయి.
    • డేటా ఖచ్చితత్వానికి కీలకమైన కానీ ఇతర లేయర్‌ల నుండి మాత్రమే ఊహించడం కష్టతరమైన స్పష్టమైన దిద్దుబాట్లు, ఫిల్టర్‌లు మరియు పరిమితులను నిలుపుకోవడం మరియు తిరిగి ఉపయోగించడం మెమరీ లక్ష్యం. 
    • ఉదాహరణకు, ఒక సందర్భంలో, ఏజెంట్‌కు ఒక నిర్దిష్ట విశ్లేషణ ప్రయోగం కోసం ఎలా ఫిల్టర్ చేయాలో తెలియదు (ఇది ప్రయోగాత్మక గేట్‌లో నిర్వచించబడిన నిర్దిష్ట స్ట్రింగ్‌తో సరిపోలికపై ఆధారపడింది). సరిగ్గా ఫిల్టర్ చేయగలిగేలా చూసుకోవడానికి, అస్పష్టంగా సరిపోలికను స్ట్రింగ్ చేయడానికి ప్రయత్నించే బదులు, మెమరీ ఇక్కడ చాలా ముఖ్యమైనది.
  • మీరు ఏజెంట్‌కి దిద్దుబాటు ఇచ్చినప్పుడు లేదా మీ సంభాషణ నుండి వారు ఏదైనా నేర్చుకున్నప్పుడు, ఆ జ్ఞాపకాన్ని తదుపరి సారి సేవ్ చేయమని అది మిమ్మల్ని ప్రాంప్ట్ చేస్తుంది.
    • జ్ఞాపకాలను వినియోగదారులు మాన్యువల్‌గా సృష్టించవచ్చు మరియు సవరించవచ్చు.
    • జ్ఞాపకాలు ప్రపంచ మరియు వ్యక్తిగత స్థాయిలో స్కోప్ చేయబడతాయి మరియు ఏజెంట్ యొక్క సాధనం వాటిని సవరించడాన్ని సులభతరం చేస్తుంది.
“డేటా ఏజెంట్ 2 అభ్యాసాలను మెమరీకి సేవ్ చేయాలనుకుంటున్నారు” అని చూపించే నోటిఫికేషన్ బ్యానర్, “ChatGPT టాప్-లెవల్ మెట్రిక్స్” అని లేబుల్ చేయబడిన అంశం మరియు కుడి వైపున ఆకుపచ్చ చెక్‌మార్క్‌తో “గ్లోబల్ మెమరీకి సేవ్ చేయబడింది” అని చదివే నిర్ధారణ సందేశం.

లేయర్ #6: రన్‌టైమ్ సందర్భం

  • పట్టికకు ముందస్తు సందర్భం లేనప్పుడు లేదా ఉన్న సమాచారం పాతదిగా ఉన్నప్పుడు, ఏజెంట్ పట్టికను నేరుగా తనిఖీ చేయడానికి మరియు ప్రశ్నించడానికి డేటా వేర్‌హౌస్‌కు ప్రత్యక్ష ప్రశ్నలను జారీ చేయవచ్చు. ఇది స్కీమాలను ధృవీకరించడానికి, డేటాను నిజ సమయంలో అర్థం చేసుకోవడానికి మరియు తదనుగుణంగా స్పందించడానికి అనుమతిస్తుంది.
  • గిడ్డంగి వెలుపల ఉన్న విస్తృత డేటా సందర్భాన్ని పొందడానికి అవసరమైన విధంగా ఏజెంట్ ఇతర డేటా ప్లాట్‌ఫామ్ వ్యవస్థలతో (మెటాడేటా సర్వీస్, ఎయిర్‌ఫ్లో, స్పార్క్) కూడా మాట్లాడగలరు.

మేము పట్టిక వినియోగం, మానవ ఉల్లేఖనాలు మరియు ‌‌Codex-ఉత్పన్న సుసంపన్నతను ఒకే, సాధారణీకరించిన ప్రాతినిధ్యంగా సమగ్రపరిచే రోజువారీ ఆఫ్‌లైన్ పైప్‌లైన్‌ను నడుపుతాము. ఈ సుసంపన్నమైన సందర్భం OpenAI ఎంబెడ్డింగ్స్ APIని(కొత్త విండోలో తెరుచుకుంటుంది) ఉపయోగించి ఎంబెడ్డింగ్‌లుగా మార్చబడుతుంది మరియు తిరిగి పొందడం కోసం నిల్వ చేయబడుతుంది. ప్రశ్న సమయంలో, ఏజెంట్ ముడి మెటాడేటా లేదా లాగ్‌లను స్కాన్ చేయడానికి బదులుగా రిట్రీవల్-ఆగ్మెంటెడ్ జనరేషన్(కొత్త విండోలో తెరుచుకుంటుంది) (RAG) ద్వారా అత్యంత సంబంధిత ఎంబెడెడ్ సందర్భాన్ని మాత్రమే లాగుతుంది. ఇది పదివేల టేబుల్‌లలో కూడా టేబుల్ అవగాహనను వేగంగా మరియు స్కేలబుల్‌గా చేస్తుంది, అదే సమయంలో రన్‌టైమ్ జాప్యాన్ని ఊహించదగినదిగా మరియు తక్కువగా ఉంచుతుంది. అవసరమైన విధంగా మా డేటా వేర్‌హౌస్‌కు రన్‌టైమ్ ప్రశ్నలు ప్రత్యక్షంగా జారీ చేయబడతాయి.

“డేటా ఏజెంట్‌లో సందర్భోచిత పునరుద్ధరణ” అనే శీర్షికతో ఉన్న రేఖాచిత్రం. ఆఫ్‌లైన్ ప్రీప్రాసెసింగ్ లేయర్‌లు—టేబుల్ వినియోగం, మానవ వ్యాఖ్యానాలు, ‌‌Codex సుసంపన్నం, సంస్థాగత జ్ఞానం మరియు జ్ఞాపకశక్తి—RAG ఎంబెడ్డింగ్‌లలోకి ఫీడ్ అవుతాయి. రన్‌టైమ్ సందర్భాన్ని ఉత్పత్తి చేయడానికి ఏజెంట్ సెమాంటిక్ సెర్చ్ లేదా ఖచ్చితమైన టెక్స్ట్ రిట్రీవల్ ద్వారా డేటాబేస్‌ను ప్రశ్నించడాన్ని లైవ్ రిట్రీవల్ చూపిస్తుంది.

ఈ పొరలు కలిసి, ఏజెంట్ యొక్క రిజనింగ్ OpenAI యొక్క డేటా, కోడ్ మరియు సంస్థాగత పరిజ్ఞానంపై ఆధారపడి ఉందని నిర్ధారిస్తాయి, లోపాలను నాటకీయంగా తగ్గిస్తాయి మరియు సమాధాన నాణ్యతను మెరుగుపరుస్తాయి.

సహచరుడిలా ఆలోచించి పని చేయడానికి రూపొందించబడింది

సమస్య స్పష్టంగా ఉన్నప్పుడు వన్-షాట్ సమాధానాలు పనిచేస్తాయి, కానీ చాలా ప్రశ్నలు అలా ఉండవు. చాలా తరచుగా, సరైన ఫలితాన్ని చేరుకోవడానికి ముందుకు వెనుకకు శుద్ధీకరణ మరియు కొంత కోర్సు దిద్దుబాటు అవసరం.

మీరు తర్కించగల సహచరుడిలా ప్రవర్తించేలా ఏజెంట్ నిర్మించబడ్డాడు. ఇది సంభాషణాత్మకమైనది, ఎల్లప్పుడూ ఆన్‌లో ఉంటుంది మరియు శీఘ్ర సమాధానాలు మరియు పునరావృత అన్వేషణ రెండింటినీ నిర్వహిస్తుంది.

ఇది మలుపుల్లో పూర్తి సందర్భాన్ని తీసుకువెళుతుంది, కాబట్టి వినియోగదారులు ప్రతిదాన్ని తిరిగి చెప్పకుండానే తదుపరి ప్రశ్నలను అడగవచ్చు, వారి ఉద్దేశాన్ని సర్దుబాటు చేసుకోవచ్చు లేదా దిశను మార్చుకోవచ్చు. ఏజెంట్ తప్పుడు మార్గంలో వెళ్లడం ప్రారంభిస్తే, వినియోగదారులు విశ్లేషణ మధ్యలో అంతరాయం కలిగించి దానిని దారి మళ్లించవచ్చు, ముందుకు సాగడానికి బదులుగా వినే మానవ సహకారితో కలిసి పనిచేసినట్లే.

సూచనలు అస్పష్టంగా లేదా అసంపూర్ణంగా ఉన్నప్పుడు, ఏజెంట్ ముందుగానే స్పష్టమైన ప్రశ్నలను అడుగుతాడు. ప్రతిస్పందన అందించకపోతే, పురోగతి సాధించడానికి ఇది సరైన డిఫాల్ట్‌లను వర్తింపజేస్తుంది. ఉదాహరణకు, తేదీ పరిధి పేర్కొనకుండా వ్యాపార వృద్ధి గురించి వినియోగదారు అడిగితే, అది గత ఏడు లేదా 30 రోజులుగా భావించవచ్చు. ఈ ప్రియర్స్ సరైన ఫలితంపై కలుస్తూనే ప్రతిస్పందించేలా మరియు నిరోధించకుండా ఉండటానికి అనుమతిస్తాయి.

ఫలితంగా మీకు ఏమి కావాలో ఖచ్చితంగా తెలిసినప్పుడు (ఉదా., “ఈ టేబుల్ గురించి నాకు చెప్పండి”) మరియు మీరు అన్వేషిస్తున్నప్పుడు (ఉదా., “నేను ఇక్కడ తగ్గుదల చూస్తున్నాను, దీనిని కస్టమర్ రకం మరియు కాలపరిమితి ఆధారంగా మనం విభజించవచ్చా?”) రెండింటిలోనూ బాగా పనిచేసే ఏజెంట్ ఏర్పడుతుంది. 

విడుదల తర్వాత, వినియోగదారులు తరచుగా పునరావృతమయ్యే పని కోసం ఒకే విశ్లేషణలను అమలు చేస్తున్నారని మేము గమనించాము. దీన్ని వేగవంతం చేయడానికి, ఏజెంట్ యొక్క వర్క్‌ఫ్లోలు పునరావృత విశ్లేషణలను పునర్వినియోగ సూచన సెట్‌లుగా ప్యాకేజీ చేస్తాయి. ఉదాహరణలలో వారపు వ్యాపార నివేదికల కోసం వర్క్‌ఫ్లోలు మరియు పట్టిక ధ్రువీకరణలు ఉన్నాయి. సందర్భం మరియు ఉత్తమ పద్ధతులను ఒకసారి ఎన్‌కోడ్ చేయడం ద్వారా, వర్క్‌ఫ్లోలు పునరావృత విశ్లేషణలను క్రమబద్ధీకరిస్తాయి మరియు వినియోగదారులలో స్థిరమైన ఫలితాలను నిర్ధారిస్తాయి.

"డేటా ప్రశ్న అడగండి" అనే ప్లేస్‌హోల్డర్ టెక్స్ట్‌తో UI ఇన్‌పుట్ బార్. దాని కింద "వర్క్‌ఫ్లోను ఉపయోగించండి" అని లేబుల్ చేయబడిన బటన్ ఉంది మరియు కుడి వైపున మైక్రోఫోన్ మరియు పంపు చిహ్నాలు ఉన్నాయి. బార్ గుండ్రని మూలలను కలిగి ఉంది మరియు చీకటి నేపథ్యంలో కూర్చుంది.

నమ్మకాన్ని వమ్ము చేయకుండా వేగంగా కదులుతోంది

ఎల్లప్పుడూ ఆన్‌లో ఉండే, పరిణామం చెందుతున్న ఏజెంట్‌ను నిర్మించడం అంటే నాణ్యత ఎంత సులభంగా మెరుగుపడుతుందో అంతే సులభంగా కూడా తగ్గిపోతుంది. గట్టి ఫీడ్‌బ్యాక్ లూప్ లేకుండా, తిరోగమనాలు అనివార్యం మరియు కనిపించవు. నమ్మకాన్ని వమ్ము చేయకుండా సామర్థ్యాన్ని స్కేల్ చేయడానికి ఏకైక మార్గం క్రమబద్ధమైన మూల్యాంకనం.

ఈ విభాగంలో, ఏజెంట్ ప్రతిస్పందన నాణ్యతను కొలవడానికి మరియు రక్షించడానికి మేము OpenAI యొక్క Evals APIని(కొత్త విండోలో తెరుచుకుంటుంది) ఎలా ఉపయోగించాలో చర్చిస్తాము.

దీని ఎవాల్స్ ప్రశ్న-జవాబు జతల క్యూరేటెడ్ సెట్‌లపై నిర్మించబడ్డాయి. ప్రతి ప్రశ్న మనం సరిగ్గా రాయడం గురించి చాలా శ్రద్ధ వహించే ముఖ్యమైన మెట్రిక్ లేదా విశ్లేషణాత్మక నమూనాను లక్ష్యంగా చేసుకుంటుంది, ఇది ఊహించిన ఫలితాన్ని ఉత్పత్తి చేసే మాన్యువల్‌గా రచించిన "గోల్డెన్" SQL ప్రశ్నతో జత చేయబడింది. ప్రతి eval కోసం, మేము సహజ భాషా ప్రశ్నను దాని క్వెరీ-జనరేషన్ ఎండ్ పాయింట్‌కి పంపుతాము, జనరేట్ చేయబడిన SQLను అమలు చేస్తాము మరియు అవుట్‌పుట్‌ను ఆశించిన SQL ఫలితంతో పోల్చాము.

“డేటా ఏజెంట్ మూల్యాంకన పైప్‌లైన్” అనే శీర్షికతో ఉన్న రేఖాచిత్రం. SQL మరియు ఫలితాలను ఉత్పత్తి చేసే తరం దశలో అంచనా వేసిన SQL ఫీడ్‌తో ప్రశ్నోత్తరాల విశ్లేషణ జత చేస్తుంది. OpenAI Evals డేటాఫ్రేమ్ మరియు SQL పోలికను ఉపయోగించి ఉత్పత్తి చేయబడిన వర్సెస్ ఆశించిన ఫలితాలను పోల్చి, స్కోర్ మరియు రిజనింగ్‌ను అవుట్‌పుట్ చేస్తుంది.

మూల్యాంకనం సరళమైన స్ట్రింగ్ మ్యాచింగ్‌పై ఆధారపడి ఉండదు. ఉత్పత్తి చేయబడిన SQL సరైనదే అయినప్పటికీ వాక్యనిర్మాణపరంగా భిన్నంగా ఉండవచ్చు మరియు ఫలిత సెట్లలో సమాధానాన్ని గణనీయంగా ప్రభావితం చేయని అదనపు నిలువు వరుసలు ఉండవచ్చు. దీనిని లెక్కించడానికి, మేము SQL మరియు ఫలిత డేటా రెండింటినీ పోల్చి, ఈ సంకేతాలను OpenAI యొక్క Evals గ్రేడర్‌లోకి ఫీడ్ చేస్తాము. గ్రేడర్ వివరణతో పాటు తుది స్కోర్‌ను ఉత్పత్తి చేస్తాడు, ఇది సరైనది మరియు ఆమోదయోగ్యమైన వైవిధ్యం రెండింటినీ సంగ్రహిస్తుంది.

ఈ అంచనాలు ఉత్పత్తిలో కానరీలుగా తిరోగమనాలను గుర్తించడానికి అభివృద్ధి సమయంలో నిరంతరం నడిచే యూనిట్ పరీక్షల వంటివి; ఇది ఏజెంట్ సామర్థ్యాలు విస్తరిస్తున్న కొద్దీ సమస్యలను ముందుగానే పట్టుకోవడానికి మరియు నమ్మకంగా పునరావృతం చేయడానికి మాకు అనుమతిస్తుంది.

ఏజెంట్ భద్రత

మా ఏజెంట్ OpenAI యొక్క ప్రస్తుత భద్రత మరియు యాక్సెస్-నియంత్రణ మోడల్‌లోకి నేరుగా ప్లగ్ చేస్తాడు. ఇది పూర్తిగా ఇంటర్‌ఫేస్ లేయర్‌గా పనిచేస్తుంది, OpenAI డేటాను నియంత్రించే అదే అనుమతులు మరియు గార్డ్‌రైల్‌లను వారసత్వంగా పొందుతుంది మరియు అమలు చేస్తుంది. 

ఏజెంట్ యొక్క అన్ని యాక్సెస్‌లు ఖచ్చితంగా పాస్-త్రూగా ఉంటాయి, అంటే వినియోగదారులు ఇప్పటికే యాక్సెస్ చేయడానికి అనుమతి ఉన్న పట్టికలను మాత్రమే ప్రశ్నించగలరు. యాక్సెస్ లేనప్పుడు, ఇది దీన్ని ఫ్లాగ్ చేస్తుంది లేదా వినియోగదారు ఉపయోగించడానికి అధికారం ఉన్న ప్రత్యామ్నాయ డేటాసెట్‌లకు తిరిగి వస్తుంది.

చివరగా, ఇది పారదర్శకత కోసం నిర్మించబడింది. ఏ వ్యవస్థ లాగే, ఇది కూడా తప్పులు చేయగలదు. ప్రతి సమాధానంతో పాటు ఊహలు మరియు అమలు దశలను సంగ్రహించడం ద్వారా ఇది దాని రిజనింగ్ ప్రక్రియను బహిర్గతం చేస్తుంది. ప్రశ్నలు అమలు చేయబడినప్పుడు, ఇది నేరుగా అంతర్లీన ఫలితాలకు లింక్ చేస్తుంది, వినియోగదారులు ముడి డేటాను తనిఖీ చేయడానికి మరియు విశ్లేషణ యొక్క ప్రతి దశను ధృవీకరించడానికి అనుమతిస్తుంది.

నేర్చుకున్న పాఠాలు

మా ఏజెంట్‌ను మొదటి నుండి నిర్మించడం వల్ల ఏజెంట్లు ఎలా ప్రవర్తిస్తారు, వారు ఎక్కడ ఇబ్బంది పడుతున్నారు మరియు స్థాయిలో వారిని నమ్మదగినదిగా చేసే దాని గురించి ఆచరణాత్మక పాఠాలు బయటపడ్డాయి.

పాఠం #1: తక్కువే ఎక్కువ

ప్రారంభంలోనే, మేము మా పూర్తి టూల్ సెట్‌ను ఏజెంట్‌కు చూపించాము మరియు అతివ్యాప్తి చెందుతున్న కార్యాచరణతో త్వరగా సమస్యలను ఎదుర్కొన్నాము. ఈ రిడెండెన్సీ నిర్దిష్ట కస్టమ్ కేసులకు ఉపయోగకరంగా ఉంటుంది మరియు మాన్యువల్‌గా ఇన్వోక్ చేసేటప్పుడు మానవుడికి మరింత స్పష్టంగా కనిపిస్తుంది, ఇది ఏజెంట్లకు గందరగోళంగా ఉంటుంది. అస్పష్టతను తగ్గించడానికి మరియు విశ్వసనీయతను మెరుగుపరచడానికి, మేము కొన్ని టూల్ కాల్‌లను పరిమితం చేసి ఏకీకృతం చేసాము.

పాఠం #2: మార్గాన్ని కాదు, లక్ష్యాన్ని నిర్దేశించండి

అధిక నిర్దేశిత ప్రాంప్టింగ్ అధోకరణ ఫలితాలను కూడా మేము కనుగొన్నాము. చాలా ప్రశ్నలు సాధారణ విశ్లేషణాత్మక ఆకారాన్ని పంచుకున్నప్పటికీ, వివరాలు చాలా మారుతూ ఉంటాయి, కఠినమైన సూచనలు తరచుగా ఏజెంట్‌ను తప్పుడు మార్గాల్లోకి నెట్టివేస్తాయి. ఉన్నత స్థాయి మార్గదర్శకత్వానికి మారడం ద్వారా మరియు తగిన అమలు మార్గాన్ని ఎంచుకోవడానికి GPT‑5 యొక్క రిజనింగ్‌పై ఆధారపడటం ద్వారా, ఏజెంట్ మరింత దృఢంగా మారి మెరుగైన ఫలితాలను అందించాడు.

పాఠం #3: అర్థం కోడ్‌లో నివసిస్తుంది

స్కీమాలు మరియు ప్రశ్న చరిత్ర పట్టిక ఆకారం మరియు వినియోగాన్ని వివరిస్తాయి, కానీ దాని నిజమైన అర్థం దానిని ఉత్పత్తి చేసే కోడ్‌లో ఉంటుంది. పైప్‌లైన్ లాజిక్ SQL లేదా మెటాడేటాలో ఎప్పుడూ కనిపించని అంచనాలు, తాజాదనం హామీలు మరియు వ్యాపార ఉద్దేశాన్ని సంగ్రహిస్తుంది. Codex తో కోడ్‌బేస్‌ను క్రాల్ చేయడం ద్వారా, మా ఏజెంట్ డేటాసెట్‌లు వాస్తవానికి ఎలా నిర్మించబడ్డాయో అర్థం చేసుకుంటారు మరియు ప్రతి పట్టికలో వాస్తవానికి ఏమి ఉందో బాగా తర్కించగలరు. ఇది గిడ్డంగి సంకేతాల కంటే “ఇక్కడ ఏముంది” మరియు “నేను ఎప్పుడు ఉపయోగించగలను” అనే ప్రశ్నలకు చాలా ఖచ్చితంగా సమాధానం ఇవ్వగలదు. 

అదే దృష్టి, కొత్త సాధనాలు

అస్పష్టమైన ప్రశ్నలను నిర్వహించే సామర్థ్యాన్ని పెంచడం, బలమైన ధ్రువీకరణలతో దాని విశ్వసనీయత మరియు ఖచ్చితత్వాన్ని మెరుగుపరచడం మరియు వర్క్‌ఫ్లోలలో మరింత లోతుగా సమగ్రపరచడం ద్వారా మా ఏజెంట్‌ను మెరుగుపరచడానికి మేము నిరంతరం కృషి చేస్తున్నాము. ఇది ఒక ప్రత్యేక సాధనంలా పనిచేయడానికి బదులుగా, ప్రజలు ఇప్పటికే ఎలా పని చేస్తున్నారో దానిలో సహజంగా కలిసిపోవాలని మేము విశ్వసిస్తున్నాము.

ఏజెంట్ తార్కికం, ధ్రువీకరణ మరియు స్వీయ-దిద్దుబాటులో అంతర్లీన మెరుగుదలల నుండి మా సాధనం ప్రయోజనం పొందుతూనే ఉంటుంది, మా బృందం లక్ష్యం అలాగే ఉంటుంది: OpenAI యొక్క డేటా పర్యావరణ వ్యవస్థ అంతటా వేగవంతమైన, విశ్వసనీయ డేటా విశ్లేషణను సజావుగా అందించడం.

రచయిత

Bonnie Xu, Aravind Suresh, Emma Tang

కృతజ్ఞతలు

డేటా ప్రొడక్టివిటీ మరియు డేటా సైన్స్ బృందాలకు, అలాగే మా అనేక మంది క్రాస్-ఫంక్షనల్ వినియోగదారులకు వారి ప్రయోగాలు మరియు అభిప్రాయాలకు ప్రత్యేక ధన్యవాదాలు.