deep research ని పరిచయం చేస్తున్నాము
పెద్ద మొత్తంలో ఆన్లైన్ సమాచారాన్ని ఒక చోట చేర్చి రిజనింగ్తో విశ్లేషించి, అనేక దశలుగా ఉండే పరిశోధనా పనులను మీ కోసం పూర్తి చేసే ఏజెంట్.ఇది ప్రస్తుతం Pro వినియోగదారులకు అందుబాటులో ఉంది; Plus మరియు Team వినియోగదారులకు త్వరలో అందుబాటులోకి వస్తుంది.
10 ఫిబ్రవరి, 2026 అప్డేట్: ఇప్పుడు మీరు డీప్ రీసెర్చ్ను ఏ MCP లేదా యాప్కు కనెక్ట్ చేసి, వెబ్ సెర్చ్లను విశ్వసనీయ సైట్లకు మాత్రమే పరిమితం చేయవచ్చు, తద్వారా మీరు ధృవీకరించిన, ఇండస్ట్రీ-ప్రామాణిక మూలాలపై దృష్టి పెట్టవచ్చు. మీరు ఇప్పుడు రియల్-టైమ్లో పురోగతిని ట్రాక్ చేయవచ్చు, ఫాలో-అప్ ప్రాంప్ట్లు లేదా కొత్త మూలాలతో మెరుగుపరచడానికి మధ్యలో విరామం తీసుకోవచ్చు. ప్రారంభించడం, ట్రాక్ చేయడం, మీ పరిశోధనను ప్రారంభం నుండి ముగింపు వరకు సమీక్షించడం మరింత సులభంగా ఉండేలా మేం విజువల్ అనుభవాన్ని అప్డేట్ చేశాం.
జూలై 17, 2025 అప్డేట్: ఇప్పుడు డీప్ రిసెర్చ్ మరింత లోతుగా, విస్తృతంగా పనిచేయగలదు, ఎందుకంటే ChatGPT ఏజెంట్లో విజువల్ బ్రౌజర్ యాక్సెస్ను అందించారు. ఈ కొత్త సామర్థ్యాలను ఉపయోగించడానికి, కంపోజర్లో కనిపించే డ్రాప్డౌన్లో “ఎజెంట్ మోడ్”ని ఎంచుకుని మీ ప్రశ్నను నేరుగా నమోదు చేయండి. అసలు డీప్ రిసెర్చ్ ఫంక్షనాలిటీ మాత్రం టూల్స్ మెనులో ఉన్న “డీప్ రిసెర్చ్” ఎంపిక ద్వారా అలాగే అందుబాటులో ఉంటుంది.
ఏప్రిల్ 24, 2025 అప్డేట్: డీప్ రిసెర్చ్ని మీరు ఉపయోగించగల ఫ్రీక్వెన్సీని మేము గణనీయంగా పెంచుతున్నాము—Plus, Team, Enterprise, మరియు Edu వినియోగదారులకు ఇప్పుడు నెలకు 25 క్వెరీస్, Pro వినియోగదారులకు 250, Free వినియోగదారులకు 5 అందుబాటులో ఉంటాయి. o4-mini ఆధారంగా తయారైన కొత్త, తేలికైన డీప్ రిసెర్చ్ వర్షన్ వల్ల ఇది సాధ్యమైంది; ఇది అధిక నాణ్యతను కాపాడుతూ మరింత ఖర్చు-సమర్థతగా ఉండేలా రూపుదిద్దుకుంది. పూర్తి వర్షన్ కోసం మీ పరిమితి చేరుకున్న తర్వాత, మీ క్వెరీస్ ఆటోమేటిక్గా ఈ తేలికైన వర్షన్కి మారుతాయి.
ఫిబ్రవరి 25, 2025 అప్డేట్: ఇప్పుడు అన్ని Plus వినియోగదారులు డీప్ రిసెర్చ్ను ఉపయోగించగలరు.
ఫిబ్రవరి 5, 2025 అప్డేట్: యునైటెడ్ కింగ్డమ్, స్విట్జర్లాండ్, మరియు యూరోపియన్ ఎకనామిక్ ఏరియాలోని Pro వినియోగదారులకు ఇప్పుడు డీప్ రిసెర్చ్ అందుబాటులో ఉంది.
ఈ రోజు మేము ChatGPTలో డీప్ రీసెర్చ్ను ప్రారంభిస్తున్నాము, ఇది ఇంటర్నెట్పై బహుళ దశల పరిశోధనను నిర్వహించే కొత్త ఏజెంటిక్ సామర్థ్యం, ఇది సంక్లిష్ట పనుల కోసం రూపొందించబడింది. ఇది మనుషులు గంటల తరబడి పడే పనిని కేవలం పదుల నిమిషాల్లోనే పూర్తి చేస్తుంది.
డీప్ రిసెర్చ్ అనేది OpenAI రూపొందించిన తదుపరి ఏజెంట్, ఇది మీకోసం స్వతంత్రంగా పని చేయగలదు. మీరు ఒక ప్రాంప్ట్ ఇస్తే, ChatGPT వందలాది ఆన్లైన్ సోర్సులను కనుగొని, విశ్లేషించి, కలిపి ఒక పరిశోధనా అనలిస్ట్ స్థాయి లోతైన రిపోర్ట్ను తయారు చేస్తుంది.రాబోయే OpenAI o3 మోడల్లోని వెబ్ బ్రౌజింగ్ మరియు డేటా అనాలిసిస్కి ఆప్టిమైజ్ చేసిన ఒక వర్షన్పై నడిచే ఈ సిస్టమ్, రిజనింగ్ని ఉపయోగించి ఇంటర్నెట్లో ఉన్న భారీ స్థాయి టెక్స్ట్, ఇమేజ్లు, PDFsను సెర్చ్ చేసి, అర్థం చేసుకుని, విశ్లేషిస్తుంది; మార్గంలో ఎదురయ్యే కొత్త సమాచారానికి అనుగుణంగా, అవసరాన్నిబట్టి తన పనిలో మార్పులు చేసుకుంటుంది.
తెలివిని సమగ్రంగా సంగ్రహించే సామర్థ్యం, కొత్త జ్ఞానం సృష్టించడానికి అవసరమైన తొలి అంచె. ఈ కారణంగా, డీప్ రీసెర్చ్ మా విస్తృత లక్ష్యం అయిన AGI అభివృద్ధి దిశగా ఒక ముఖ్యమైన ముందడుగు, దీన్ని మేము ఎప్పటినుంచో కొత్త శాస్త్రీయ పరిశోధనలను సృష్టించగల సామర్థ్యం ఉన్నదిగా ఊహిస్తున్నాము.
డీప్ రీసెర్చ్ను ఫైనాన్స్, సైన్స్, పాలసీ, ఇంజినీరింగ్ వంటి రంగాలలో లోతైన జ్ఞానంతో పనిచేసే, పూర్తిగా, ఖచ్చితంగా, విశ్వసనీయంగా పరిశోధన అవసరం ఉన్న వ్యక్తుల కోసం రూపొందించబడింది. ఇది కార్లు, అప్లయెన్సులు, ఫర్నిచర్ వంటి సాధారణంగా జాగ్రత్తగా రీసెర్చ్ అవసరమయ్యే కొనుగోలులపై హైపర్-పర్సనలైజ్ చేసిన సిఫార్సులను వెతుకుతున్న చతురమైన షాపర్లకు సమానంగా ఉపయోగకరంగా ఉంటుంది.ప్రతి అవుట్పుట్ పూర్తిగా డాక్యుమెంట్ చేయబడింది, స్పష్టమైన సిటేషన్లు మరియు దాని రిజనింగ్ సారాంశంతో, సమాచారాన్ని రిఫరెన్స్ చేయడం మరియు ధృవీకరించడం సులభంగా ఉంటుంది.అది విస్తృతంగా వెబ్సైట్లను బ్రౌజ్ చేయాల్సిన, ప్రత్యేకమైన మరియు నాన్-ఇంట్యూషన్ సమాచారాన్ని కనుగొనడంలో ప్రత్యేకంగా సమర్థవంతంగా ఉంటుంది.డీప్ రీసెర్చ్ ఒకే ప్రశ్నతోనే సంక్లిష్టమైన, ఎక్కువ సమయం తీసుకునే వెబ్ రీసెర్చ్ను వేగంగా పూర్తి చేయడానికి సహాయపడుతూ, మీ విలువైన సమయాన్ని ఆదా చేస్తుంది.
డీప్ రీసెర్చ్ స్వతంత్రంగా వెబ్లోని సమాచారం నుండి కనుగొని, రీజనింగ్ చేసి, అంతర్దృష్టులను సమీకరిస్తుంది.దీన్ని సాధించడానికి, బ్రౌజర్ మరియు Python టూల్ వినియోగం అవసరమయ్యే నిజమైన-ప్రపంచ టాస్క్లపై, OpenAI o1 వెనుక ఉపయోగించిన అదే రీన్ఫోర్స్మెంట్ లర్నింగ్ పద్ధతులను ఉపయోగించి, మన మొదటి రీజనింగ్ మోడల్పై ఇది ట్రెయినింగ్ చేయబడింది.o1 కోడింగ్, మ్యాథ్, మరియు ఇతర టెక్నికల్ డొమైన్లలో సమర్థతను చూపించినప్పటికీ, అనేక నిజమైన-ప్రపంచ సవాళ్లు విస్తృత కాంటెక్స్ట్ మరియు వివిధ ఆన్లైన్ సోర్స్ల నుండి సమాచార సేకరణను కోరుకుంటాయి.డీప్ రీసెర్చ్ ఈ రీజనింగ్ సామర్థ్యాలపై ఆధారపడి ఆ తేడాను భర్తీ చేస్తూ, వ్యక్తులు పని మరియు ప్రతిరోజు జీవితంలో ఎదుర్కొనే సమస్యల రూపాలను ఎదుర్కోవడానికి సౌకర్యం కల్పిస్తుంది.
ChatGPTలో, మెసేజ్ కాంపోజర్లో ‘డీప్ రీసెర్చ్’ను ఎంచుకుని, మీ ప్రశ్నను నమోదు చేయండి. మీకు అవసరమైనది ఏదైనా—స్ట్రీమింగ్ ప్లాట్ఫార్మ్లపై కాంపిటేటివ్ అనాలిసిస్ కావాలనో, ఉత్తమ కమ్యూటర్ బైక్పై వ్యక్తిగత నివేదిక కావాలనో—ChatGPTకి చెప్పండి. మీరు మీ ప్రశ్నకు సంబంధించి ఫైళ్ళను లేదా స్ప్రెడ్షీట్లను అటాచ్ చేయొచ్చు. ఒకసారి ఇది రన్ అవ్వడం ప్రారంభిస్తే, తీసుకున్న దశల మరియు ఉపయోగించిన సోర్స్ల సారాంశంతో సైడ్బార్ కనిపిస్తుంది.
డీప్ రీసెర్చ్ తన పని పూర్తిచేయడానికి 5 నుండి 30 నిమిషాల వరకు పట్టవచ్చు, వెబ్లో లోతుగా వెతకడానికి కావలసిన సమయం తీసుకుంటుంది.ఈ మధ్యలో, మీరు కొంచెం విరామం తీసుకోవచ్చు లేదా ఇతర పనులు చేయవచ్చు—రిసెర్చ్ పూర్తి అయిన తర్వాత మీరు నోటిఫికేషన్ పొందుతారు.చివరి అవుట్పుట్ చాట్లో రిపోర్ట్గా వస్తుంది – రాబోయే కొన్ని వారాల్లో, అదనపు స్పష్టత మరియు కాంటెక్స్ట్ కోసం, ఈ రిపోర్ట్లలో ఇంబెడ్డెడ్ ఇమేజెస్, డేటా విజువలైజేషన్స్, మరియు ఇతర అనాలిటిక్ అవుట్పుట్లను కూడా మేము చేర్చబోతున్నాము.
డీప్ రీసెర్చ్తో పోలిస్తే, GPT‑4o రియల్-టైమ్ మల్టీమోడల్ సంభాషణలకు అనువైనది. బహుముఖ, డొమైన్స్-స్పెసిఫిక్ ప్రశ్నల్లో లోతు మరియు వివరాలు కీలకమైనప్పుడు, విస్తృతంగా ఎక్స్ప్లోర్ చేసి ప్రతి క్లెయిమ్కి సైటేషన్ ఇవ్వగల డీప్ రీసెర్చ్ సామర్థ్యం, ఒక త్వరిత సారాంశం మరియు బలమైన ఆధారాలతో ఉన్న, పని కోసం నేరుగా ఉపయోగించగల సమాధానం మధ్యనున్న అసలు తేడాగా నిలుస్తుంది.
GPT-4o
Deep research
డీప్ రీసెర్చ్ ప్రాంప్ట్కి చాలా వివరంగా స్పందిస్తూ, టాప్ 10 డెవలప్డ్ దేశాలు మరియు టాప్ 10 డెవలపింగ్ దేశాల కోసం దేశం-ప్రత్యేక డేటాను పక్కపక్కగా చూపిస్తుంది, తద్వారా చూడటానికి, పోల్చడానికి చాలా సులభంగా ఉంటుంది.ఈ సమాచారాన్ని ఆధారంగా తీసుకొని, వినియోగించదగిన వివరమైన మార్కెట్-ఎంట్రీ సిఫార్సులను అందిస్తుంది.
డీప్ రిసెర్చ్ను విభిన్న డొమైన్లలోని కఠినమైన బ్రౌజింగ్ మరియు రిజనింగ్ టాస్కులపై ఎండ్-టు-ఎండ్ రీఇన్ఫోర్స్మెంట్ లెర్నింగ్ ఉపయోగించి ట్రైన్ చేశారు.ఆ ట్రైనింగ్ ద్వారా, అది అవసరమైన డేటాను కనుగొనడానికి మల్టీ-స్టెప్ ట్రాజెక్టరీని ప్లాన్ చేసి నిర్వహించడం నేర్చుకుంది; అవసరమైనప్పుడు వెనక్కి తిరిగి చూసుకునే సామర్థ్యంతో పాటు, రియల్టైమ్ సమాచారానికి అనుగుణంగా స్పందిస్తుంది.ఈ మోడల్ వినియోగదారులు అప్లోడ్ చేసిన ఫైల్లను బ్రౌజ్ చేయగలదు, python టూల్తో గ్రాఫ్లను ప్లాట్ చేసి పునరావృతంగా మెరుగుపరచగలదు, తయారైన గ్రాఫ్లు మరియు వెబ్సైట్ల నుంచి తీసుకున్న ఇమేజ్లను తన సమాధానాల్లో ఎంబెడ్ చేయగలదు, అలాగే ఉపయోగించిన సోర్సుల్లోని నిర్దిష్ట వాక్యాలు లేదా భాగాలను సైట్ చేయగలదు.ఈ ట్రైనింగ్ ఫలితంగా, నిజ జీవిత సమస్యలపై దృష్టి పెట్టిన అనేక పబ్లిక్ ఈవాల్యుయేషన్లలో ఇది కొత్త రికార్డు స్థాయిలను చేరుకుంది.
Humanity’s Last Exam(కొత్త విండోలో తెరుచుకుంటుంది) అనే తాజాగా విడుదలైన ఈవాల్యుయేషన్లో—ఇది విస్తృతమైన అంశాల్లోని ఎక్స్పర్ట్-లెవల్ ప్రశ్నలపై AI సామర్థ్యాన్ని పరీక్షిస్తుంది—డీప్ రిసెర్చ్ను నడిపించే మోడల్ 26.6% యాక్యురసీతో కొత్త రికార్డు స్థాయిని సాధించింది.ఈ పరీక్షలో 100 కి పైగా విషయాలలో 3,000 కు పైగా మల్టిపుల్ చాయిస్ మరియు షార్ట్ ఆన్సర్ ప్రశ్నలు ఉంటాయి, భాషాశాస్త్రం నుంచి రాకెట్ సైన్స్, క్లాసిక్స్ నుంచి పర్యావరణ శాస్త్రం వరకు. OpenAI o1 తో పోలిస్తే, అత్యధిక పురోగతి రసాయన శాస్త్రం, హ్యూమానిటీస్, సోషల్ సైన్సెస్, గణితంలో కనిపించింది. డీప్ రిసెర్చ్ను నడిపించే మోడల్, అవసరమైనప్పుడు ప్రత్యేకమైన సమాచారాన్ని సమర్థంగా వెతికి కనుగొంటూ, మనిషిలా వ్యవహరించే విధానాన్ని చూపించింది.
| "మోడల్" | ఖచ్చితత్వం (%) |
|---|---|
| GPT-4o | 3.3 |
| Grok-2 | 3.8 |
| Claude 3.5 Sonnet | 4.3 |
| Gemini ఆలోచిస్తోంది | 6.2 |
| OpenAI o1 | 9.1 |
| DeepSeek-R1* | 9.4 |
| OpenAI o3-mini (మధ్యస్థం)* | 10.5 |
| OpenAI o3-mini (అధికం)* | 13.0 |
| OpenAI లోతైన పరిశోధన** | 26.6 |
GAIA(కొత్త విండోలో తెరుచుకుంటుంది)1 అనే పబ్లిక్ బెంచ్మార్క్లో—ఇది నిజ జీవిత ప్రశ్నలపై AI సామర్థ్యాన్ని మౌల్యాంకనం చేస్తుంది—డీప్ రిసెర్చ్ను నడిపించే మోడల్ కొత్త స్టేట్ ఆఫ్ ది ఆర్ట్ (SOTA) స్థాయిని చేరి, బాహ్య లీడర్బోర్డ్(కొత్త విండోలో తెరుచుకుంటుంది)లో అగ్రస్థానాన్ని సాధించింది.మూడు స్థాయిల కఠినతను కవర చేసే ఈ ప్రశ్నలను విజయవంతంగా పూర్తి చేయడానికి రిజనింగ్, మల్టీమోడల్ ఫ్లూయెన్సీ, వెబ్ బ్రౌజింగ్, మరియు టూల్-యూజ్ ప్రొఫిషియెన్సీ వంటి సామర్థ్యాలు అవసరం.
| GAIA | ||||
|---|---|---|---|---|
| లెవల్ 1 | స్థాయి 2 | లెవెల్ 3 | సగటు | |
| గత SOTA(కొత్త విండోలో తెరుచుకుంటుంది) | 67.92 | 67.44 | 42.31 | 63.64 |
| డీప్ రీసెర్చ్ (pass@1) | 74.29 | 69.06 | 47.6 | 67.36 |
| లోతైన పరిశోధన (cons@64) | 78.66 | 73.21 | 58.03 | 72.57 |
GAIA టాస్క్ ఉదాహరణలు
అనేక రంగాలలోని ఎక్స్పర్ట్-లెవల్ టాస్కులపై చేసిన అంతర్గత ఈవాల్యుయేషన్లో, డొమైన్ నిపుణులు డీప్ రిసెర్చ్ను కఠినమైన, చేతితో చేసే పరిశోధన పనులను అనేక గంటల పాటు ఆటోమేట్ చేసిన వ్యవస్థగా రేటింగ్ ఇచ్చారు.
పాస్ రేట్ vs గరిష్ఠ టూల్ కాల్స్
నిపుణుల స్థాయి పనుల ఉదాహరణలు
అంచనా ఆర్థిక విలువ ఆధారంగా నిపుణుల స్థాయి పనులపై పాస్ రేట్
అంచనా గంటల ఆధారంగా నిపుణుల స్థాయి పనులపై పాస్ రేట్
డీప్ రీసెర్చ్ ముఖ్యమైన కొత్త సామర్థ్యాలను అందిస్తుంది, కానీ ఇది ఇంకా ప్రారంభ దశలో ఉంది మరియు పరిమితులు ఉన్నాయి.ఇంటర్నల్ ఈవాల్యుయేషన్స్ ప్రకారం, ఇది సమాధానాల్లో కొన్ని సార్లు వాస్తవాలను హాల్యూసినేట్ చేయవచ్చు లేదా తప్పు నిర్దారణలు చేయవచ్చు, అయితే ప్రస్తుత ChatGPT మోడల్స్ కంటే గణనీయంగా తక్కువ రేట్లో.ఇది అధికారిక సమాచారాన్ని అనుమానాల నుండి భేదించడం లో కష్టపడవచ్చు, మరియు ప్రస్తుతానికి కాన్ఫిడెన్స్ క్యాలిబ్రేషన్లో బలహీనతను చూపుతుంది, చాలాసార్లు అస్పష్టతను ఖచ్చితంగా తెలియజేయడంలో విఫలమవుతుంది.లాంచ్ సమయంలో, రిపోర్ట్స్ మరియు సిటేషన్స్లో చిన్న ఫార్మాటింగ్ లోపాలు ఉండవచ్చు, మరియు టాస్క్లు ప్రారంభమవడానికి ఎక్కువ సమయం పడవచ్చు.మేము ఈ సమస్యలన్నీ మరింత ఉపయోగం మరియు సమయం పెరుగుతుండడంతో త్వరగా మెరుగుపడతాయని ఆశిస్తున్నాము.
ChatGPTలో డీప్ రీసెర్చ్ ప్రస్తుతానికి చాలా కంప్యూట్-ఇంటెన్సివ్.ఒక క్వెరీని రీసెర్చ్ చేయడానికి ఎక్కువ సమయం తీసుకుంటే, అంతకంతా ఇన్ఫరెన్స్ కంప్యూట్ ఎక్కువగా అవసరం అవుతుంది.మేము ఈ రోజు Pro users కోసం ఆప్టిమైజ్ చేసిన వెర్షన్తో ప్రారంభిస్తున్నాము, ప్రతి నెలకి 100 క్వెరీల వరకు.తరువాత Plus and Team యూజర్స్కి యాక్సెస్ లభిస్తుంది, తరువాత Enterprise.మేము ఇంకా యూకే, స్విట్జర్లాండ్, మరియు యూరోపియన్ ఎకానామిక్ ఏరియాలో యూజర్స్కు యాక్సెస్ అందించే పనిలో ఉన్నాము.
ప్రతీ పేడ్ యూజర్ త్వరలో మరింత వేగవంతమైన, ఖర్చు పరంగా సమర్థవంతమైన వెర్షన్ని విడుదల చేసినప్పుడు గణనీయంగా ఎక్కువ రేట్ లిమిట్స్ పొందతారు, ఇది చిన్న మోడల్ ద్వారా పనిచేస్తూ ఇంకా ఉన్నతమైన ఫలితాలను అందిస్తుంది.
రాబోయే వారాలు మరియు నెలలలో, మేము సాంకేతిక ఇన్ఫ్రాస్ట్రక్చర్పై పని చేస్తూ, ప్రస్తుత రిలీజ్ని సమీపంగా మానిటర్ చేస్తూ, మరింత కఠినమైన పరీక్షలను నిర్వహిస్తున్నాము.ఇది మేము అనుసరిస్తున్న ఇటరేటివ్ డిప్లాయ్మెంట్ సూత్రానికి అనుగుణంగా ఉంటుంది.అన్ని సేఫ్టీ చెక్స్ మాకు నిర్దేశించిన రిలీజ్ స్టాండర్డ్స్ను కొనసాగిస్తే, మేము దాదాపు ఒక నెలలో Plus యూజర్స్కు డీప్ రీసెర్చ్ను విడుదల చేయనున్నాము.
డీప్ రిసెర్చ్ ఈ రోజు ChatGPT వెబ్ సంస్కరణలో అందుబాటులో ఉంది, మరియు ఈ నెలలో మొబైల్ మరియు డెస్క్టాప్ యాప్లకు దశలవారీగా విడుదల అవుతుంది.ప్రస్తుతం, డీప్ రిసెర్చ్ ఓపెన్ వెబ్ను మరియు మీరు అప్లోడ్ చేసిన ఫైళ్లను యాక్సెస్ చేయగలదు. భవిష్యత్తులో, మీరు మరింత ప్రత్యేకమైన డేటా సోర్సులకు కనెక్ట్ అయ్యే అవకాశం ఉంటుంది. దీతో సబ్స్క్రిప్షన్ ఆధారిత లేదా అంతర్గత రిసోర్సులకు యాక్సెస్ విస్తరించి, దాని అవుట్పుట్ను ఇంకా బలంగా మరియు వ్యక్తిగతీకరించిన విధంగా పొందగలుగుతారు.
ముందు చూస్తే, అసింక్రోనస్గా నిజ జీవిత పరిశోధన మరియు పనుల నిర్వహణ కోసం పనిచేసే ఎజెంటిక్ అనుభవాలు ChatGPTలో ఒకేచోట చేరే భవిష్యత్తును మేము ఊహిస్తున్నాము.అసింక్రోనస్గా ఆన్లైన్ పరిశోధన చేయగల డీప్ రిసెర్చ్ మరియు నిజ జీవితంలో చర్యలు తీసుకునే Operator కలయికతో, ChatGPT మీ కోసం ఇంకా క్లిష్టమైన పనులను నిర్వహించగలదు.
ఫిబ్రవరి 3, 2025 అడెండమ్: డీప్ రీసెర్చ్ని పవర్ చేసే o3 ప్రారంభ వెర్షన్పై మేము కఠినమైన సేఫ్టీ టెస్టింగ్, ప్రిపేర్డ్నెస్ ఇవాల్యుయేషన్స్, మరియు గవర్నెన్స్ రివ్యూలు నిర్వహించాం, దీనిని Medium(కొత్త విండోలో తెరుచుకుంటుంది) రిస్క్గా గుర్తించాం. డీప్ రీసెర్చ్ వెబ్ బ్రౌజ్ చేసే సామర్థ్యంతో వచ్చే ఇన్క్రిమెంటల్ రిస్క్లను అర్థం చేసుకోవడానికి మేము అదనపు సేఫ్టీ టెస్టింగ్ కూడా చేసాము, అలాగే కొత్త మిటిగేషన్స్ని జోడించాము. ప్రస్తుత లిమిటెడ్ రిలీజ్ను మేము పూర్తిగా టెస్ట్ చేసి, దగ్గరగా మానిటర్ చేయడం కొనసాగిస్తాము. Plus యూజర్లకు యాక్సెస్ను విస్తరించినప్పుడు, డీప్ రీసెర్చ్ కోసం మా సేఫ్టీ ఇన్సైట్స్ మరియు సేఫ్గార్డ్స్ని ఒక సిస్టమ్ కార్డ్లో షేర్ చేస్తాము.
ఫుట్ నోట్స్
- 1
ఈ డేటాసెట్ కోసం గ్రౌండ్-ట్రూత్ సమాధానాలు విస్తృతంగా ఆన్లైన్లో లీక్ అయ్యాయని మేము గుర్తించాము, మరియు మోడల్ను న్యాయసమ్మతంగా మూల్యాంకన చేయడానికి అనుగుణంగా కొన్ని వెబ్సైట్లు లేదా URLలను బ్లాక్ చేశాము.
రచయితలు
రిసెర్చ్ లీడ్స్
Isa Fulford, Zhiqing Sun
మౌలిక సహకారులు
Alex Tachard Passos, Alexandra Barr, Allison Tam, Charlotte Cole, Hyung Won Chung, Jason Wei, Jon Blackman, Scott Mayer McKinney, Valerie Qi
ప్రాధాన్య సహకారులు
రీసెర్చ్
Elaine Ya Le, Eric Mitchell, Eric Wallace, Hyung Won Chung, Ignasi Clavera, Leo Liu, Lorenz Kuhn, Louis Feuvrier, Max Schwarzer, Saachi Jain, Scottie Yan, Shunyu Yao, Vitchyr Pong
విస్తరణ
Carpus Chang, Harry Zhao, Joseph Trasatti, Joshua Dickens, Matt Kaufer, Mike Trpcic, Minnia Feng, Neel Ajjarapu, Peter Vidani, Sean Fitzgerald
సహకారులు
రీసెర్చ్
Ahmed El-Kishky, AJ Ostrow, Alexander Wei, Andrei Gheorghe, Andrew Kondrich, Andrey Mishchenko, Anuj Nair, Behrooz Ghorbani, Brydon Eastman, Chak Li, Foivos Tsimpourlas, Francis Song, Giambattista Parascandolo,Gildas Chabot, Hessam Bagherinezhad, Haitang Hu, Hongyu Ren, Henry Aspegren, Hunter Lightman, Ilya Kostrikov, Ilge Akkaya, James Lennon, Jean Harb, Jonathan Ward, Kai Chen, Katy Shi, Kevin Liu, Kevin Yu, Manuka Stratta, Marvin Zhang, Mengyuan Yan, Mostafa Rohaninejad, Noam Brown, Phoebe Thacker, Raz Goan, Reah Miyara, Spencer Papay, Taylor Gordon, Wenda Zhou, Wenlei Xie, Yash Patil, Yann Dubois, Youlong Cheng, Yushi Wang, Wyatt Thompson
+ o3 కి సహకరించిన వారందరూ
భద్రతా వ్యవస్థలు
Adam Kalai, Alex Beutel, Andrea Vallone, Andy Applebaum, David Robinson, Elizabeth Proehl, Evan Mays, Grace Zhao, Irina Kofman, Jason Phang, Joaquin Quinonero Candela, Joel Parish, Kevin Liu, Kristen Ying, Lama Ahmad, Leon Maksin, Leyton Ho, Meghan Shah, Michele Wang, Miles Wang, Phillip Guo, Olivia Watkins, Owen Campbell-Moore, Patrick Chao, Sam Toizer, Samuel Miserendino, Sandhini Agarwal, Tejal Patwardhan, Tina Sriskandarajah, Troy Peterson, Yaodong Yu, Yunyun Wang
విస్తరణ
Adam Koppel, Adam Wells, Adele Li, Andy Applebaum, Andrey Malevich, Andrew Duberstein, Andrew Howell, Anton Tananaev, Ashley Tyra, Brandon Walkin, Bryan Ashley, Cary Bassin, Cary Hudson, Cory Decareaux, Cristina Scheau, Derek Chen, Dibya Bhattacharjee, Drea Lopez, Eric Antonow, Eric Burke, Filippo Raso, Fotis Chantzis, Freddie Sulit, Harris Cohen, Heather Whitney, Jay Dixit, Jeffrey Han, Jen Robinson, Jessica Shieh, Joel Parish, Kan Wu, Kevin Gladstone, Kshitij Wadhwa, Leo Vandriel, Leyton Ho, Liang Chen, Madeline Christian, Mamie Rheingold, Matt Jones, Michelle Fradin, Mike McClay, Mingxuan Wang, Nacho Soto, Niko Felix, Patrick Delaney, Paul McMillan, Philip Pronin, Rodrigo Riaza Perez, Samuel Miserendino, Scott Ethersmith, Steven Baldwin, Thomas Dimson, Tomo Hiratsuka, Yaming Lin, Yara Khakbaz, Yining Chen
నాయకత్వం
Akshay Nathan, Greg Brockman, Hannah Wong, Jakub Pachocki, Jerry Tworek, Johannes Heidecke, Josh Tobin, Liam Fedus, Mark Chen, Mia Glaese, Nick Turley, Sam Altman, Wojciech Zaremba