معرفی Codex
یک عامل مهندسی نرمافزار مبتنی بر ابر که میتواند به صورت موازی روی بسیاری از وظایف کار کند و توسط Codex-1 پشتیبانی میشود. این قابلیت امروز برای کاربران ChatGPT Pro، Business و Enterprise و به زودی برای کاربران Plus در دسترس خواهد بود.

بهروزرسانی در 3 ژوئن 2025: Codex اکنون برای کاربران ChatGPT Plus در دسترس است. ما همچنین به کاربران این امکان را میدهیم که در طول اجرای وظیفه، به Codex دسترسی به اینترنت ارائه دهند. لطفاً برای جزئیات بیشتر به (در یک پنجره جدید باز میشود)گزارش تغییرات(در یک پنجره جدید باز میشود) و اسناد مراجعه کنید.
امروز یک پیشنمایش تحقیقاتی از Codex را معرفی میکنیم: یک عامل مهندسی نرمافزار ابری که میتواند بهطور همزمان روی بسیاری از وظایف کار کند. Codex میتواند وظایفی مانند نوشتن ویژگیها، پاسخ به سوالات درباره کدبیسات، رفع اشکالات و پیشنهاد درخواستهای پول برای بررسی را برایت انجام دهد؛ هر وظیفه در محیط سندباکس ابری مخصوص به خود، که از قبل با مخزنات بارگذاری شده است، اجرا میشود.
Codex توسط codex-1، نسخهای از OpenAI o3 که برای مهندسی نرمافزار بهینهسازی شده است، قدرت میگیرد. این برنامه با استفاده از یادگیری تقویتی در وظایف کدنویسی دنیای واقعی در محیطهای مختلف آموزش دیده است تا کدی تولید کند که به دقت سبک انسانی و ترجیحات PR را منعکس کند، به طور دقیق به دستورالعملها پایبند باشد و بتواند به صورت تکراری تستها را اجرا کند تا نتیجه قبولی بگیرد. ما امروز شروع به عرضه Codex برای کاربران ChatGPT Pro، Enterprise و Business کردهایم و به زودی پشتیبانی برای Plus و Edu ارائه خواهد شد.
امروزه میتوانید از طریق نوار کناری در ChatGPT به Codex دسترسی پیدا کنید و با تایپ کردن یک اعلان و کلیک روی «Code»، وظایف کدنویسی جدیدی را به آن اختصاص دهید. اگر میخوای از Codex درباره کدبیس خودت سوالی بپرسی، روی «پرسیدن» کلیک کن. هر وظیفه به طور مستقل در یک محیط جداگانه و ایزوله که از قبل با کدبیست بارگذاری شده است، پردازش میشود. Codex میتواند فایلها را بخواند و ویرایش کند و همچنین دستوراتی مانند تست هارنسها، لینترها و بررسیکنندههای نوع را اجرا کند. تکمیل کار معمولاً بسته به پیچیدگی بین 1 تا 30 دقیقه طول میکشد و شما میتوانید پیشرفت Codex را به صورت لحظهای رصد کنید.
به محض اینکه Codex یک وظیفه را تکمیل کند، تغییراتش را در محیط خود ثبت میکند. Codex شواهد قابل تأییدی از اقدامات خود را از طریق استناد به گزارشهای ترمینال و خروجیهای تست ارائه میدهد و به تو امکان میدهد هر مرحلهای را که در طول تکمیل کار انجام میشود، ردیابی کنی. بعد میتونی نتایج رو بررسی کنی، درخواست اصلاحات بیشتری بدی، یک درخواست pull از GitHub باز کنی یا تغییرات رو مستقیماً در محیط محلی خودت ادغام کنی. در این محصول، میتونی محیط Codex رو طوری پیکربندی کنی که تا حد امکان با محیط توسعه واقعیت مطابقت داشته باشه.
Codex میتواند توسط فایلهای AGENTS.md که در مخزن شما قرار دارند هدایت شود. اینها فایلهای متنی هستند، مشابه README.md، جایی که میتونی به Codex بگی چطور کدبیست رو پیمایش کنه، چه دستورات رو برای تست اجرا کنه و چطور به بهترین شکل به شیوههای استاندارد پروژهت پایبند باشه. مانند توسعهدهندگان انسانی، عاملهای Codex بهترین عملکرد را زمانی دارند که محیطهای توسعه پیکربندیشده، تنظیمات تست قابل اعتماد و مستندات واضح در اختیارشان باشد.
در ارزیابیهای کدنویسی و بنچمارکهای داخلی، codex-1 حتی بدون فایلهای AGENTS.md یا scaffolding سفارشی، عملکرد قویای را نشان میدهد.
23 نمونه تأیید شده SWE-Bench که روی زیرساخت داخلی ما قابل اجرا نبودند، حذف شدند. codex-1 در حداکثر طول زمینه 192 هزار token و «تلاش استدلال» متوسط آزمایش شد، که تنظیمی است که امروز در محصول موجود خواهد بود. برای جزئیات ارزیابیهای o3، اینجا را مشاهده کن.
معیار وظایف داخلی SWE ما مجموعهای گزینششده از وظایف واقعی داخلی SWE در OpenAI است.
ما Codex را به عنوان یک پیشنمایش تحقیقاتی، مطابق با استراتژی استقرار تکراریمان، منتشر میکنیم. ما هنگام طراحی Codex، امنیت و شفافیت را در اولویت قرار دادیم تا کاربران بتوانند خروجیهای آن را تأیید کنند - حفاظتی که با توجه به اینکه مدلهای هوش مصنوعی وظایف کدنویسی پیچیدهتری را به طور مستقل انجام میدهند و ملاحظات ایمنی تکامل مییابند، اهمیت آن به طور فزایندهای افزایش مییابد. کاربران میتوانند کار Codex را از طریق استنادها، گزارشهای ترمینال و نتایج آزمایش بررسی کنند. در صورت عدم اطمینان یا مواجهه با شکستهای آزمایشی، عامل Codex به صراحت این مسائل را بیان میکند و کاربران را قادر میسازد تا در مورد نحوه ادامه کار، تصمیمات آگاهانهای بگیرند. هنوز هم برای کاربران ضروری است که قبل از ادغام و اجرا، تمام کدهای تولید شده توسط عامل را به صورت دستی بررسی و اعتبارسنجی کنند.


هدف اصلی در آموزش codex-1، همسو کردن دقیق خروجیها با ترجیحات و استانداردهای کدگذاری انسانی بود. در مقایسه با OpenAI o3، codex-1 به طور مداوم پچهای تمیزتری تولید میکند که برای بررسی فوری توسط انسان و ادغام در گردشهای کاری استاندارد آماده هستند.
محافظت در برابر برنامههای مخرب مهندسی نرمافزار مبتنی بر هوش مصنوعی، مانند توسعه بدافزار، به طور فزایندهای حیاتی است. در عین حال، مهم است که اقدامات حفاظتی، مانع بیمورد برنامههای قانونی و سودمند نشوند که ممکن است شامل تکنیکهایی باشند که گاهی اوقات برای توسعه بدافزار نیز استفاده میشوند، مانند مهندسی هسته در سطح پایین.
برای ایجاد تعادل بین ایمنی و سودمندی، Codex آموزش داده شد تا درخواستهای مربوط به توسعه نرمافزارهای مخرب را شناسایی و دقیقاً رد کند، در عین حال وظایف مشروع را به وضوح تشخیص داده و از آنها پشتیبانی کند. ما همچنین چارچوبهای سیاستگذاری خود را بهبود داده و ارزیابیهای ایمنی دقیقی را برای تقویت مؤثر این مرزها به کار گرفتهایم. ما ضمیمهای به کارت سیستم o3 منتشر کردهایم تا این ارزیابیها را منعکس کنیم.
عامل Codex بهطور کامل در یک محفظه امن و ایزوله در فضای ابری فعالیت میکند. در طول اجرای وظیفه، دسترسی به اینترنت غیرفعال میشود و تعامل عامل فقط به کدی که بهطور صریح از طریق مخازن GitHub و وابستگیهای از پیش نصبشده که توسط کاربر از طریق یک اسکریپت راهاندازی پیکربندی شدهاند، محدود میشود. عامل نمیتواند به وبسایتهای خارجی، APIها یا سرویسهای دیگر دسترسی پیدا کند.
تیمهای فنی در OpenAI شروع به استفاده از Codex به عنوان بخشی از ابزارهای روزانهشان کردهاند. اغلب مهندسان OpenAI از آن برای واگذاری وظایف تکراری و با دامنه مشخص، مانند بازسازی، تغییر نام و نوشتن تستها، که در غیر این صورت تمرکز را از بین میبرد، استفاده میکنند. به همان اندازه برای ایجاد ویژگیهای جدید، سیمکشی اجزا، رفع اشکالات و پیشنویس مستندات مفید است. تیمها در حال ایجاد عادات جدیدی پیرامون آن هستند: اولویتبندی مشکلات در حالت آمادهباش، برنامهریزی وظایف در ابتدای روز و کاهش حجم کارهای پسزمینه برای ادامه حرکت. با کاهش تغییر زمینه و نمایش کارهای فراموششده، Codex به مهندسان کمک میکند تا سریعتر پروژهها را تحویل دهند و روی آنچه از همه مهمتر است تمرکز کنند.
پیش از انتشار، ما همچنین با گروه کوچکی از آزمایشکنندگان خارجی همکاری کردهایم تا درک بهتری از عملکرد Codex در پایگاههای کد متنوع، فرآیندهای توسعه و تیمها داشته باشیم.
- Cisco(در یک پنجره جدید باز میشود) در حال بررسی این است که چگونه Codex میتواند به تیمهای مهندسی آنها کمک کند تا ایدههای بلندپروازانه را سریعتر به واقعیت تبدیل کنند. سیسکو به عنوان شرکای اولیه طراحی، با ارزیابی Codex برای موارد استفاده در دنیای واقعی در سراسر سبد محصولات خود و ارائه بازخورد به Team OpenAI، به شکلدهی آینده آن کمک میکند.
- Temporal(در یک پنجره جدید باز میشود) از Codex برای تسریع در توسعه ویژگیها، رفع اشکال، نوشتن و اجرای تستها و بازسازی کدهای بزرگ استفاده میکند. همچنین با اجرای وظایف پیچیده در پسزمینه به آنها کمک میکند تا متمرکز بمانند - مهندسان را در جریان کار نگه میدارد و سرعت تکرار را افزایش میدهد.
- Superhuman(در یک پنجره جدید باز میشود) از Codex برای سرعت بخشیدن به کارهای کوچک اما تکراری مانند بهبود پوشش تست و رفع خطاهای ادغام استفاده میکند. همچنین با قادر ساختن مدیران محصول به اعمال تغییرات سبک در کد بدون نیاز به دخالت مهندس، به جز برای بررسی کد، به آنها کمک میکند تا سریعتر محصول را تحویل دهند.
- Kodiak(در یک پنجره جدید باز میشود) از Codex برای کمک به نوشتن ابزارهای اشکالزدایی، بهبود پوشش تست و بازسازی کد استفاده میکند - که توسعه درایور کدیاک، فناوری رانندگی خودکارشان را تسریع میکند. Codex همچنین به یک ابزار مرجع ارزشمند تبدیل شده است که به مهندسان کمک میکند تا با نمایش زمینههای مرتبط و تغییرات گذشته، بخشهای ناآشنای پشته را درک کنند.
بر اساس آموختههای آزمایشکنندگان اولیه، توصیه میکنیم وظایف با دامنهی مشخص را به طور همزمان به چندین عامل اختصاص دهید و انواع مختلف وظایف و دستورالعملها را آزمایش کنید تا قابلیتهای مدل را به طور مؤثر بررسی کنید.
ماه گذشته، ما Codex CLI را راهاندازی کردیم، یک عامل کدنویسی متنباز سبک که در ترمینال شما اجرا میشود. این قدرت مدلهایی مانند o3 و o4-mini را به گردش کار محلیات میآورد و جفت شدن با آنها را برای انجام سریعتر وظایف آسان میکند.
امروز، ما همچنین نسخه کوچکتری از codex-1، نسخهای از o4-mini که بهطور خاص برای استفاده در Codex CLI طراحی شده است، را منتشر میکنیم. این مدل جدید از گردشهای کاری سریعتر در CLI پشتیبانی میکند و برای پرسش و پاسخ و ویرایش کد با تأخیر کم بهینه شده است، در حالی که همان نقاط قوت در پیروی از دستورالعملها و سبک را حفظ میکند. اکنون بهعنوان مدل پیشفرض در Codex CLI و در API با نام codex-mini-latest در دسترس است. همزمان با بهبود مدل Codex-mini، اسنپشات مربوطه مرتباً بهروزرسانی خواهد شد.
ما همچنین اتصال حساب توسعهدهندهات به Codex CLI را بسیار آسانتر کردهایم. به جای تولید و پیکربندی دستی یک token، اکنون میتونی با حساب ChatGPT خودت وارد بشی و سازمان API مورد نظرت رو انتخاب کنی. ما بهطور خودکار کلید API را برایت تولید و پیکربندی میکنیم. کاربران Plus و Pro که با ChatGPT وارد Codex CLI میشوند، میتوانند به ترتیب ۵ و ۵۰ دلار اعتبار API رایگان را از اواخر امروز به مدت ۳۰ روز آینده دریافت کنند.
از امروز، ما Codex را برای کاربران ChatGPT Pro، Enterprise و Business در سراسر جهان عرضه میکنیم و به زودی پشتیبانی برای Plus و Edu ارائه خواهد شد. کاربران در هفتههای آینده بدون هیچ هزینه اضافی به امکانات گسترده دسترسی خواهند داشت، بنابراین میتونی قابلیتهای Codex رو بررسی کنی. پس از آن، ما دسترسی با محدودیت نرخ و گزینههای قیمتگذاری انعطافپذیر را ارائه خواهیم داد که بهت امکان میده در صورت نیاز، حجم بیشتری از خدمات رو خریداری کنی. ما قصد داریم به زودی دسترسی کاربران Plus و Edu را گسترش دهیم.
برای توسعهدهندگانی که با codex-mini-latest کار میکنند، این مدل در API پاسخها (Respons) موجود است و قیمت آن 1.50 دلار برای هر 1 میلیون توکن ورودی و 6 دلار برای هر 1 میلیون توکن خروجی است، با 75% تخفیف در ذخیرهسازی سریع.
Codex هنوز در مراحل اولیه توسعه است. به عنوان یک پیشنمایش تحقیقاتی، در حال حاضر فاقد ویژگیهایی مانند ورودی تصویر برای کارهای فرانتاند و قابلیت اصلاح مسیر عامل در حین کار است. علاوه بر این، سپردن کارها به یک عامل از راه دور بیشتر از ویرایش تعاملی زمان میبرد، که ممکن است به کمی عادت نیاز داشته باشد. با گذشت زمان، تعامل با عوامل Codex به طور فزایندهای شبیه همکاری ناهمزمان با همکاران میشود. با پیشرفت قابلیتهای مدل، انتظار داریم که عاملها وظایف پیچیدهتری را در دورههای طولانیتر انجام دهند.
ما آیندهای را تصور میکنیم که توسعهدهندگان کارهایی را که میخواهند مالک شوند هدایت میکنند و بقیه را به عوامل واگذار میکنند تا با هوش مصنوعی سریعتر حرکت کنند و بهرهوری بیشتری داشته باشند. برای دستیابی به این هدف، ما در حال ساخت مجموعهای از ابزارهای Codex هستیم که هم از همکاری در زمان واقعی و هم از واگذاری ناهمزمان پشتیبانی میکنند.
همکاری با ابزارهای هوش مصنوعی مانند Codex CLI و دیگر ابزارها به سرعت به یک استاندارد صنعتی تبدیل شده است و به توسعهدهندگان کمک میکند تا هنگام کدنویسی سریعتر عمل کنند. اما ما باور داریم که گردش کار ناهمزمان و چند عاملۀ که توسط Codex در ChatGPT معرفی شده است، به روش استاندارد مهندسان برای تولید کد با کیفیت بالا تبدیل خواهد شد.
در نهایت، میبینیم که این دو حالت تعامل - جفتسازی بلادرنگ و واگذاری وظایف - به هم نزدیک میشوند. توسعهدهندگان با عوامل هوش مصنوعی در سراسر IDEها و ابزارهای روزمره خود همکاری خواهند کرد تا سوال بپرسند، پیشنهادات دریافت کنند و کارهای طولانیتر را به آنها بسپارند، همه در یک گردش کار یکپارچه.
با نگاه به آینده، قصد داریم گردشهای کاری تعاملیتر و انعطافپذیرتری را برای عوامل معرفی کنیم. توسعهدهندگان به زودی میتوانند در اواسط کار راهنمایی بدهند، در مورد استراتژیهای پیادهسازی همکاری کنند و بهروزرسانیهای پیشرفت را بهطور پیشگیرانه دریافت کنند. ما همچنین ادغامهای عمیقتری را بین ابزارهایی که از قبل استفاده میکنی، پیشبینی میکنیم: امروزه Codex با GitHub متصل میشود و به زودی میتوانی وظایف را از Codex CLI، ChatGPT Desktop یا حتی ابزارهایی مانند ردیاب مشکل یا سیستم CI خود تعیین کنی.
مهندسی نرمافزار یکی از اولین صنایعی است که افزایش بهرهوری قابل توجهی را با استفاده از هوش مصنوعی تجربه کرده و امکانات جدیدی را برای افراد و تیمهای کوچک فراهم میکند. در حالی که ما نسبت به این دستاوردها خوشبین هستیم، با شرکای خود نیز همکاری میکنیم تا پیامدهای پذیرش گستردهی عاملها را بر گردش کار توسعهدهندگان، توسعه مهارت در بین افراد، سطوح مهارت و مناطق جغرافیایی بهتر درک کنیم.
این تازه اول راه است—و ما مشتاقیم ببینیم شما با Codex چه چیزی میسازید.
پیام سیستم
ما پیام سیستم codex-1 را به اشتراک میگذاریم تا به توسعهدهندگان کمک کنیم رفتار پیشفرض مدل را درک کنند و Codex را برای عملکرد مؤثر در گردشهای کاری سفارشی تنظیم کنند. به عنوان مثال، پیام سیستم codex-1 Codex را تشویق میکند تا تمام آزمایشهای ذکر شده در فایل AGENTS.md را اجرا کند، اما اگر وقتتان کم است، میتوانید از Codex بخواهید که این آزمایشها را نادیده بگیرد.