وقتی در سپتامبر 2025 به تیم مهندسی Codex پیوستم، Codex برای ویندوز هیچ پیادهسازی سندباکس نداشت؛ یعنی کاربران ویندوز هنگام استفاده از عاملهای کدنویسی OpenAI ناچار بودند میان دو گزینه نامطلوب یکی را انتخاب کنند:
- تأیید تقریبا هر فرمانی که یک عامل کدنویسی میخواست اجرا کند (حتی خواندنها)، که هم ناکارآمد بود و هم آزاردهنده. یکی از مزایای اصلی استفاده از Codex این است که لازم نیست همه کارهای خستهکننده را خودتان انجام دهید.
- فعال کردن حالت دسترسی کامل: اجازه دادن به Codex برای اجرای همه فرمانها بدون تأیید یا محدودیت، که اصطکاک را از بین میبرد اما به بهای کاهش نظارت است.
Codex، عامل کدنویسی ما، روی لپتاپهای توسعهدهندگان اجرا میشود—چه از طریق CLI، چه افزونه IDE، یا برنامه دسکتاپ. این عامل، گفتوگویی را میان یک انسان پشت صفحهکلید و یک مدل که در محیط ابری اجرا میشود مدیریت میکند تا استنتاج را انجام دهد.
Codex بهطور پیشفرض با مجوزهای یک کاربر واقعی اجرا میشود؛ یعنی میتواند هر کاری را که کاربر میتواند انجام دهد، انجام دهد. این موضوع قدرتمند و بالقوه خطرناک است. مدل کدنویسی ممکن است به محیط اجرا بگوید فرمانهایی را بهصورت محلی اجرا کند؛ از اجرای آزمونها گرفته تا خواندن یا ویرایش یک فایل یا ساختن یک شاخه Git. بنابراین حالت پیشفرض Codex تلاش میکند تعادل مناسبی میان کارآمدی و ایمنی پیدا کند. این حالت پیشفرض به Codex اجازه میدهد تقریبا در هر جایی فایلها را بخواند و در فضای کاری شما (یعنی پوشهای که Codex را در آن اجرا میکنید) فایل بنویسد، و مگر آنکه خودتان بخواهید، به اینترنت دسترسی نداشته باشد. برای اعمال خودکار این محدودیتها بر نوشتن فایل و دسترسی شبکه در چارچوبی امن، Codex به یک محیط سندباکس نیاز دارد که واقعا این محدودیتها را اعمال کند.
سندباکس محیطی محدودشده برای اجرا است. وقتی یک توسعهدهنده از Codex استفاده میکند، سیستمعامل رایانه او فرمانی را با مجوزهای کاهشیافته اجرا میکند و آن محدودیتها در سراسر درخت فرایند ادامه پیدا میکنند. هر فرمان Codex از همان ابتدا در محیطی سندباکس اجرا میشود، و هر فرایند زیرمجموعه در همان محدوده باقی میماند.
Codex برای پیادهسازی یک سندباکس مؤثر به قابلیتهای ایزولهسازی نیاز دارد که توسط سیستمعامل رایانه اعمال شوند. برخی سیستمعاملها ابزارهایی دارند که این کار را بهخوبی انجام میدهند (مثلا Seatbelt در MacOs، یا seccomp و bubblewrap در لینوکس)؛ اما ویندوز در حال حاضر این نوع قابلیت را بهصورت آماده ارائه نمیکند.
برای اینکه استفاده از Codex در ویندوز مانند جاهای دیگر امن و خوشایند باشد، باید سندباکس خودمان را پیادهسازی میکردیم.
ویندوز چند ابزار و سازوکار ابتدایی برای ایزولهسازی ارائه میکند. با اینکه هیچکدام دقیقا با نیازهای ما منطبق نبودند، چند راهحل بالقوه را بررسی کردیم—یعنی AppContainer، سندباکس ویندوز و برچسبگذاری Mandatory Integrity Control.
AppContainer
- چیست: AppContainer، سندباکس بومی ویندوز است؛ یک مدل ایزولهسازی مبتنی بر قابلیت که برای برنامههایی ساخته شده که از قبل دقیقا میدانند به چه چیزهایی نیاز به دسترسی دارند.
- چرا: جذاب است، چون بهجای اینکه فقط تلاش خود را بکند محدودیتهایی ایجاد کند، یک مرز واقعی در سطح سیستمعامل ارائه میکند.
- چرا نه: Codex یک برنامه با دامنه بسیار محدود و مشخص نیست. این قابلیت جریانهای کاری باز توسعهدهندگان را پیش میبرد: پوستهها، Git، Python، مدیران بسته، ابزارهای ساخت، و هر باینری دیگری که عامل تشخیص دهد به آن نیاز دارد. در عمل، همین باعث شد AppContainer تناسب لازم را با آن مسئله نداشته باشد. این ایزولهسازی قوی بود، اما برای دستهای بسیار محدودتر از بارهای کاری نسبت به «اجازه دادن به یک عامل برای عمل کردن مانند یک توسعهدهنده».
ویندوز سندباکس
- چیست: ویندوز سندباکس یک ماشین مجازی سبک و یکبارمصرف از مایکروسافت است. یک دسکتاپ تازه ویندوز با یک مرز ایزولهسازی قوی در اختیار میگیرید و هر کاری که داخل آن انجام دهید با پایان جلسه از بین میرود.
- چرا: به دلایل واضحی جالب است—از AppContainer با نرمافزارهای دلخواه بسیار سازگارتر است و از منظر امنیت هم محیطی بسیار محکمتر فراهم میکند.
- چرا نه: Codex باید مستقیما روی چکاوت، ابزارها و محیط واقعی کاربر عمل کند، نه داخل یک دسکتاپ جداگانه و موقتی که نیاز به راهاندازی و پلزدن بین میزبان و مهمان داشته باشد. همچنین یک مشکل بنیادین در محصول داشت: ویندوز سندباکس حتی روی SKUهای ویندوز نسخه Home هم در دسترس نیست.
برچسبگذاری یکپارچگی در Mandatory Integrity Control (MIC)
- چیست: ویندوز مفهومی به نام «سطوح یکپارچگی» دارد، مانند پایین، متوسط و بالا، که تعیین میکنند سیستم تا چه اندازه به اشیا و فرایندها اعتماد دارد. قاعده اصلی این است که یک فرایند با یکپارچگی پایینتر نمیتواند در شیئی با سطح یکپارچگی بالاتر بنویسد، حتی اگر ACL (فهرستهای کنترل دسترسی) معمولی در غیر این صورت اجازه آن را بدهد. برای مثال، یک فرایند با سطح یکپارچگی پایین، کمتر قابلاعتماد تلقی میشود؛ بنابراین ویندوز مانع از نوشتن آن در اشیای معمولی با سطح یکپارچگی متوسط میشود، مگر اینکه آن اشیا بهصراحت دوباره برچسبگذاری شده باشند تا این کار را مجاز کنند.
- چرا: MIC روی کاغذ شیک به نظر میرسید—Codex را با یکپارچگی پایین اجرا کنیم، ریشههای قابلنوشتن را با یکپارچگی پایین برچسبگذاری کنیم، و بگذاریم ویندوز ممنوعیت نوشتن در بقیه جاها را اعمال کند. این میتوانست راهکاری بدون نیاز به دسترسی ادمین برایمان فراهم کند که پشتوانهاش یک سازوکار واقعی سیستمعامل باشد.
- چرا نه: مانند ACLها، برچسبهای یکپارچگی سیستم فایل واقعی میزبان را تغییر میدهند، و در این مورد این تغییر معنایی بهویژه گسترده است. علامتگذاری یک فضای کاری با سطح یکپارچگی پایین صرفاً به این معنا نیست که «Codex میتواند اینجا بنویسد.» این موضوع یعنی فرایندهای با سطح یکپارچگی پایین بهطور کلی میتوانند در آنجا بنویسند. در یک ماشین واقعی توسعهدهنده، این کار چکاوت واقعی کاربر را به یک مقصد با سطح یکپارچگی پایین برای میزبان تبدیل میکند؛ ریسکی که بسیار بیشتر از اعطای ACLهای دقیقاً هدفگذاریشده به یک طراحی سندباکس واحد است. حتی اگر ابزارهای توسعهدهنده با سطح یکپارچگی متوسط همچنان کار کنند، مدل اعتماد زیربنایی فضای کاری بهگونهای تغییر کرده است که مهار آن دشوار و توجیه آن دشوارتر است.
بعد از اینکه همه گزینهها را بررسی کردیم و هیچکدام را شروع مناسبی ندانستیم، طراحی راهحل خودمان را آغاز کردیم تا تجربه خوبی از Codex را برای کاربران ویندوز فراهم کنیم.
نخستین نمونه اولیه عملی ما از ترکیبی از مفاهیم و ابزارهای ویندوز برای پیادهسازی جداسازی موردنیازمان استفاده میکرد. از همان ابتدا، یکی از اهداف این بود که این کار بدون نیاز به ارتقای سطح دسترسی انجام شود؛ یعنی Codex نیازی نداشته باشد که فقط برای راهاندازی یا اجرای سندباکس، از کاربر اعلان امتیازهای مدیر را دریافت کند. این به معنای یافتن راهی برای اعمال محدودیتهای معقول بر دو چیز بود: عملیات نوشتن در فایل و دسترسی به شبکه.
اگر اصلا نوشتن فایل را محدود نمیکردیم، با یک مسئله ایمنی روبهرو میشدیم. اگر هم بیش از حد آن را محدود میکردیم، سندباکس به بهرهوری کاربر آسیب میزد و مدام نیاز به تأیید پیدا میکرد. برای حل این مسئله، به دو جزء مهم در ویندوز تکیه کردیم: SIDها (شناسههای امنیتی) و توکنهای با محدودیت نوشتن.
SID یا شناسه امنیتی، هویتی است که ویندوز آن را به مجوزها پیوند میدهد. هر کاربر یک SID دارد، گروهها SID دارند، و حتی یک نشست ورود منفرد نیز SID اختصاصی خودش را دریافت میکند. برای مثال، یک نشست فعلی که کاربر در آن وارد شده است ممکن است SID مانند S-1-5-5-X-Y داشته باشد. شناسه امنیتی (SID) اختصاصیافته به گروه مدیران محلی ممکن است S-1-5-32-544 باشد.
ویندوز همچنین اجازه میدهد SIDهای مصنوعی بسازید که متناظر با یک کاربر واقعی نیستند اما همچنان میتوانند در ACLها (فهرستهای کنترل دسترسی) ظاهر شوند؛ همان ACLهایی که مشخص میکنند چه کسی میتواند فایلها یا پوشههای خاصی را بخواند/بنویسد/اجرا کند. همین باعث میشود SIDها برای سندباکس ما یک سازوکار ابتدایی مفید باشند: میتوانیم SIDهایی بسازیم که منحصرا برای سندباکس مربوط به Codex استفاده شوند، بدون اینکه با چیز دیگری در ماشین تداخل ایجاد کنند.
توکنهای فرایند اشیای امنیتی در ویندوز هستند که هویت و امتیازات یک فرایند در حال اجرا را تعریف میکنند. آنها تعیین میکنند که یک فرایند چه اقداماتی را میتواند انجام دهد. یک توکن دارای محدودیت نوشتن نوع خاصی از توکن فرایند است که باعث میشود ویندوز یک بررسی دسترسی اضافی را روی عملیات نوشتن انجام دهد.
برای اینکه یک عملیات نوشتن موفق شود، دو بررسی باید با موفقیت بگذرند:
- هویت عادی کاربر (مالک توکن) باید اجازه انجام آن را داشته باشد.
- حداقل یکی از SIDهای موجود در فهرست SIDهای محدودشده توکن نیز باید دسترسی گرفته باشد
در عمل، این بررسیها به ما اجازه میدادند با استفاده از ACLها دقیقا مشخص کنیم سندباکس در کجای فایلسیستم میتواند تغییر ایجاد کند؛ چیزی که دقت لازم برای عملیات نوشتن را به ما میداد.
با SIDها و توکنهای محدودشده نوشتاری، سندباکس بدون ارتقای ما اینگونه کار میکرد:
- راهاندازی سندباکس یک SID مصنوعی به نام
سندباکس-نوشتنایجاد میکرد. - به SID
سندباکس-نوشتندسترسی نوشتن، اجرا و حذف داده شده بود تا- دایرکتوری کاری فعلی
- هر
writable_rootsاضافی که درconfig.tomlپیکربندی شده باشد.
- راهاندازی سندباکس صراحتاً دسترسی نوشتن همان SID را به مکانهای «فقطخواندنی درون فضای قابلنوشتن» مانند اینها رد میکرد:
<cwd>/.git<cwd>/.codex<cwd>/.agents
- Codex فرمانها را تحت یک توکن محدودشده نوشتاری اجرا میکرد که فهرست SID محدودشده آن شامل
همه، SID نشست جاری واردشده، و SID مصنوعیسندباکس-نوشتنبود.
این روش عملاً مشکل محدودکردن نوشتن فایل را حل کرد و امیدوارکننده به نظر میرسید. حالا به راهحلی برای محدود کردن دسترسی شبکه در سندباکس نیاز داشتیم.
محدود کردن دسترسی شبکه بخش مهمی از سندباکس است؛ بدون آن، کد مخرب میتواند دادهها را از ماشین به اینترنت خارج کند. چون میخواستیم از نیاز به ارتقای دسترسی پرهیز کنیم، گزینههای محدودی برای مسدودسازی قوی ترافیک شبکه داشتیم. ابزارهایی که میخواستیم استفاده کنیم، مثل فایروال ویندوز، عموما بدون مجوز ادمین قابل نصب نبودند.
بدون فایروال ویندوز بهعنوان یک گزینه، مواردی را که میتوانستیم کنترل کنیم محدود کردیم. ما تلاش کردیم محیط فرزند را برای انواع ابزارهای شبکهای که توسعهدهندگان واقعاً استفاده میکنند، بهگونهای طراحی کنیم که در حالت بسته دچار خطا شود؛ بهطوریکه فرمانهای Git، نصبکنندههای بسته و موارد مشابه در سندباکس با خطا مواجه شوند و کاربر مجبور باشد هرگونه عملیات رو به اینترنت را تأیید کند. ایده این بود که راههای فرار آشکار را مسموم کنیم: ترافیکِ آگاه از پراکسی را به یک نقطه پایان مرده بفرستیم، کاری کنیم ترابری HTTP(S) در Git نیز همین کار را انجام دهد، و کاری کنیم Git از طریق SSH بلافاصله شکست بخورد. علاوه بر این، یک دایرکتوری کوچک denybin را به ابتدای PATH اضافه کردیم و ترتیب PATHEXT را تغییر دادیم تا اسکریپتهای استاب SSH و SCP پیش از باینریهای واقعی فراخوانی شوند.
برای نمونه، اینها چند بازنویسی مشخص محیطی بودند که برای محدود کردن دسترسی شبکه استفاده کردیم:
HTTPS_PROXY=http://127.0.0.1:9ALL_PROXY=http://127.0.0.1:9GIT_HTTPS_PROXY=http://127.0.0.1:9NO_PROXY=localhost,127.0.0.1,::1GIT_SSH_COMMAND=cmd /c exit 1
این کار بخش بزرگی از ترافیک عادی ناشی از ابزارها را میگرفت، اما همچنان فقط حالت مشورتی داشت. یک فرایند میتوانست محیط را نادیده بگیرد، PATH را دور بزند، یا مستقیما سوکت باز کند—بیش از حد پرخطر بود.
مانند هر پیادهسازی نرمافزاری جالبی، اولین نمونه اولیه مزایا و معایبی داشت. با اینکه کار را فقط با چند قابلیت استاندارد ویندوز راه میانداخت، نوشتنهای فایلسیستم را بسیار صریح و دانهریز کنترل میکرد، و بدون ارتقای دسترسی اجرا میشد—در نتیجه نیاز کاربران به پذیرش اعلانهای بیشازحد ارتقا یا ادمین بودن روی ماشین محلیشان را کاهش میداد—اما برخی معایب واقعی داشت که بعضی از آنها باعث شدند نتواند به طراحی نهایی ما تبدیل شود:
- سرعت راهاندازی: اعمال ACLهای فضای کاری بسته به توپولوژی پوشه فضای کاری میتواند پرهزینه باشد.
- ردپا: ما ACLهای واقعی را روی سیستم توسعهدهنده اعمال میکردیم، هرچند این ردپا چندان تهاجمی نیست چون همه ACLهای اعمالشده مربوط به یک SID مصنوعی سفارشی هستند که فقط سندباکس از آن استفاده میکند.
- معناشناسی که تغییر آن دشوار است: اتکا به ACLها برای محدودیتهای مبتنی بر فایل به این معناست که تغییر معناشناسی سندباکس پرهزینه و پیچیده است. در حالی که در macOS، میتوانیم نحوه تولید
.sbplرا بهصورت پویا تغییر دهیم فایلی که برای پیکربندی Seatbelt استفاده میشود، سندباکس ویندوز ممکن است برای تنظیم ACLها به عملیاتی کند و سنگین نیاز داشته باشد. - حفاظت از شبکه ضعیف است. همانطور که پیشتر گفتیم، این رویکرد «advisory» بود، قطعا توسط برخی برنامهها که پشته شبکه خودشان را پیادهسازی میکردند دور زده میشد، و برای مقاومت در برابر کد خصمانه طراحی نشده بود.
سه مسئله اول ذاتا به یک پیادهسازی سندباکس سفارشی مربوط میشوند که برای جریانهای عملمحور به اندازه کافی انعطافپذیر باشد. اما داستان سرکوب شبکه متفاوت بود.
علاوه بر اینکه یک عامل مخرب میتوانست بهراحتی سرکوب شبکه مبتنی بر محیط را دور بزند، مقدار زیادی از کدها/باینریهای خوشنیت هم اگر متغیرهای پروکسی محیط را رعایت نمیکردند، یا کد شبکه مبتنی بر سوکت خودشان را داشتند، آن را دور میزدند. به نظر ما همین نکته برای سرمایهگذاری روی یک حالت سندباکس بهتر کافی بود.
برای بهدست آوردن سرکوب شبکه بهتر، میخواستیم از فایروال ویندوز استفاده کنیم، چون به ما اجازه میدهد ترافیک خروجی شبکه را برای کاربران یا برنامهها مسدود کنیم. متأسفانه، به چند دلیل نمیتوانستیم بهطور مؤثر یک قانون فایروال کاربردی بسازیم که فقط به فرمانهایی اعمال شود که محیط اجرای Codex اجرا میکند:
- ویندوز اجازه نمیدهد یک قانون فایروال با هویت غیراصلی یک توکن محدودشده تطبیق داده شود. این یعنی نمیتوانستیم یک قانون فایروال را برای «هر توکنی که SID ما را در فهرست SID محدودشده خود دارد» اعمال کنیم.
- با اینکه میتوانستیم یک قانون فایروال بسازیم که با یک باینری مشخص تطبیق پیدا کند، این فقط به ما اجازه میداد شبکه
codex.exeرا محدود کنیم. این کار بر فرایندهایی که عامل از طرف کاربر راهاندازی میکند اعمال نمیشود، مانند فرایندهای Git یا Python. - سایر ابعاد تطبیق فایروال نیز ساختار نادرستی داشتند. قوانین در محدوده کاربر، در طراحی بدون ارتقای سطح دسترسی، همچنان با کاربر واقعی ویندوز تطبیق داده میشدند، نه فقط با پردازه فرزند محدودشده. قوانین مبتنی بر مسیر برنامه بیشازحد کلی بودند: میتوانستند
codex.exeیاpython.exeرا بهطور کلی مسدود کنند، اما نه این اجرای خاصpython.exeدر محیط سندباکس. قواعد مبتنی بر پورت یا آدرس نیز اساساً خطمشی کاملاً نادرستی محسوب میشدند. برای مثال، ما نمیخواستیم درگاه ۴۴۳ را مسدود کنیم؛ میخواستیم دسترسی خروجی دلخواه را برای این درخت فرایند محدودشده خاص مسدود کنیم.
برای اعمال یک قانون فایروال بهطور مشخص بر فرمانهای سندباکسشده خود، لازم بود آنها را بهعنوان یک هویت اصلی جداگانه اجرا کنیم، نه بهعنوان کاربر «واقعی». این رویکرد ما را وارد مسیر تازهای کرد؛ مسیری که در آن محدودیت «بدون ارتقای دسترسی» را تعدیل کردیم.
نسخه بعدی سندباکس، که پیادهسازی فعلی ما است، در زمان راهاندازی اولیه به مجوزهای مدیریتی ارتقایافته نیاز دارد. بنابراین از آن با عنوان «سندباکس ارتقایافته» یاد میکنم. در مرزی که Codex یک فرمان را روی سیستم اجرا میکند، سندباکس دارای سطح دسترسی ارتقایافته شبیه سندباکس بدون ارتقای سطح دسترسی به نظر میرسد. این همچنان فرایندهای فرزند را تحت یک توکن محدودشده اجرا میکند—بهطور مشابه، یک توکن write_restricted با همان فهرست SIDهای محدودشده [Everyone, Logon, Synthetic]—بااینحال، هویت اصلی این توکن دیگر کاربر واقعی ویندوز نیست، بلکه یکی از دو کاربر محلی است که خود Codex ایجاد کرده است:
CodexSandboxOffline(کاربری که قوانین فایروال او را هدف میگیرند)CodexSandboxOffline(کاربری که قوانین فایروال او را هدف نمیگیرند)
این جزئیات که ظاهرا کوچک به نظر میرسند، در واقع برای سندباکس، کسانی که میتوانند از آن استفاده کنند، و پیچیدگی راهاندازی و اجرای زماناجرای آن پیامدهای بزرگی دارد.
از نظر بصری شبیه نمونه اولیه بدون ارتقاست، با این تفاوت که قوانین فایروال و یک کاربر اختصاصی ویندوز به آن اضافه شدهاند؛ همان کاربری که عملا فرمانها را اجرا میکند. (البته اضافه شدن این مفاهیم جدید یعنی پیش از آنکه سندباکس بتواند فرمانها را اجرا و از آنها محافظت کند، کارهای راهاندازی بیشتری باید انجام شود.)
طراحی سندباکس بدون ارتقا یک گام راهاندازی ساده داشت، اما آن گام نسبتا کوچک بود:
- در صورت نیاز، یک SID مصنوعی بسازید
- ACLها را برای SID مصنوعی سندباکس-نوشتن اعمال کنید
اما سندباکس ارتقایافته کارهای بیشتری برای انجام دادن دارد.
- ایجاد یک SID مصنوعی، اگر قبلا ساخته نشده
- ایجاد کاربران سندباکس آنلاین و آفلاین، اگر قبلاً ساخته نشدهاند
- ذخیره اعتبارنامههای کاربران تازهساختهشده را بهصورت محلی و رمزگذاری با استفاده از Windows Data Protection API (DPAPI) (رابط برنامهنویسی کاربردی ویندوز) در جایی که کاربران سندباکس واقعا نتوانند آن را بخوانند
- ساختن قوانین فایروالی که همه دسترسی خروجی شبکه را برای کاربر
CodexSandboxOfflineمسدود میکنند یا، اگر از قبل وجود دارند، اعتبارسنجی درستی آنها
در مرحله راهاندازی، یک پیچیدگی اضافی وجود دارد. انتظار میرود سندباکس Codex دسترسی خواندن معادل کاربر واقعی ویندوز داشته باشد. در سندباکس بدون ارتقای سطح دسترسی، که در آن SID اصلی توکن محدودشده همان کاربر ویندوز بود، این امر محقق شد. بااینحال، وقتی موجودیت اصلی به یک کاربر جدید CodexSandbox تبدیل میشود، این امر بدون هزینه به دست نمیآید. بسیاری از دایرکتوریهای مرتبط در ویندوز، مجوزهای خواندن/اجرا را به «کاربران احراز هویتشده» اعطا میکنند. یک نمونه قابل توجه، پوشه نمایه کاربر است. بهطور پیشفرض، کاربران ویندوز نمیتوانند دایرکتوریهای پروفایل سایر کاربران ویندوز را بخوانند، بنابراین حتی خواندن ساده فایلها نیز در بسیاری از سناریوها با شکست مواجه خواهد شد.
برای رفع این مشکل، لایه دیگری به فرایند راهاندازی سندباکس اضافه کردیم—لایهای برای اعطای ACLهای خواندن به کاربران سندباکس در مواردی که چنین ACLهایی ممکن است از قبل وجود نداشته باشند. برای مثال، به برخی از دایرکتوریهای پرکاربرد ویندوز:
C:\Users\<real-user>C:\Windows\C:\Program Files\C:\Program Files (x86)\C:\ProgramData\
چون این فهرست پوشهها از نوع انجام شده با حداکثر تلاش و بدون قطعیت است و نصب ACL روی تکتک آنها میتواند بسیار پرهزینه باشد، این منطق را بهصورت ناهمگام اجرا میکنیم تا گام راهاندازی سندباکس، که برای کاربران بلوکهکننده است، مجبور نباشد منتظر تکمیل آنها بماند.
ما منطق راهاندازی را در باینری جداگانه خودش کپسوله کردیم، تا حدی به این دلیل که فقط در صورت نیاز از مرز UAC عبور کنیم. اما دلیل عمیقتر، معماری بود: راهاندازی سندباکس اساساً وظیفهای متفاوت از codex.exe دارد. نگه داشتن منطق راهاندازی سندباکس در یک باینری اختصاصی اجازه داد codex.exe یک مهارکننده عادی و بدون دسترسی ارشد باقی بماند؛ ماشینهای راهاندازی مختص ویندوز، codex.exe را روی سایر پلتفرمها حجیم نکنند؛ کارهای راهاندازی طولانیمدت از طول عمر فرایند اصلی جدا شوند؛ و یک محل واحد برای رسیدگی به مسیرهای مختلف راهاندازی موردنیاز سندباکس داشته باشیم.
به دلیل شیوه کار مرزهای ورود کاربر و توکن در ویندوز، دیگر نمیتوانستیم مانند سندباکس بدون ارتقا یک توکن محدودشده بسازیم و فرایندی را با آن اجرا کنیم. برای اینکه واقعا بتوانیم فرمانها را بهعنوان یک کاربر ویندوزی دیگر اجرا کنیم، نخستین ایده ما این جریان بود:
codex.exeبهعنوان کاربر واقعی ویندوز اجرا میشود. سپس، Codex بهترتیب:LogonUserW(...)را برای کاربر سندباکس فراخوانی میکند.- تابع
CreateRestrictedToken(...)را روی آن توکن کاربر سندباکس فراخوانی میکند. - با استفاده از آن توکن محدود کاربر سندباکس،
CreateProcessAsUserW(...)را فراخوانی میکند تا پردازه فرزند نهایی را اجرا کند.
در عمل، آن جریان مطلوب بهدلیل وجود مانع سطح دسترسی در CreateProcessAsUserW(...) کار نکرد. این یعنی codex.exe میتوانست برای کاربر سندباکس یک توکن محدود ایجاد کند، اما نمیتوانست از سمت کاربر واقعی مرز، یک فرایند فرزند را با آن توکن بهطور قابل اعتماد راهاندازی کند. ما به فرایندی نیاز داشتیم که از قبل بهعنوان کاربر سندباکس در حال اجرا باشد—این باعث میشد مرحله اعمال محدودیت و ایجاد نهایی فرایند در سمت کاربر سندباکس مرز انجام شود، نه در سمت کاربر واقعی.
آن نیاز منجر به codex-command-runner.exe شد؛ یک باینری جدید که تنها وظیفهاش ایجاد یک توکن محدودشده و اجرای فرمان درخواستشده است. بهجای اینکه از codex.exe بخواهیم کل جریان را خودش انجام دهد (کاربر واقعی ← کاربر سندباکس ← توکن محدودشده ← فرایند فرزند)، این جریان را به دو بخش تقسیم کردیم:
بخش ۱
codex.exe،CreateProcessWithLogonW(...)را فراخوانی میکند تاcodex-command-runner.exeرا بهعنوان کاربر سندباکس اجرا کند، بدون اینکه هنوز از توکن محدودشدهای استفاده شود.
بخش ۲
- داخل اجراکننده، تابع
OpenProcessToken(GetCurrentProcess(), ...)توکن خود اجراکننده را باز میکند؛ توکنی که از قبل متعلق به کاربر سندباکس است. - اجراکننده تابع
GetTokenInformation(...)را برای استخراج SID ورود سندباکس فراخوانی میکند و سپسCreateRestrictedToken(...)را فراخوانی میکند تا توکن محدود نهایی را بسازد. - اجراکننده همچنان در داخل خودش، با استفاده از آن توکن محدودشده، تابع
CreateProcessAsUserW(...)را فراخوانی میکند تا فرزند واقعی را اجرا کند.
آلبرت اینشتین گفته است: «همهچیز باید تا حد ممکن ساده شود، اما نه سادهتر.» با همین روحیه، طراحی ما هر مسئله را به شکلی کافی حل کرد. معماری نهایی چهار لایهای را دارد که پیشتر پوشش دادهایم:
- خود
codex.exe codex-windows-sandbox-setup.exeبرای رسیدگی به همه کارهای راهاندازی مرتبط با سطح دسترسی ارشدcodex-command-runner.exeبرای اجرای فرمانهای توکن محدودشده- فرایند فرزند
وقتی نخستین بار با این پروژه آشنا شدم، تصور روشنی از اینکه در نهایت به کجا میرسد نداشتم. رویکرد من این بود که از ابزارگذاری قابلیت سندباکسینگ در مرز میان Codex و سیستمعامل شروع کنم. این رویکرد بسیار نزدیک به نحوه پیادهسازی سندباکس در Codex روی MacOs و Linux است.
هرچه بیشتر درباره ابزارهای مشخصی که ویندوز ارائه میکند یاد گرفتم، و در طول دهها تصمیم برای متعادل کردن امنیت و سهولت استفاده، این سیستم به شکل فعلیاش رشد کرد—چندین باینری، کاربران سفارشی، قوانین فایروال، یک گام راهاندازی با دسترسی ارشد، فرایندهای ناهمگام و موارد دیگر.
این سیستم چندان ساده نیست، اما هر بخش از پیچیدگی آن از روی ضرورت اضافه شده تا سندباکسی ساخته شود که هم ایمن باشد و هم تا حد ممکن مزاحم کارهای کاربر نشود.
در تلاش برای ارائه تجربه کاربری خوب برای کاربران Codex در ویندوز، هدف ما این بود که چیزی امن بسازیم که از کارایی کوتاه نیاید—کل هدف استفاده از Codex این است که عاملها بتوانند بدون نیاز به توجه دائمی شما کار انجام دهند.
یکی از بزرگترین درسهای این پروژه این بود که ویندوز هیچ سازوکار ابتدایی واحدی به ما نداد که بهطور تمیز با مفهوم «عامل کدنویسی خودکار امن» منطبق شود. ما چند ابزار و مفهوم را با هم ترکیب کردیم تا چیزی منسجم بسازیم. بعضی ایدههای اولیه به بنبست رسیدند. طراحی نهایی، ترکیبی از نمونههای اولیه قبلی بود که هرکدام بخشی از مسئله را حل میکردند.
درس دیگر این بود که امنیت برای یک عامل کدنویسی، نسبت به امنیت کلاسیکتر برنامههای کاربردی موجودی متفاوت است. Codex باید برای جریانهای کاری واقعی توسعهدهندگان جواب بدهد. کار مهندسی در واقع ایجاد توازن میان سازگاری با بارهای کاری عاملی و اجرا کردن واقعی بود. همین تنش، مصالحههای طراحی نهایی را شکل داد.
آیا کنجکاوید سندباکس مربوط به Codex را در عمل ببینید؟ آن را امتحان کنید.


