Bỏ qua nội dung chính
OpenAI

11 tháng 3, 2026

Rakuten khắc phục sự cố nhanh gấp đôi với Codex

Quy mô công ty: Doanh nghiệp
Khu vực: Châu Á - Thái Bình Dương & Châu Đại Dương
Ngành: Bán lẻ, Công nghệ, Tài chính
Sản phẩm: API

Kết quả

50%

Giảm MTTR

Kết quả

3-4x

Thời gian xây dựng dự án có thể nhanh hơn – từ vài quý xuống còn vài tuần

Đang tải…

Rakuten⁠(mở trong cửa sổ mới) là một công ty đổi mới toàn cầu hoạt động trên lĩnh vực thương mại điện tử, fintech và truyền thông di động, phục vụ cả người tiêu dùng và thương nhân với quy mô lớn. Với 30.000 nhân viên trên toàn thế giới, đội ngũ kỹ sư của công ty vận hành trên một hệ sinh thái sản phẩm rộng lớn, phức tạp, nơi cả tốc độ và độ tin cậy đều rất cần thiết.

Đó là lý do tại sao Yusuke Kaji, Tổng Giám đốc AI cho Kinh doanh tại Rakuten, đã dành một năm qua để thúc đẩy quy trình làm việc của đại lý sâu hơn vào cách các nhóm lập kế hoạch, xây dựng và xác thực phần mềm. Codex⁠—tác nhân viết mã từ OpenAI—đã trở thành một phần cốt lõi trong hệ thống kỹ thuật của Rakuten, đặc biệt là ở những nơi công ty cần tăng tốc mà không làm ảnh hưởng đến bảo mật.

Trong năm qua, các kỹ sư của Rakuten đã sử dụng Codex trong các hoạt động và phân phối phần mềm để nén phản ứng sự cố (bao gồm giảm ~ 50% thời gian trung bình để khôi phục hoặc MTTR), tăng cường CI/CD với đánh giá mã tự động và kiểm tra lỗ hổng, đồng thời hỗ trợ phát triển tự động hơn trên các dự án phức tạp.

“Chúng tôi không chỉ quan tâm đến việc tạo mã nhanh chóng. Chúng tôi quan tâm đến việc phát hành phần mềm một cách an toàn. Tốc độ mà không đi kèm an toàn thì không phải là thành công.
—Yusuke Kaji, Tổng Giám đốc AI cho Doanh nghiệp

Bên trong quá trình triển khai

Trong đội ngũ kỹ thuật của Rakuten, chương trình nghị sự AI của họ rõ ràng và có chủ đích, tập trung vào vận hành. Kaji định hình công việc xoay quanh ba ưu tiên mà các nhóm cùng ủng hộ:

  • Xây dựng nhanh hơn (“Speed!! Speed!! Speed!!”): Các nhóm sử dụng Codex trong các quy trình làm việc vận hành, bao gồm giám sát và chẩn đoán dựa trên KQL, để tăng tốc phân tích nguyên nhân gốc rễ và khắc phục, giúp rút ngắn MTTR lên đến 50%.
  • Xây dựng an toàn hơn (“Hoàn thành công việc”): Codex được gọi trong CI/CD để xem xét mã và kiểm tra lỗ hổng, tự động áp dụng các tiêu chuẩn nội bộ để các nhóm có thể phát hành nhanh với các biện pháp bảo vệ.
  • Vận hành thông minh hơn (“AI-nization”): Codex thúc đẩy các dự án lớn, mơ hồ từ giai đoạn đặc tả đến triển khai thực tế, giảm sự phụ thuộc vào các yêu cầu được định nghĩa hoàn hảo, cho phép thực thi tự chủ hơn, và cuối cùng rút ngắn các nỗ lực kéo dài cả quý xuống còn vài tuần.

Codex lập bản đồ trực tiếp đến từng ưu tiên với tư cách là một tác nhân đáng tin cậy trong một bộ công cụ rộng hơn, hiển thị nơi tốc độ, an toàn và quyền tự chủ tạo ra giá trị hỗn hợp.

Xây dựng nhanh hơn bằng cách nén phản ứng sự cố

Tốc độ tại Rakuten bao gồm cả thời gian phục hồi, không chỉ tốc độ phát triển.

Các nhóm sử dụng KQL (hệ thống truy vấn của Azure cho nhật ký và đo từ xa) để giám sát API và phân tích tín hiệu. Codex hoạt động cùng với các quy trình làm việc này để giúp xác định nguyên nhân gốc rễ và đề xuất các bản sửa lỗi, giảm thời gian giữa cảnh báo và giải quyết.

Từ quan điểm kỹ thuật độ tin cậy của trang web (SRE), điều này rút ngắn con đường từ phát hiện đến khắc phục. Thay vì ghép các truy vấn, nhật ký và bản vá lại với nhau theo cách thủ công, các kỹ sư có thể tập trung vào việc xác thực và triển khai các bản sửa lỗi.

Rakuten ước tính cách tiếp cận này có thể giảm MTTR khoảng 50% khi có vấn đề xảy ra. Hay nói đơn giản hơn: Rakuten đã sử dụng Codex để khắc phục sự cố nhanh gấp đôi khi có thứ gì đó bị hỏng.

Xây dựng an toàn hơn bằng cách sử dụng Codex trong CI/CD

Khi vận chuyển tăng tốc, việc xem xét và triển khai có thể trở thành tắc nghẽn. Rakuten giải quyết vấn đề này bằng cách tích hợp trực tiếp Codex vào đường ống CI/CD của mình.

Codex tiến hành đánh giá mã và kiểm tra lỗ hổng trước khi các thay đổi được đưa vào sản xuất. Rakuten đưa các nguyên tắc và tiêu chuẩn mã hóa nội bộ vào các quy trình công việc này để các đánh giá phù hợp với kỳ vọng của công ty.

“Chúng tôi cung cấp các nguyên tắc mã hóa nội bộ của mình cho Codex,” Kaji nói. “Dựa trên các nguyên tắc tương tự, hệ thống rà soát liệu mã có phù hợp với các tiêu chuẩn của chúng tôi hay không.”

Kết quả: kiểm tra an toàn diễn ra nhất quán và tự động, cho phép các nhóm di chuyển nhanh hơn mà không làm giảm tiêu chuẩn.


Xây dựng thông minh hơn bằng cách thực hiện các bản dựng toàn bộ từ một thông số kỹ thuật duy nhất

Ưu tiên thứ ba của Rakuten - AI-Nization - tập trung vào quyền tự chủ. Codex không chỉ được sử dụng để xem xét và bảo trì, mà còn để thực hiện các dự án lớn, phức tạp từ đầu đến cuối. Thay vì yêu cầu các thông số kỹ thuật được định nghĩa hoàn hảo, Codex có thể tiến hành từ các yêu cầu chưa đầy đủ và tạo ra các sản phẩm có thể sử dụng được.

“Các mô hình Codex mới nhất có thể đọc giữa các dòng,” Kaji nói. “Ngay cả khi các yêu cầu không được xác định hoàn hảo, nó hiểu những gì chúng tôi đang cố gắng xây dựng.”

Một ví dụ: xây dựng phiên bản ứng dụng di động của dịch vụ tác nhân AI dựa trên web hiện có. Codex đã triển khai toàn bộ đặc tả kỹ thuật, bao gồm cả việc triển khai toàn diện với phần backend Python/FastAPI và ứng dụng iOS Swift/SwiftUI, bao gồm tất cả các API backend, mà không cần hướng dẫn từng bước thủ công. Codex đã rút ngắn thời gian phát triển dự án này từ một quý xuống còn vài tuần.

Tiếp theo là gì

Khi Codex đảm nhận nhiều công việc tạo mã hơn, Rakuten đang chuyển vai trò của kỹ sư sang viết các thông số kỹ thuật rõ ràng hơn và xác minh đầu ra dựa trên các tiêu chuẩn có thể đo lường được. 

“Vai trò của chúng tôi là không kiểm tra mọi dòng mã nữa,” Kaji nói. “Vai trò của chúng tôi là xác định rõ ràng những gì chúng tôi muốn và thiết lập cách xác minh nó.”

Rakuten đã hỗ trợ sự chuyển đổi này thông qua các hội thảo thực hành giữa các nhóm kỹ thuật, sản phẩm và phi kỹ thuật — góp phần giúp Codex đóng vai trò trung tâm trong việc giúp các nhóm vận chuyển nhanh hơn, hoạt động an toàn hơn và mở rộng quy mô phát triển tự động trong toàn tổ chức.

Tham gia kỷ nguyên làm việc mới

Hơn 1 triệu doanh nghiệp trên toàn thế giới đang đạt được kết quả có ý nghĩa với OpenAI.