Resultate
50%
Reduzierung der MTTR
Resultate
3-4x
Potenzielle Verkürzung der Projektumsetzungszeit – von Quartalen auf Wochen
Rakuten(wird in einem neuen Fenster geöffnet) ist ein globales Innovationsunternehmen, das in den Bereichen E-Commerce, Fintech und Mobilkommunikation tätig ist und sowohl Verbraucher:innen als auch Händler:innen in sehr großem Maßstab bedient. Mit 30.000 Mitarbeitenden weltweit shippen seine Entwicklungsteams in einem großen, komplexen Produktökosystem, in dem sowohl Geschwindigkeit als auch Zuverlässigkeit entscheidend sind.
Deshalb hat Yusuke Kaji, General Manager of AI for Business bei Rakuten, im vergangenen Jahr daran gearbeitet, agentenbasierte Workflows stärker darin zu verankern, wie Teams Software planen, entwickeln und validieren. Codex– der Coding-Agent von OpenAI – ist zu einem zentralen Bestandteil von Rakutens Engineering-Stack geworden, insbesondere dort, wo das Unternehmen schneller vorankommen muss, ohne Kompromisse bei der Sicherheit einzugehen.
Im vergangenen Jahr haben Entwickler:innen bei Rakuten Codex im Betrieb und in der Softwarebereitstellung eingesetzt, um die Reaktionszeit bei Vorfällen zu verkürzen (einschließlich einer Reduzierung der mittleren Wiederherstellungszeit (Mean Time To Recovery, MTTR), um etwa 50 %), CI/CD durch automatisierte Code-Reviews und Schwachstellenprüfungen zu stärken und eine autonomere Entwicklung bei komplexen Projekten zu unterstützen.
„Uns geht es nicht nur darum, schnell Code zu generieren. Uns ist wichtig, dass sicher geshippt wird. Geschwindigkeit ohne Sicherheit ist kein Erfolg.“
Im Engineering-Team von Rakuten ist die KI-Agenda klar umrissen und bewusst operativ ausgerichtet. Kaji strukturiert die Arbeit entlang von drei Prioritäten, hinter denen sich die Teams vereinen:
- Schneller entwickeln („Speed!! Speed!! Speed!!“): Teams nutzen Codex in operativen Workflows, einschließlich KQL-basierter Überwachung und Diagnose, um die Ursachenanalyse und Problembehebung zu beschleunigen und so die MTTR um bis zu 50 % zu verkürzen.
- Sicherer entwickeln („Get things done“): Codex wird in CI/CD-Prozesse für Code-Reviews und Schwachstellenprüfungen eingebunden und wendet automatisch interne Standards an, damit Teams schnell und mit Schutzmechanismen ausliefern können.
- Intelligenter arbeiten („AI-nization“): Codex bringt größere, unklare Projekte von der Spezifikation hin zu funktionierenden Implementierungen voran, verringert die Abhängigkeit von perfekt definierten Anforderungen, ermöglicht eine autonomere Umsetzung und verkürzt letztlich quartalslange Vorhaben auf wenige Wochen.
Codex lässt sich als zuverlässiger Agent in einem umfassenderen Toolkit direkt jeder Priorität zuordnen und kommt dort zum Einsatz, wo Geschwindigkeit, Sicherheit und Autonomie einen sich verstärkenden Mehrwert schaffen.
Bei Rakuten umfasst Geschwindigkeit auch die Wiederherstellungszeit, nicht nur die Entwicklungsgeschwindigkeit.
Teams verwenden KQL (das Abfragesystem von Azure für Protokolle und Telemetriedaten), um APIs zu überwachen und Signale zu analysieren. Codex unterstützt diese Workflows dabei, Ursachen zu ermitteln und Korrekturen vorzuschlagen, wodurch die Zeit zwischen Warnmeldung und Behebung verkürzt wird.
Aus Sicht des Site Reliability Engineering (SRE) verkürzt dies den Weg von der Erkennung bis zur Behebung. Anstatt Abfragen, Logs und Patches manuell zusammenzufügen, können sich Entwickler:innen darauf konzentrieren, Fehlerbehebungen zu validieren und bereitzustellen.
Rakuten geht davon aus, dass dieser Ansatz die MTTR um etwa 50 % reduzieren kann, wenn Probleme auftreten. Oder einfacher gesagt: Rakuten hat Codex eingesetzt, um Probleme doppelt so schnell zu beheben, wenn etwas ausfällt.
Wenn schneller geshippt wird, können Review und Bereitstellung zu Engpässen werden. Rakuten geht dies an, indem es Codex direkt in seine CI/CD-Pipeline integriert.
Codex führt Code-Reviews und Schwachstellenprüfungen durch, bevor Änderungen die Produktionsumgebung erreichen. Rakuten integriert interne Programmierprinzipien und -standards in diese Workflows, damit Reviews den Erwartungen des Unternehmens entsprechen.
„Wir stellen Codex unsere internen Programmierprinzipien zur Verfügung“, sagt Kaji. „Nach denselben Grundsätzen prüft es, ob der Code unseren Standards entspricht.“
Das Ergebnis: Sicherheitsprüfungen werden einheitlich und automatisch durchgeführt, sodass Teams schneller vorankommen können, ohne Standards zu senken.
Die dritte Priorität von Rakuten – „AI-nization“ (dt. „KI-fizierung“) – konzentriert sich auf Autonomie. Codex wird nicht nur für Überprüfung und Wartung verwendet, sondern auch dafür, größere, vielschichtigere Projekte von Anfang bis Ende umzusetzen. Anstatt perfekt definierte Spezifikationen zu erfordern, kann Codex auf Basis unvollständiger Anforderungen voranschreiten und nutzbare Artefakte erstellen.
„Die neuesten Codex-Modelle können zwischen den Zeilen lesen“, sagt Kaji. „Auch wenn die Anforderungen nicht perfekt definiert sind, versteht es, was wir entwickeln wollen.“
Ein Beispiel: die Entwicklung einer Mobile-App-Version eines bestehenden webbasierten KI-Agenten-Service. Codex hat die gesamte Spezifikation umgesetzt, einschließlich einer Full-Stack-Implementierung mit einem Python/FastAPI-Backend und einer Swift/SwiftUI-iOS-App sowie aller Backend-APIs – und das ohne schrittweise menschliche Anweisungen. Codex hat die Entwicklungszeit für dieses Projekt von einem Quartal auf wenige Wochen verkürzt.
Da Codex immer mehr Aufgaben in der Codegenerierung übernimmt, verlagert Rakuten die Rolle der Entwickler:innen hin zum Verfassen klarerer Spezifikationen und zur Überprüfung der Ausgaben anhand messbarer Standards.
„Unsere Aufgabe besteht nicht mehr darin, jede Codezeile zu überprüfen“, so Kaji. „Unsere Aufgabe ist es, klar zu definieren, was wir wollen, und festzulegen, wie es überprüft wird.“
Rakuten hat diesen Wandel durch praxisorientierte Workshops für Engineering-, Produkt- und nichttechnische Teams unterstützt. Das hat dazu beigetragen, dass Codex eine zentrale Rolle dabei spielt, Teams schneller shippen und sicherer arbeiten zu lassen sowie autonome Entwicklung unternehmensweit zu skalieren.


