Lepsze zarobki i zamawianie przejazdów Uber dzięki OpenAI
Uber wykorzystuje OpenAI do obsługi asystentów AI i funkcji głosowych, które pomagają lepiej zarabiać i szybciej zamawiać przejazdy na globalnym rynku w czasie rzeczywistym.
Każdego dnia miliony pasażerów wybierają Uber i zamawiają przejazdy albo jedzenie, wysyłają paczki albo zarabiają. Za każdym dotknięciem ekranu stoi złożony rynek działający w czasie rzeczywistym, kształtowany przez ruch drogowy, pogodę, przyloty na lotniska, lokalne wydarzenia i popyt. Uber działa na ogromną skalę: 40 milionów przejazdów dziennie, 10 milionów kierowców i kurierów w 15 000 miast w ponad 70 krajach. Każde miasto ma własną dynamikę operacyjną, regulacje i zachowania pasażerów, co tworzy system, który musi stale się dostosowywać.
Uber od dawna wykorzystuje uczenie maszynowe do wspierania swojego rynku. A teraz, dzięki dużym modelom językowym i modelom pionierskim OpenAI, Uber może sprawniej analizować złożone sygnały, dostarczać szybkie odpowiedzi konwersacyjne i obsługiwać interakcje głosowe w aplikacji.
Współpraca z OpenAI pomaga Uber tworzyć produkty oparte na AI, które upraszczają możliwości zarobku dla kierowców i kurierów oraz usprawniają korzystanie z usług dla pasażerów. Korzystając z modeli OpenAI, Uber może też bardzo sprawnie wdrażać dopracowane produkty i usługi.
„Po raz pierwszy w historii to technologia daje możliwości rozwiązywania problemów, które kiedyś wydawały się poza zasięgiem”,
Elastyczność jest dla kierowców jedną z największych zalet Uber. Niektórzy jeżdżą na pełen etat, inni tylko w weekendy, a jeszcze inni między zajęciami lub zmianami w pracy. Ta elastyczność trybu współpracy oznacza również, że kierowcy sprawdzają możliwości i zadają pytania: Gdzie się teraz ustawić? Czy warto jechać na lotnisko? Czy w porze lunchu zrealizować kilka dostaw? Dlaczego moje zarobki dziś były inne niż ostatnio?
Odpowiedzią na te kwestie ze strony Uber było stworzenie asystenta Uber Assistant opartego na AI. Rozwiązanie to ma pomagać kierowcom w korzystaniu z platformy, w onboardingu, obsłudze pierwszych przejazdów i codziennej optymalizacji zarobków.
„Chcemy umożliwić kierowcom podejmowanie lepszych decyzji, zapewniając podsumowania rynkowe i analizy w czasie rzeczywistym”, mówi Dharmin Parikh, kierownik działu zarządzania produktami w Uber.
Asystent pomaga kierowcom określić, gdzie i kiedy zarabiać, przekształcając skomplikowane dane, takie jak trendy zarobków i mapy cieplne, w proste, praktyczne wskazówki. Następnie kierowcy mogą mu zadawać dodatkowe pytania w języku naturalnym i otrzymywać odpowiedzi.
Celem Uber jest zmniejszenie obciążenia poznawczego, czyli wysiłku potrzebnego do interpretacji złożonych danych rynkowych podczas próby realizacji przejazdu.
Jest to szczególnie istotne dla młodych stażem kierowców. Uber stwierdził, że wykorzystanie AI do podsumowywania i prostego przekazywania danych może przyspieszyć zaznajomienie się z realiami pracy, ponieważ w ten sposób kierowcy znacznie szybciej poznają procesy i dynamiki rynku niż metodą prób i błędów.
Choć początkowo oczekiwano, że Uber Assistant będzie najbardziej pomagał nowym kierowcom, okazało się, że doświadczeni kierowcy również wielokrotnie zadawali dodatkowe pytania i optymalizowali swój czas na platformie. Takie zachowanie stanowi potwierdzenie, że produkt jest długoterminowym narzędziem, a nie tylko systemem onboardingowym.
„Asystent pomaga kierowcom szybko wejść w rytm pracy i nie potrzebują już oni kilkuset przejazdów, by zrozumieć, jak działa platforma”, mówi Parikh.
Dla Ubera dokładność, bezpieczeństwo, wiarygodność i szybkość są najważniejszymi priorytetami podczas wdrażania każdego systemu AI, z którego będą korzystać kierowcy i dostawcy. Kluczowe kwestie obejmują utrzymywanie treści odpowiedzi w granicach wyznaczonych przez zasady oraz zapewnienie responsywności systemu na poziomie oczekiwanym przez użytkowników od aplikacji mobilnej działającej w czasie rzeczywistym.
Dlatego Uber Assistant oparto na trzech podstawowych zasadach: bezpieczeństwo, zaufanie i niskie opóźnienia reakcji.
Zespoły inżynieryjne Ubera zbudowały wieloagentową architekturę, która kieruje każde żądanie użytkownika do najbardziej odpowiedniego wyspecjalizowanego systemu. Na przykład pytania o zarobki mogą być obsługiwane inaczej niż pytania onboardingowe, a wskazówki rynkowe wymagają innego rozumowania niż działania transakcyjne.
Taka architektura pozwala na przekazywanie zadań do modeli najlepiej dostosowanych do ich realizacji, zapewniając, że każde zapytanie jest obsługiwane jak najbardziej wydajnie.
Do obsługi mniej złożonych pytań i uzyskiwania szybkich odpowiedzi używane są szybsze modele nano/mini, a bardziej złożone zadania są przekazywane do większych modeli rozumujących.
Uber opracował także wewnętrzną warstwę zarządzania AI Guard, która pomaga weryfikować polecenia i odpowiedzi pod kątem bezpieczeństwa, prywatności i ochrony, egzekwowania zasad, ograniczania halucynacji oraz utrzymywania spójności.
Kiedy kierowcy otrzymują trafne i użyteczne rekomendacje, chętniej realizują kolejne przejazdy, zadają więcej pytań, angażują się wielokrotnie i intensywniej korzystają z platformy.
„Jeśli użytkownicy nie ufają systemowi, szybko rezygnują, ale kiedy widzą korzyści, wracają”, mówi Parikh.
Uber stosuje również interfejsy Realtime API OpenAI do obsługi jednej z dużych zmian komunikacji z technologią – wprowadzanie interfejsów głosowych.
Pisanie w aplikacji sprawdza się tylko w przypadku prostych poleceń, jednak wiele zadań związanych z transportem i handlem jest bardziej złożonych.
W przypadku interfejsu głosowego podróżny może po prostu powiedzieć: „Mam pięć walizek i jedzie ze mną jeszcze pięć osób. Potrzebuję wygodnego transportu na lotnisko. Co polecasz?”. Dla starszych osób lub pasażerów z wadą wzroku wygodniejsze może być wypowiedzenie polecenia bez konieczności przeklikiwania się przez menu.
Nowe interfejsy głosowe w Uber pozwalają płynnie realizować takie polecenia. Wystarczy, że użytkownicy dotkną ikony mikrofonu na pasku wyszukiwania „dokąd jedziesz” w aplikacji Uber i mogą zamówić przejazd prostym poleceniem głosowym w języku naturalnym. System wykorzysta Realtime API i inne modele pionierskie do zinterpretowania intencji użytkownika, następnie skorzysta z zapisanych lokalizacji i kontekstu klienta oraz przedstawi rekomendacje, jednocześnie synchronizując odpowiedzi głosowe i wizualne w aplikacji.
Sugestie mogą obejmować rekomendowanie UberXL przy podróżach z dużą ilością bagażu albo rozpoznanie zapisanych miejsc docelowych, takich jak „dom”.
„W przypadku poleceń głosowych znika problem związany z możliwością realizacji tylko jednego zadania naraz. Można w naturalny sposób wyrazić pełną intencję, a system może zająć się realizacją działań”, mówi Parikh.
Polecenia głosowe zwiększają też dostępność i otwierają nowe procesy pracy w całym ekosystemie Uber; przykładowo: kierowcom pozwalają korzystać z aplikacji bez użycia rąk, a pasażerom przyspieszają i ułatwiają możliwości korzystania z aplikacji.
„Polecenia głosowe nie wymagają wielu stuknięć w ekran, ponieważ szybko można opisać złożone polecenia, a to otwiera możliwość łączenia różnych części ekosystemu”, mówi Vidyasagar.

Uwaga: funkcja zamawiania głosowego będzie wdrażana w najbliższych tygodniach
Możliwości LLM szybko się rozwijają, więc Uber również zmienia sposób tworzenia swoich rozwiązań.
Inżynierowie w całej organizacji opracowują polecenia, używają systemów wyszukiwania, potoków ewaluacji i struktur zarządzających. Zespoły produktowe, prawne, operacyjne i projektowe ściślej ze sobą współpracują, definiując granice zasad, testują wyniki i poprawiają wrażenia korzystania z aplikacji.
Zamiast małego scentralizowanego zespołu AI odpowiedzialnego za innowacje, sztuczną inteligencję można teraz osadzić w całej firmie.
„Już nie tylko jedna wyspecjalizowana grupa robi to wszystko, ale wiele zespołów współpracuje ze sobą z korzyścią dla klienta”, mówi Vidyasagar.
Zmiana usprawnia eksperymentowanie i pozwala tworzyć nowe rozwiązania w całym ekosystemie Uber.
„Każdy przejazd, każda dostawa to sekwencja zdarzeń, a sprawne zrozumienie i przetwarzanie wszystkich danych związanych z tymi działaniami to zaleta LLM. Technologia ta daje nam mnóstwo informacji o kierunku naszego rozwoju, a przy naszej skali działań jest to niezwykle istotne”, mówi Vidyasagar.
Uber Assistant został udostępniony sieci kierowców w USA w ramach eksperymentalnego wdrożenia, w tym czasie Uber testuje i udoskonala to rozwiązanie:
- Setki tysięcy kierowców w USA mają teraz dostęp do wersji beta Uber Assistant
- Lepiej zapewniana pomoc dla młodych stażem kierowców, skupiająca się na możliwości realizacji większej liczby przejazdów
- Wydajna i powtarzalna jakość działania, by użytkownicy częściej korzystali z rozwiązania
- Lepsze wykorzystanie czasu na platformie dzięki trafniejszym informacjom o rynku
- Szybsze cykle iteracji produktu dzięki specjalizacji modeli i systemom ciągłej ewaluacji
Od pomocy nowym kierowcom w zdobyciu pierwszych przejazdów po wspierania doświadczonych kierowców szukających lepszych możliwości zarobku — Uber wszędzie wykorzystuje modele OpenAI, aby zwiększyć wydajność, usprawnić transport i wprowadzać pierwiastek ludzki do codziennej logistyki.
„Z perspektywy inżyniera firma OpenAI po prostu dostarcza możliwość rozwiązywania tych problemów na różne i unikalne sposoby”, mówi Vidyasagar.


