每天都有數百萬人依靠 Uber 叫車、訂餐、寄送包裹,並靈活賺取收入。每一次點按背後,都是一個由交通、天氣、機場抵達情況、在地活動與需求塑造而成的複雜即時市場。Uber 的營運規模十分龐大:每日 4,000 萬趟行程、1,000 萬名駕駛與外送員,遍布 70 多個國家的 15,000 座城市。每座城市都有各自的營運動態、法規與乘客行為,形成一套必須以全球規模持續適應的系統。
Uber 長期以來一直運用機器學習來支援其市場。如今,藉由大型語言模型與 OpenAI 前沿模型,Uber 能更快針對複雜訊號進行推理、提供快速的對話式回應,並在應用程式內打造語音體驗。
Uber 與 OpenAI 的合作,正幫助 Uber 建立 AI 驅動的產品,簡化駕駛與外送員的賺錢機會,並減少乘客體驗中的摩擦。同時,運用 OpenAI 的模型,Uber 得以比以往更快推出更精簡的產品與體驗。
「這是科技首次主導哪些問題能被解決。那些曾經看似遙不可及的問題,現在都已有可能被處理。」
對駕駛而言,彈性是 Uber 最大的優勢之一。有些人全職開車,有些人只在週末上線,也有些人會在課程或輪班之間接單。這種彈性也意味著駕駛會持續評估選項並提出問題:我現在應該把自己定位在哪裡?值得開去機場嗎?午餐時段我是否該從載客切換到外送?為什麼我今天的收入看起來不一樣?
為了幫助回答這些問題,Uber 開發了 Uber Assistant,這是一款 AI 驅動的助理,旨在於駕駛在平台上的整個歷程中提供協助——從註冊上線與第一趟行程,到日常收入最佳化。
Uber 產品管理總監 Dharmin Parikh 表示:「我們希望透過提供市場摘要視圖與即時洞察,讓駕駛能為自己做出更好的決策。」
這個助理會將收入趨勢與熱點圖等複雜資料,轉換成簡單、可執行的位置建議,幫助駕駛了解何時何地最適合賺錢。之後他們還能用自然語言追問,獲得量身打造的回應,並更輕鬆地操作應用程式。
Uber 的目標是降低認知負擔——也就是一邊想辦法賺錢、一邊解讀複雜市場資料所需的心智成本。
這點對新手駕駛尤其有價值。Uber 發現,運用 AI 來摘要並清楚傳達 Uber 的真實世界資料,能藉由幫助駕駛比單靠反覆摸索更快學會工作流程與市場動態,從而加速上手。
雖然 Uber Assistant 起初預期會最能幫助新手駕駛,但有經驗的駕駛也一再回來提出後續問題並最佳化自己在平台上的時間——這證明了它是一種長期實用的工具,而不只是註冊上線工具。
Parikh 表示:「和必須跑上數百趟車才能了解平台如何運作相比,這個助理正幫助駕駛更快上手。」
對 Uber 而言,當實作任何會與駕駛及外送員互動的 AI 系統時,準確性、安全性、可信度與速度都是最優先考量。關鍵考量包括:回應必須符合政策,而延遲也必須達到使用者對即時行動應用程式的期待標準。
這就是為什麼 Uber 圍繞三項核心原則設計 Uber Assistant:安全、信任與低延遲。
Uber 的工程團隊建構了一套多智慧體架構,可將每一項使用者請求路由到最合適的專門系統。例如,收入問題與註冊上線問題會以不同方式處理,而市場指引所需的推理,也與交易型操作不同。
這套架構讓 Uber 能將每項任務分派給最適合其特定營運需求的模型,確保每個查詢都能以最符合重點的方式處理。
對於輕量級分類與快速回應,Uber 會使用較快的 nano/mini 模型。對於更複雜的任務,Uber 則採用更大型的推理模型。
Uber 也開發了 AI Guard,這是一層內部治理機制,可協助篩查提示詞與回應,以促進安全、隱私與資安,落實政策、減少幻覺,並維持各種體驗的一致性。
當駕駛收到準確且有用的建議時,他們就會再回來。他們會問更多問題,持續互動,也會在平台上投入更多高生產力的時間。
Parikh 表示:「如果使用者不信任這個系統,你很快就會失去他們。但當他們看見價值,就會回來。」
Uber 也正將 OpenAI Realtime API 應用到科技下一個重大介面轉變之一:語音。
在應用程式中打字,對簡單請求而言可能很有效率。但許多交通與商務需求其實更加複雜。
旅客可能會說:「我有五件行李,同行還有另外五個人。我需要一趟舒適的車去機場。你有什麼建議?」年長者或視障乘客,可能也會更偏好用說的,而不是透過點按選單操作。
Uber 的全新語音體驗就是為了讓這些時刻毫無摩擦。使用者可以點按 Uber 應用程式中「要去哪裡」搜尋列上的麥克風圖示,以自然語音提出叫車需求。系統會使用 Realtime API 與其他前沿模型來理解意圖,運用已儲存的位置與客戶情境提出建議——同時在應用程式內同步語音與視覺回應。
這可能代表為行李較多的行程建議 UberXL,或辨識出像是「家」這類已儲存的目的地。
Parikh 表示:「語音移除了必須一次完成一個任務的障礙。你可以自然地完整表達意圖,而系統則能協調出結果。」
語音也擴大了無障礙可及性,並在 Uber 生態系中解鎖新的工作流程。對駕駛端而言,它讓駕駛能免持與應用程式互動。對乘客端而言,它則可減少希望更快、更簡單互動之客戶的摩擦。
Vidyasagar 表示:「語音移除了多次點按的障礙,因為你可以一次說出多件事。它解鎖了串聯生態系各個部分的能力。」

注意:語音叫車功能將於未來幾週內陸續推出
隨著 LLM 能力快速演進,Uber 也改變了團隊的建構方式。
整個組織中的工程師都在使用提示詞、擷取系統、評估流程與協調框架。產品、法務、營運與設計團隊也更緊密合作,以界定政策邊界、測試輸出並改善使用者體驗。
如今,不再只是由一個小型集中式 AI 團隊主導創新,智慧能力已能嵌入整家公司。
Vidyasagar 表示:「這已不再是某一個專業團隊獨自完成所有事情。由於建構門檻降低,許多團隊現在都能貢獻。」
這種轉變加快了實驗速度,也在 Uber 的生態系中催生出新想法。
Vidyasagar 表示:「每一次駕駛、每一趟行程,都是一連串事件,而理解與處理其中的細微差異,正是 LLM 為我們解鎖的能力。這讓我們獲得大量資訊,知道下一步該往哪裡去,而這種解鎖——以我們的規模而言——格外強大。」
Uber Assistant 現已透過實驗性推出擴展到全美駕駛網路,同時 Uber 也持續測試並精進體驗:
- 數十萬名美國駕駛現已可使用 Uber Assistant 測試版體驗
- 加強對職涯早期駕駛的支援,幫助新手駕駛更好地定位自己,以獲得更多行程
- 強勁的重複互動,使用者在成功互動後會再次回來
- 透過更聰明的市場洞察,提升平台上的時間利用效率
- 透過模型專精化與持續評估系統,實現更快的產品迭代週期
從幫助新手駕駛完成第一趟行程,到引導有經驗的駕駛尋找更好的賺錢機會,Uber 正運用 OpenAI 模型,讓工作更有效率、交通更順暢,並讓日常物流更有人性。
Vidyasagar 表示:「身為工程師,OpenAI 為我們解鎖了以不同且獨特方式解決這些問題的能力。」


