Uber dùng OpenAI giúp kiếm tiền thông minh hơn, đặt xe nhanh hơn
Uber dùng OpenAI để vận hành trợ lý AI và tính năng giọng nói, giúp tài xế kiếm tiền thông minh hơn và hành khách đặt xe nhanh hơn trên thị trường toàn cầu theo thời gian thực.
Mỗi ngày, hàng triệu người dựa vào Uber để đặt xe, gọi món ăn, gửi gói hàng và kiếm tiền linh hoạt. Đằng sau mỗi lần chạm là một thị trường thời gian thực phức tạp, được định hình bởi giao thông, thời tiết, các chuyến bay đến sân bay, sự kiện địa phương và nhu cầu. Uber hoạt động ở quy mô khổng lồ: 40 triệu chuyến đi mỗi ngày, 10 triệu tài xế và người giao hàng tại 15.000 thành phố ở hơn 70 quốc gia. Mỗi thành phố có động lực vận hành, quy định và hành vi hành khách riêng, tạo nên một hệ thống phải liên tục thích ứng ở quy mô toàn cầu.
Uber từ lâu đã sử dụng máy học để hỗ trợ thị trường của mình. Và giờ đây, nhờ các mô hình ngôn ngữ lớn và các mô hình tiên tiến của OpenAI, Uber có thể suy luận nhờ các tín hiệu phức tạp nhanh hơn, cung cấp phản hồi hội thoại nhanh và hỗ trợ các trải nghiệm giọng nói trong ứng dụng.
Sự hợp tác giữa Uber và OpenAI đang giúp Uber xây dựng các sản phẩm ứng dụng AI để đơn giản hóa cơ hội kiếm tiền cho tài xế và người giao hàng, đồng thời giảm bớt trở ngại cho hành khách. Và bằng cách sử dụng các mô hình của OpenAI, Uber có thể phát hành các sản phẩm và trải nghiệm tinh gọn nhanh hơn bao giờ hết.
“Lần đầu tiên, công nghệ đang dẫn dắt những gì có thể được giải quyết. Những vấn đề từng ngoài tầm với nay đã có thể xử lý.”
Đối với tài xế, tính linh hoạt là một trong những điểm mạnh lớn nhất của Uber. Một số người lái xe toàn thời gian, một số khác chỉ lái vào cuối tuần, còn một số lái xe giữa các buổi học hoặc ca làm. Sự linh hoạt này cũng đồng nghĩa tài xế luôn phải cân nhắc các lựa chọn và đặt câu hỏi: Lúc này tôi nên đứng ở đâu? Có đáng lái xe ra sân bay không? Tôi có nên chuyển từ chở khách sang giao hàng vào giờ ăn trưa không? Tại sao thu nhập hôm nay của tôi lại khác?
Để giúp trả lời những câu hỏi đó, Uber đã phát triển Uber Assistant, một trợ lý ứng dụng AI được thiết kế để hỗ trợ tài xế trong suốt vòng đời của họ trên nền tảng — từ khâu bắt đầu và những chuyến đi đầu tiên đến việc tối ưu hóa thu nhập hằng ngày.
“Chúng tôi muốn giúp tài xế đưa ra quyết định tốt hơn cho chính họ bằng cách cung cấp cái nhìn tổng hợp về thị trường và những thông tin chuyên sâu theo thời gian thực,” Dharmin Parikh, Giám đốc Quản lý Sản phẩm tại Uber, cho biết.
Trợ lý giúp tài xế biết nên kiếm tiền ở đâu và khi nào bằng cách biến dữ liệu phức tạp như xu hướng thu nhập và bản đồ nhiệt thành những gợi ý vị trí đơn giản, có thể hành động. Sau đó, họ có thể đặt thêm câu hỏi bằng ngôn ngữ thông thường, nhận phản hồi phù hợp và dễ dàng điều hướng ứng dụng.
Mục tiêu của Uber là giảm gánh nặng nhận thức — công sức cần thiết để diễn giải dữ liệu thị trường phức tạp trong khi vẫn đang cố gắng kiếm tiền.
Điều đó được chứng minh có giá trị với các tài xế mới. Uber nhận thấy việc dùng AI để tóm tắt và dễ dàng truyền đạt dữ liệu thực tế của Uber để có thể đẩy nhanh quá trình làm quen bằng cách giúp tài xế học quy trình làm việc và động lực thị trường nhanh hơn nhiều so với chỉ tự mày mò thử sai.
Mặc dù ban đầu Uber Assistant được kỳ vọng sẽ giúp tài xế mới nhiều nhất, các tài xế giàu kinh nghiệm cũng liên tục quay lại để đặt thêm câu hỏi và tối ưu thời gian trên nền tảng — qua đó khẳng định sản phẩm này là một tiện ích lâu dài, chứ không chỉ là công cụ hỗ trợ làm quen.
“"Trợ lý đang giúp tài xế nhanh chóng làm quen, thay vì phải thực hiện vài trăm chuyến đi mới hiểu được cách nền tảng vận hành,” Parikh nói.
Đối với Uber, độ chính xác, an toàn, độ tin cậy và tốc độ là những ưu tiên hàng đầu khi triển khai bất kỳ hệ thống AI nào có đầu ra sẽ tương tác với tài xế và người giao hàng. Các cân nhắc quan trọng gồm việc phản hồi có tuân thủ theo chính sách và độ trễ phải đáp ứng tiêu chuẩn người dùng mong đợi từ một ứng dụng di động thời gian thực.
Đó là lý do Uber thiết kế Uber Assistant dựa trên ba nguyên tắc cốt lõi: an toàn, tin cậy và độ trễ thấp.
Các đội nhóm kỹ thuật của Uber đã xây dựng một kiến trúc đa tác nhân định tuyến mỗi yêu cầu của người dùng đến hệ thống chuyên biệt phù hợp nhất. Ví dụ, câu hỏi về thu nhập có thể được xử lý khác với câu hỏi về bắt đầu sử dụng, và hướng dẫn về thị trường đòi hỏi kiểu suy luận khác với các hành động giao dịch.
Kiến trúc này cho phép Uber định tuyến từng nhiệm vụ đến mô hình phù hợp nhất với nhu cầu vận hành cụ thể của nó, bảo đảm mỗi truy vấn được xử lý với trọng tâm thích hợp vào điều quan trọng nhất.
Đối với phân loại nhẹ và phản hồi nhanh, Uber dùng các mô hình tí hon và nhỏ nhanh hơn. Với các tác vụ phức tạp hơn, Uber tận dụng các mô hình suy luận lớn hơn.
Uber cũng phát triển AI Guard, một lớp quản trị nội bộ giúp sàng lọc câu lệnh và phản hồi để tăng cường an toàn, quyền riêng tư và bảo mật, thực thi chính sách, giảm ảo giác và duy trì tính nhất quán giữa các trải nghiệm.
Khi tài xế nhận được các đề xuất chính xác và hữu ích, họ sẽ quay lại. Họ hỏi thêm nhiều câu hơn. Họ tương tác lặp lại. Và họ dành nhiều thời gian hiệu quả hơn trên nền tảng.
“Nếu người dùng không tin vào hệ thống, bạn sẽ mất họ rất nhanh,” Parikh nói. “Nhưng khi họ thấy giá trị, họ sẽ quay lại.”
Uber cũng đang áp dụng các API Realtime của OpenAI cho một trong những thay đổi giao diện lớn tiếp theo trong công nghệ: giọng nói.
Việc gõ vào ứng dụng có thể hiệu quả với các yêu cầu đơn giản. Nhưng nhiều nhu cầu về vận tải và thương mại lại phức tạp hơn.
Một du khách có thể muốn nói: “Tôi có năm kiện hành lý và thêm năm người đi cùng. Tôi cần một chuyến xe tốt đến sân bay. Bạn đề xuất gì?” Một người lớn tuổi hoặc hành khách khiếm thị có thể thích nói hơn là chạm qua các menu.
Các trải nghiệm giọng nói mới của Uber được thiết kế để giúp những khoảnh khắc đó trở nên liền mạch. Người dùng có thể chạm vào biểu tượng micro trên thanh tìm kiếm ‘đi đâu’ trong ứng dụng Uber và yêu cầu chuyến xe bằng lời nói tự nhiên. Hệ thống sử dụng API Realtime và các mô hình tiên tiến khác để diễn giải ý định, tận dụng các địa điểm đã lưu và ngữ cảnh khách hàng, đồng thời đưa ra đề xuất — trong khi đồng bộ hóa phản hồi bằng lời nói và hình ảnh trong ứng dụng.
Điều đó có thể đồng nghĩa với việc gợi ý UberXL cho những chuyến đi có nhiều hành lý hoặc nhận ra các điểm đến đã lưu như “nhà”.
“Giọng nói loại bỏ rào cản phải hoàn thành từng tác vụ một,” Parikh nói. “Bạn có thể diễn đạt trọn vẹn ý định một cách tự nhiên, và hệ thống có thể điều phối kết quả.”
Giọng nói cũng mở rộng khả năng tiếp cận và mở ra các quy trình làm việc mới trên toàn bộ hệ sinh thái của Uber. Ở phía tài xế, nó cho phép tài xế tương tác với ứng dụng mà không cần dùng tay. Ở phía hành khách, nó có thể giảm trở ngại cho những khách hàng muốn tương tác nhanh hơn, đơn giản hơn.
“Giọng nói loại bỏ rào cản nhiều lần chạm vì bạn có thể nói nhiều điều cùng lúc,” Vidyasagar nói. “Nó mở ra khả năng kết nối các phần khác nhau của hệ sinh thái.”

Lưu ý: Tính năng Đặt xe bằng giọng nói sẽ được triển khai trong vài tuần tới
Khi năng lực của LLM phát triển nhanh chóng, Uber cũng đã thay đổi cách các đội ngũ xây dựng sản phẩm.
Các kỹ sư trên toàn tổ chức làm việc với kỹ thuật câu lệnh, hệ thống truy xuất, quy trình đánh giá và các khung điều phối. Các nhóm sản phẩm, pháp lý, vận hành và thiết kế hợp tác chặt chẽ hơn để xác định ranh giới chính sách, kiểm thử đầu ra và cải thiện trải nghiệm người dùng.
Thay vì có một nhóm AI nhỏ tập trung chịu trách nhiệm đổi mới, giờ đây năng lực này có thể được tích hợp trên toàn công ty.
“Đây không còn là một nhóm chuyên biệt duy nhất làm tất cả việc này,” Vidyasagar nói. “Nhiều nhóm có thể đóng góp bởi vì rào cản để xây dựng đã giảm xuống.”
Sự thay đổi đó thúc đẩy thử nghiệm nhanh hơn và tạo ra những ý tưởng mới trên toàn hệ sinh thái của Uber.
“Mỗi lần lái xe, mỗi chuyến đi đều là một chuỗi sự kiện, và việc hiểu cũng như xử lý sắc thái đó chính là điều LLM mở ra cho chúng tôi,” Vidyasagar nói. “Điều đó cho chúng tôi rất nhiều thông tin về hướng nên đi tiếp, và khả năng mở khóa đó — ở quy mô chúng tôi đang có — là vô cùng mạnh mẽ.”
Uber Assistant hiện đã được mở rộng trên mạng lưới tài xế tại Mỹ trong một đợt triển khai thử nghiệm, trong khi Uber tiếp tục kiểm thử và tinh chỉnh trải nghiệm:
- Hàng trăm nghìn tài xế tại Mỹ hiện đã có quyền truy cập vào các trải nghiệm beta của Uber Assistant
- Cải thiện hỗ trợ cho tài xế ở giai đoạn đầu, giúp tài xế mới định vị tốt hơn để có thêm nhiều chuyến đi
- Tương tác lặp lạimạnh mẽ, người dùng quay lại sau những lần tương tác thành công
- Tận dụng thời gian tốt hơn trên nền tảng nhờ những thông tin chuyên sâu về thị trường thông minh hơn
- Chu kỳ phát triển sản phẩm nhanh hơn nhờ chuyên biệt hóa mô hình và hệ thống đánh giá liên tục.
Từ việc giúp một tài xế mới có chuyến đi đầu tiên đến hướng dẫn một tài xế giàu kinh nghiệm tìm kiếm cơ hội kiếm tiền tốt hơn, Uber đang dùng các mô hình của OpenAI để giúp công việc hiệu quả hơn, việc di chuyển liền mạch hơn và việc di chuyển hằng ngày gần gũi, nhân văn hơn.
“Với tư cách là một kỹ sư, OpenAI đơn giản là mở ra khả năng giải quyết những vấn đề đó theo những cách khác biệt và độc đáo,” Vidyasagar nói.


