API OpenAI
Chúng tôi đang phát hành API để truy cập các mô hình AI mới do OpenAI phát triển.

Chúng tôi đang phát hành API để truy cập các mô hình AI mới do OpenAI phát triển. Khác với hầu hết các hệ thống AI vốn được thiết kế cho một trường hợp sử dụng duy nhất, API hiện tại cung cấp một giao diện đa năng dạng “đưa văn bản vào, xuất văn bản ra”, cho phép người dùng thử nghiệm trên hầu như bất kỳ tác vụ tiếng Anh nào. Giờ đây, bạn có thể yêu cầu quyền truy cập để tích hợp API vào sản phẩm của mình, phát triển một ứng dụng hoàn toàn mới, hoặc giúp chúng tôi khám phá những điểm mạnh và hạn chế của công nghệ này.
Với bất kỳ lời nhắc văn bản nào, API sẽ trả về kết quả hoàn thiện dạng văn bản, cố gắng phù hợp với mẫu bạn đã đưa ra. Bạn có thể “lập trình” cho nó bằng cách cung cấp chỉ vài ví dụ về điều bạn muốn thực hiện; mức độ thành công thường thay đổi tùy thuộc vào độ phức tạp của tác vụ. API này cũng cho phép bạn tinh chỉnh hiệu suất cho các tác vụ cụ thể bằng cách huấn luyện trên một bộ dữ liệu (nhỏ hoặc lớn) gồm các ví dụ do bạn cung cấp, hoặc nhờ học từ phản hồi của con người do người dùng hoặc người gắn nhãn cung cấp.
Chúng tôi đã thiết kế API vừa đơn giản để bất kỳ ai cũng có thể sử dụng, vừa đủ linh hoạt để giúp các đội ngũ học máy làm việc năng suất hơn. Thực tế, nhiều đội ngũ của chúng tôi hiện đang sử dụng API này để có thể tập trung vào nghiên cứu học máy thay vì các vấn đề về hệ thống phân tán. Hiện tại, API này chạy các mô hình với trọng số từ dòng GPT‑3(mở trong cửa sổ mới) cùng nhiều cải tiến về tốc độ và thông lượng. Lĩnh vực học máy đang phát triển rất nhanh chóng, và chúng tôi liên tục nâng cấp công nghệ của mình để người dùng luôn được cập nhật những tiến bộ mới nhất.
Tốc độ phát triển của ngành này đồng nghĩa với việc thường xuyên xuất hiện những ứng dụng AI mới đầy bất ngờ, cả tích cực lẫn tiêu cực. Chúng tôi sẽ chấm dứt quyền truy cập API đối với các trường hợp sử dụng rõ ràng gây hại, ví dụ như quấy rối, phát tán thư rác, truyền bá tư tưởng cực đoan, hoặc các chiến dịch truyền thông trá hình. Tuy nhiên, chúng tôi cũng biết rằng không thể lường trước mọi hậu quả có thể xảy ra bởi công nghệ này, vì vậy hôm nay chúng tôi sẽ ra mắt mô hình dưới dạng beta riêng tư thay vì phát hành rộng rãi, đồng thời xây dựng các công cụ giúp người dùng kiểm soát tốt hơn các nội dung mà API trả về, đồng thời nghiên cứu các khía cạnh liên quan đến an toàn của công nghệ ngôn ngữ (như phân tích, giảm thiểu và can thiệp vào các thiên kiến có hại). Chúng tôi sẽ chia sẻ những gì học được để người dùng của chúng tôi và cộng đồng rộng lớn hơn có thể xây dựng các hệ thống AI tích cực hơn cho con người.
Ngoài việc là nguồn doanh thu giúp chúng tôi trang trải chi phí để theo đuổi sứ mệnh của mình, API này còn thúc đẩy chúng tôi tập trung mạnh mẽ hơn vào công nghệ AI đa năng—thúc đẩy công nghệ, làm cho nó trở nên hữu dụng và xem xét các tác động của nó trong thực tế. Chúng tôi hy vọng rằng API này sẽ hạ thấp đáng kể rào cản(mở trong cửa sổ mới) trong việc tạo ra các sản phẩm tích hợp AI hữu ích, mang lại các công cụ và dịch vụ mà ngày nay ta khó có thể hình dung được.
Bạn quan tâm đến việc khám phá API? Hãy tham gia cùng các công ty như Algolia(mở trong cửa sổ mới), Quizlet(mở trong cửa sổ mới) và Reddit(mở trong cửa sổ mới), và các nhà nghiên cứu tại những tổ chức như Middlebury Institute(mở trong cửa sổ mới) trong chương trình beta riêng tư(mở trong cửa sổ mới) của chúng tôi.
Sau cùng, điều chúng tôi quan tâm nhất là đảm bảo trí tuệ nhân tạo tổng hợp mang lại lợi ích cho mọi người. Chúng tôi coi việc phát triển sản phẩm thương mại là một trong những cách để bảo đảm rằng chúng tôi có đủ nguồn lực tài chính để thành công.
Chúng tôi cũng tin rằng việc triển khai an toàn các hệ thống AI mạnh mẽ ra thế giới sẽ là thách thức khó khăn để thực hiện một cách đúng đắn. Khi phát hành API, chúng tôi sẽ hợp tác chặt chẽ với các đối tác để nhận diện những thách thức phát sinh khi các hệ thống AI được ứng dụng trong thực tế. Điều này sẽ giúp định hướng cho những nỗ lực của chúng tôi nhằm hiểu rõ hơn về quá trình triển khai các hệ thống AI trong tương lai, cũng như những gì chúng tôi cần làm để bảo đảm các hệ thống này an toàn và mang lại lợi ích cho tất cả mọi người.
Có ba lý do chính cho quyết định này. Thứ nhất, việc thương mại hóa công nghệ sẽ giúp chúng tôi chi trả cho hoạt động nghiên cứu AI, các nỗ lực đảm bảo an toàn và tuân thủ chính sách đang diễn ra.
Thứ hai, nhiều mô hình làm nền tảng của API rất lớn, đòi hỏi nhiều kiến thức chuyên môn để phát triển và triển khai, đồng thời cũng rất tốn kém để vận hành. Điều này khiến cho việc hưởng lợi từ công nghệ cốt lõi này trở nên khó khăn đối với hầu hết mọi người, ngoại trừ các tập đoàn lớn. Chúng tôi hy vọng rằng API sẽ giúp các hệ thống AI mạnh mẽ trở nên dễ tiếp cận hơn đối với các doanh nghiệp và tổ chức nhỏ hơn.
Thứ ba, mô hình API cho phép chúng tôi dễ dàng hơn trong việc ứng phó với những hành vi lạm dụng công nghệ. Bởi khó có thể dự đoán trước mọi trường hợp sử dụng tiềm ẩn của mô hình, việc phát hành thông qua API và mở rộng quyền truy cập theo thời gian sẽ an toàn hơn về bản chất, thay vì phát hành một mô hình mã nguồn mở mà chúng tôi không thể điều chỉnh quyền truy cập nếu vô tình bị sử dụng cho các mục đích gây hại.
Với GPT‑2, một trong những mối quan ngại chính của chúng tôi là việc mô hình này bị sử dụng với mục đích xấu (ví dụ: để tạo thông tin sai lệch), vốn rất khó ngăn chặn một khi mô hình đã được công khai mã nguồn. Đối với API, chúng tôi có thể ngăn chặn việc lạm dụng hiệu quả hơn nhờ giới hạn quyền truy cập cho những khách hàng và trường hợp sử dụng đã được phê duyệt. Chúng tôi có một quy trình xét duyệt bản chính thức bắt buộc trước khi các ứng dụng được đề xuất có thể đi vào hoạt động. Trong quá trình xét duyệt bản chính thức, chúng tôi sẽ đánh giá các ứng dụng dựa trên một số tiêu chí, đặt ra các câu hỏi như: Đây có phải là trường hợp sử dụng hiện đang được hỗ trợ?, Ứng dụng này có tính mở đến mức nào?, Ứng dụng này có mức độ rủi ro ra sao?, Bạn dự định giải quyết vấn đề lạm dụng tiềm ẩn như thế nào?, và Ai là người dùng cuối của ứng dụng của bạn?.
Chúng tôi sẽ chấm dứt quyền truy cập API đối với những trường hợp sử dụng được phát hiện gây ra (hoặc có chủ đích gây ra) tổn hại về thể chất, cảm xúc hoặc tâm lý cho con người, bao gồm nhưng không giới hạn ở các hành vi quấy rối, lừa đảo có chủ ý, cực đoan hóa, tạo dư luận giả mạo, hoặc phát tán tin nhắn rác, cũng như các ứng dụng không có đủ cơ chế bảo vệ để hạn chế việc lạm dụng bởi người dùng cuối. Khi có thêm kinh nghiệm vận hành API trong thực tế, chúng tôi sẽ liên tục tinh chỉnh các danh mục sử dụng mà chúng tôi có thể hỗ trợ, nhằm mở rộng phạm vi ứng dụng được hỗ trợ cũng như tạo ra các danh mục chi tiết hơn cho những trường hợp mà chúng tôi lo ngại về nguy cơ lạm dụng.
Một yếu tố quan trọng mà chúng tôi xem xét khi phê duyệt các trường hợp sử dụng API là mức độ mà một ứng dụng thể hiện hành vi có tính mở so với hành vi có tính ràng buộc liên quan đến khả năng tạo sinh nội dung tiềm ẩn của hệ thống. Các ứng dụng API có tính mở (tức là ứng dụng cho phép tạo ra một lượng lớn văn bản tùy chỉnh một cách dễ dàng thông qua lời nhắc tùy ý) sẽ đặc biệt dễ bị lạm dụng. Các ràng buộc có thể giúp những trường hợp sử dụng dạng tạo sinh trở nên an toàn hơn bao gồm: thiết kế hệ thống có sự tham gia của con người, các hạn chế quyền truy cập của người dùng cuối, hậu xử lý kết quả đầu ra, lọc nội dung, giới hạn độ dài đầu vào/đầu ra, giám sát chủ động và giới hạn về chủ đề.
Chúng tôi cũng đang tiếp tục tiến hành nghiên cứu về các tình huống lạm dụng tiềm ẩn của các mô hình được cung cấp qua API, bao gồm hợp tác với các nhà nghiên cứu bên thứ ba qua chương trình truy cập cho mục đích học thuật(mở trong cửa sổ mới). Hiện tại, chúng tôi đang bắt đầu với một số lượng rất hạn chế các nhà nghiên cứu và đã có một số kết quả từ các đối tác học thuật của chúng tôi tại Viện Middlebury(mở trong cửa sổ mới), Đại học Washington và Viện Trí tuệ Nhân tạo Allen(mở trong cửa sổ mới). Chúng tôi đã có hàng chục nghìn người đăng ký cho chương trình này và hiện đang ưu tiên các đơn đăng ký tập trung vào nghiên cứu về tính công bằng và tính đại diện.
Việc giảm thiểu các tác động tiêu cực như thiên kiến có hại là một vấn đề khó khăn, mang tính toàn ngành và cực kỳ quan trọng. Như đã thảo luận trong bài báo về GPT‑3(mở trong cửa sổ mới) và thẻ mô hình(mở trong cửa sổ mới), các mô hình API của chúng tôi thực sự có những biểu hiện thiên kiến mà sẽ được phản ánh trong nội dung được chúng tạo ra. Dưới đây là các bước chúng tôi đang thực hiện để giải quyết những vấn đề này:
- Chúng tôi đã xây dựng các nguyên tắc sử dụng nhằm giúp nhà phát triển hiểu rõ và giải quyết các vấn đề an toàn tiềm ẩn.
- Chúng tôi đang hợp tác chặt chẽ với người dùng để hiểu rõ các trường hợp sử dụng của họ và phát triển các công cụ để nhận biết cũng như can thiệp nhằm giảm thiểu thiên kiến có hại.
- Chúng tôi đang tự nghiên cứu về các biểu hiện thiên kiến có hại cũng như các vấn đề rộng hơn về tính công bằng và tính đại diện. Điều này sẽ cung cấp thông tin định hướng cho công việc của chúng tôi qua việc cải thiện tài liệu hướng dẫn cho các mô hình hiện hữu, đồng thời mang lại nhiều cải tiến khác cho các mô hình trong tương lai.
- Chúng tôi nhận thấy rằng thiên kiến là một vấn đề biểu hiện ở điểm giao thoa giữa một hệ thống và bối cảnh triển khai của nó; các ứng dụng được xây dựng bằng công nghệ của chúng tôi là những hệ thống kỹ thuật - xã hội, vì vậy chúng tôi làm việc với các nhà phát triển để đảm bảo họ đang áp dụng các quy trình phù hợp và các hệ thống có sự tham gia của con người để giám sát các hành vi bất lợi.
Mục tiêu của chúng tôi là tiếp tục nâng cao hiểu biết về những tác hại tiềm ẩn của API trong từng ngữ cảnh sử dụng, và không ngừng cải thiện các công cụ cũng như quy trình của mình để giúp giảm thiểu những tác hại đó.
Cập nhật ngày 18 tháng 9 năm 2020


