Giới thiệu mô hình tạo sinh ảnh mới nhất của chúng tôi trong API
Khi chúng tôi ra mắt tính năng tạo sinh ảnh trong ChatGPT vào tháng trước, nó nhanh chóng trở thành một trong những tính năng phổ biến nhất của chúng tôi: hơn 130 triệu người dùng trên toàn thế giới đã tạo ra hơn 700 triệu hình ảnh chỉ trong tuần đầu tiên(mở trong cửa sổ mới).
Hôm nay, chúng tôi đưa mô hình đa phương thức gốc hỗ trợ trải nghiệm này trong ChatGPT vào API thông qua gpt-image-1, cho phép các nhà phát triển và doanh nghiệp dễ dàng tích hợp khả năng tạo sinh hình ảnh chất lượng cao, chuyên nghiệp trực tiếp vào các công cụ và nền tảng của riêng họ. Tính linh hoạt của mô hình cho phép tạo hình ảnh theo nhiều phong cách khác nhau, tuân theo đúng các hướng dẫn tùy chỉnh, tận dụng kiến thức thế giới và hiển thị văn bản chính xác, nhớ đó mở ra vô số ứng dụng thực tế trong nhiều lĩnh vực.
Các doanh nghiệp và công ty khởi nghiệp hàng đầu trong nhiều ngành bao gồm công cụ sáng tạo, thương mại điện tử, giáo dục, phần mềm doanh nghiệp, trò chơi điện tử, hiện đang sử dụng công nghệ tạo sinh ảnh trong các sản phẩm và trải nghiệm của họ. Chúng tôi rất hào hứng chia sẻ một số ví dụ dưới đây.
Hệ sinh thái công cụ sáng tạo hàng đầu của Adobe bao gồm các ứng dụng Firefly và Express sẽ cung cấp quyền truy cập vào khả năng tạo sinh ảnh của OpenAI, mang đến cho người sáng tạo khả năng lựa chọn và tính linh hoạt để thử nghiệm các phong cách thẩm mỹ khác nhau - điều mà các nhân viên kinh doanh, người tiêu dùng và người sáng tạo đều coi trọng trong quá trình tìm tòi những ý tưởng sáng tạo mới.
Chúng tôi cũng đang tiếp tục làm việc với các nhà phát triển và doanh nghiệp để khám phá thêm nhiều cách thức giúp tính năng tạo sinh ảnh trong API có thể phục vụ cho mục đích sử dụng của họ, bao gồm:
Thiết kế và biên tập: Canva đang tìm cách tích hợp gpt-image-1 của OpenAI để mở rộng các khả năng tạo và chỉnh sửa thiết kế trong các công cụ Canva AI và Magic Studio. Thông qua các khả năng của gpt-image-1 như chuyển đổi các bản phác thảo thô thành các thành phần đồ họa tuyệt đẹp và cho phép chỉnh sửa hình ảnh có độ trung thực cao, Canva sẽ tiếp tục hỗ trợ 230 triệu người dùng hiện thực hóa ý tưởng của họ theo những cách hoàn toàn mới.
Tạo và chỉnh sửa logo: GoDaddy đang tích cực thử nghiệm tích hợp tính năng tạo sinh ảnh để khách hàng có thể dễ dàng tạo logo chỉnh sửa được, xóa nền và tạo kiểu chữ chuyên nghiệp. Ngoài ra, với trải nghiệm mới cùng GoDaddy Airo®, nhóm đang nỗ lực hướng tới mục tiêu giúp khách hàng tạo các bài đăng trên mạng xã hội và nội dung tiếp thị phản ánh bản sắc thương hiệu độc đáo của họ cho nội dung sản phẩm và thương hiệu gốc được tạo ra từ lời nhắc.
Xây dựng tài liệu tiếp thị: HubSpot đang khám phá cách giúp khách hàng tạo tài liệu tiếp thị và bán hàng bằng khả năng tạo sinh ảnh AI mới của OpenAI . Khi HubSpot tiếp tục bổ sung các công cụ được hỗ trợ bởi AI mới để mở rộng quy mô hoạt động kinh doanh, các khả năng tạo sinh ảnh này có tiềm năng thay đổi cách khách hàng tạo ra hình ảnh chất lượng cao cho mạng xã hội, tiếp thị qua email và trang đích mà không cần đến chuyên môn thiết kế đặc biệt.
Tạo công thức nấu ăn và danh sách mua sắm: Instacart đang thử nghiệm những cách mới để sử dụng API nhằm tạo hình ảnh, bao gồm hình ảnh cho công thức nấu ăn và danh sách mua sắm.
Chỉnh sửa video: invideo cho phép hàng triệu người dùng chuyển đổi ý tưởng của mình thành video bằng AI. Với sự tích hợp gpt-image-1, nền tảng này hiện cung cấp khả năng tạo văn bản nâng cao, các tùy chọn chỉnh sửa chi tiết và hướng dẫn về phong cách nâng cao.
Mô hình gpt-image-1 trong API tận dụng các biện pháp bảo vệ an toàn giống như tính năng tạo sinh ảnh 4o trong ChatGPT, bao gồm các quy định hạn chế ngăn mô hình tạo ra hình ảnh có hại và bao gồm siêu dữ liệu C2PA trong hình ảnh được tạo ra—bạn có thể đọc thêm về điều này trong bài đăng blog trước đây của chúng tôi tại đây. Ngoài ra, các nhà phát triển cũng có thể kiểm soát độ nhạy kiểm duyệt bằng tham số `moderation`, có thể được đặt thành auto (mặc định) để lọc tiêu chuẩn hoặc low để lọc ít hạn chế hơn. Tìm hiểu thêm trong tài liệu(mở trong cửa sổ mới) của chúng tôi.
Theo mặc định, chúng tôi không bao giờ huấn luyện các mô hình dựa trên dữ liệu API của khách hàng và tất cả hình ảnh đầu vào cũng như đầu ra đều phải tuân thủ chính sách sử dụng API của chúng tôi.
Mức giá sử dụng gpt-image-1 được tính theo mỗi token, với giá riêng cho token văn bản và token hình ảnh:
- Token đầu vào văn bản (văn bản lời nhắc): $5 cho 1 triệu token
- Token đầu vào hình ảnh (hình ảnh đầu vào): $10 cho 1 triệu token
- Token đầu ra hình ảnh (hình ảnh được tạo): $40 cho 1 triệu token
Trên thực tế, điều này tương đương với khoảng $0,02, $0,07 và $0,19 cho mỗi hình ảnh vuông được tạo ra, tương ứng ở mức chất lượng thấp, trung bình và cao. Để biết giá chi tiết theo chất lượng hình ảnh và kích thước, hãy xem tài liệu(mở trong cửa sổ mới).
Mô hình gpt-image-1 hiện đã có sẵn trên toàn cầu thông qua API Hình ảnh và sẽ sớm được hỗ trợ trong API Phản hồi. Một số nhà phát triển có thể cần xác minh(mở trong cửa sổ mới) tổ chức của mình trước khi có thể sử dụng mô hình. Vui lòng kiểm tra cài đặt tổ chức(mở trong cửa sổ mới) để xem bạn đã có quyền truy cập hay chưa.
Để bắt đầu, hãy khám phá khả năng của mô hình trong playground(mở trong cửa sổ mới) và xem hướng dẫn tạo sinh ảnh(mở trong cửa sổ mới) của chúng tôi. Chúng tôi hi vọng sớm được thấy những gì bạn xây dựng.