Nền tảng vững chắc hơn cho bộ nhớ ChatGPT
Cải thiện khả năng tổng hợp bộ nhớ trong ChatGPT để tối ưu hóa tính cập nhật, tính liên tục và độ liên quan.
Hôm nay, chúng tôi bắt đầu triển khai một hệ thống tổng hợp bộ nhớ mạnh mẽ và có khả năng mở rộng tốt hơn. Hệ thống này được phát triển nhằm giải quyết các thách thức về tính lỗi thời, độ chính xác và khả năng mở rộng mà chúng tôi ghi nhận khi áp dụng tính năng bộ nhớ cho hàng trăm triệu người dùng và các khoảng thời gian kéo dài nhiều năm trong ChatGPT.
Bộ nhớ là yếu tố giúp ChatGPT học các sở thích, dự án và ràng buộc của bạn, cho phép các cuộc trò chuyện trong tương lai bắt đầu từ ngữ cảnh chung thay vì từ con số không.
Trong hai năm qua, bộ nhớ đã trở thành một phần quan trọng của trải nghiệm ChatGPT, giúp ChatGPT hiểu rõ hơn ngữ cảnh của bạn để có thể hỗ trợ bạn đạt được những mục tiêu có ý nghĩa theo thời gian. Điều này là cốt lõi để khiến ChatGPT hữu ích hơn: hiểu bạn, giúp bạn và làm được nhiều hơn cho bạn.
Bản cập nhật này hiện có sẵn cho người dùng Plus và Pro tại Hoa Kỳ từ hôm nay, và sẽ được triển khai tới nhiều quốc gia hơn cũng như người dùng Free và Go trong những tuần tới.
Bộ nhớ lần đầu ra mắt vào tháng 4 năm 2024 (còn được gọi là các ký ức đã lưu). Tính năng này cho phép bạn yêu cầu ChatGPT ghi nhớ thông tin và mang thông tin đó sang các cuộc trò chuyện trong tương lai.

Các ký ức đã lưu chỉ được ghi trong cuộc trò chuyện và dựa vào các tín hiệu mạnh để quyết định khi nào kích hoạt bộ nhớ, chẳng hạn như chỉ dẫn “hãy nhớ rằng tôi sẽ đi Singapore vào tháng 7”. Trên thực tế, việc tương tác với hệ thống này có thể giống như nói chuyện với một người có ghi vài ghi chú, nhưng vẫn quên mọi thứ không được viết ra. Các ký ức đã lưu cũng có xu hướng trở nên lỗi thời theo thời gian và cuối cùng trở nên không chính xác hoặc không còn liên quan.
Vào tháng 4 năm 2025, chúng tôi đã cập nhật tính năng bộ nhớ của ChatGPT bằng cách cung cấp cho mô hình khả năng tham chiếu bối cảnh trò chuyện nằm ngoài danh sách bộ nhớ đã lưu; điều này được thực hiện bằng cách giới thiệu phiên bản đầu tiên của dreaming (mơ)—một phương pháp để ChatGPT tự động chọn lọc bộ nhớ ở chế độ nền bằng cách tham chiếu lịch sử trò chuyện.

Trái ngược với các bộ nhớ đã lưu, 'dreaming' tận dụng một quy trình chạy ngầm cho phép ChatGPT học hỏi từ nhiều cuộc trò chuyện khác nhau và tổng hợp trạng thái bộ nhớ của chính nó, từ đó luôn cung cấp bối cảnh mới nhất và phù hợp nhất cho các cuộc trò chuyện của bạn. 'Dreaming' cũng giúp bộ nhớ dễ dàng tiếp thu các bối cảnh diễn ra tự nhiên trong cuộc hội thoại mà không cần phụ thuộc vào các yêu cầu ghi nhớ rõ ràng.
Trong năm qua, 'dreaming' đã bổ sung cho các bộ nhớ đã lưu để tạo ra một bước tiến vượt bậc trong khả năng cá nhân hóa các câu trả lời của ChatGPT, đồng thời bù đắp cho tính lỗi thời của các bộ nhớ đã lưu trước đó. Tuy nhiên, về mặt lịch sử, bản thân nó chưa bao giờ là đủ nếu hoạt động như một hệ thống bộ nhớ độc lập.
Hôm nay, chúng tôi sẽ ra mắt một kiến trúc bộ nhớ mạnh mẽ hơn đáng kể và tối ưu hóa hiệu suất tính toán hơn, được xây dựng dựa trên nền tảng của dreaming.
Các ghi nhớ được dreaming tổng hợp có thể được xem lại thông qua phần tóm tắt hiển thị trên trang tóm tắt bộ nhớ. Từ phần tóm tắt bộ nhớ, bạn có thể nhanh chóng nắm được những điểm nổi bật về những gì ChatGPT biết về bạn, thêm hoặc cập nhật thông tin về bản thân, và cung cấp chỉ dẫn về những chủ đề ChatGPT nên nhắc đến cũng như thời điểm nhắc đến. Nếu bạn muốn tìm hiểu sâu hơn về một lĩnh vực cụ thể, chỉ cần trò chuyện với mô hình.

Khi hình dung về một “bộ nhớ tốt” trong ChatGPT, chúng tôi nghĩ đến một vài điều:
- Duy trì ngữ cảnh hữu ích: Bạn nói với ChatGPT điều gì đó một lần, và ChatGPT ghi nhớ thông tin đó trong các cuộc trò chuyện sau này của bạn.
- Tuân theo sở thích và ràng buộc: Nếu bạn mô tả một sở thích (ví dụ: bạn ăn chay), thì ChatGPT nên thực hiện các hành động phù hợp với sở thích đó trong tương lai.
- Cập nhật theo thời gian: Bộ nhớ nên tính đến sự trôi qua của thời gian. Hãy tưởng tượng “Người dùng đang lên kế hoạch cho tiệc sinh nhật của họ vào thứ bảy tuần tới”; rồi cuối cùng, chủ nhật cũng đến.
Chúng tôi có thể đánh giá bộ nhớ của ChatGPT Plus và Pro đã cải thiện theo thời gian như thế nào đối với từng mục tiêu trong ba mục tiêu về bộ nhớ ở trên. Chúng tôi thực hiện việc này cho từng trường hợp sau:
- 2024: Các ghi nhớ đã lưu
- 2025: Các ghi nhớ đã lưu + Dreaming bản V0
- 2026: Dreaming bản V3
Khi bắt đầu một cuộc trò chuyện mới với ChatGPT, bạn không cần giới thiệu lại bản thân từ đầu. ChatGPT có thể giúp bạn tiết kiệm thời gian và xây dựng dựa trên ngữ cảnh trước đó, đặc biệt với các dự án phức tạp, kéo dài.
Ví dụ, hãy tưởng tượng bạn đang dùng ChatGPT để mua thiết bị máy ảnh mới tương thích với máy ảnh hiện tại của mình. Nếu trước đây bạn đã thảo luận với ChatGPT về bộ thiết bị máy ảnh của mình, bạn có thể hỏi về các sản phẩm tương thích với “bộ thiết bị nhiếp ảnh của tôi” và nhận được đề xuất được điều chỉnh theo nhu cầu của bạn.
GPT-5.2 Instant
Mô hình tạo ra một phản hồi chung chung, khiến người dùng phải tự thực hiện các bước kiểm tra tương thích phức tạp.
GPT-5.3 Instant
Mô hình nhớ bộ thiết bị máy ảnh của người dùng và đề xuất một sản phẩm tương thích.
GPT‑5.2 Instant cuối cùng cũng trả lời câu hỏi, nhưng trong nỗ lực giải thích các ranh giới an toàn của mình, lại mở đầu bằng một phần mở đầu dài dòng về những gì mô hình này không thể giúp ích. Mặt khác, GPT‑5.3 Instant đi thẳng vào câu trả lời.
Chúng tôi có thể xây dựng một bài đánh giá từ các ví dụ tương tự, trong đó mô hình được yêu cầu trả lời một câu lệnh đòi hỏi nó nhớ lại thông tin thực tế về người dùng. Sau đó, mô hình được thưởng nếu phản hồi theo cách sử dụng đúng ngữ cảnh liên quan. Trong đánh giá này, hệ thống mới dựa trên dreaming cải thiện được khả năng nhớ lại các sự kiện liên quan của mô hình .
Bộ nhớ cũng giúp ChatGPT phản hồi theo những cách phù hợp hơn với sở thích và ràng buộc của bạn.
Hãy tưởng tượng bạn đang lên kế hoạch cho một chuyến đi Singapore. Hai tháng trước chuyến đi, bạn nhờ ChatGPT trợ giúp lập lịch trình. Từ việc lập kế hoạch du lịch trước đây, ChatGPT đã biết rằng bạn thích chụp ảnh động vật hoang dã, thích khách sạn có điều hòa mạnh và thích một bữa tối yên tĩnh hơn là một quán bar đông đúc.
GPT-5.2 Instant
Mô hình tạo ra một phản hồi chung chung, hợp với khách du lịch hơn, không giúp ích cho việc đặt khách sạn và phần lớn bỏ qua các sở thích của người dùng.
GPT-5.3 Instant
Mô hình tạo ra một phản hồi được cá nhân hóa theo sở thích chụp ảnh động vật hoang dã, bữa tối yên tĩnh và các ưu tiên của người dùng khi đặt khách sạn.
GPT‑5.2 Instant cuối cùng cũng trả lời câu hỏi, nhưng trong nỗ lực giải thích các ranh giới an toàn của mình, lại mở đầu bằng một phần mở đầu dài dòng về những gì mô hình này không thể giúp ích. Mặt khác, GPT‑5.3 Instant đi thẳng vào câu trả lời.
Sở thích có thể có nhiều dạng:
- Hướng dẫn ChatGPT cách nên phản hồi (“đừng nhắc đến Stan nữa”).
- Sở thích hoặc ràng buộc cá nhân của bạn (“Tôi ăn chay”)
- Các sở thích ngầm định định hình điều gì liên quan đến bạn (“Tôi sống gần San Francisco” → các lựa chọn địa phương nên được điều chỉnh theo khu vực này)
Khi phát triển hệ thống bộ nhớ mới, chúng tôi đã cải thiện khả năng của ChatGPT trong việc áp dụng các sở thích liên quan từ những cuộc trò chuyện trước đây. Theo ví dụ “Tôi ăn chay” ở trên, chúng tôi có thể đánh giá liệu mô hình có tận dụng đúng bộ nhớ để đưa ra các lựa chọn ăn uống phù hợp với người ăn chay khi một người dùng ăn chay yêu cầu gợi ý chuẩn bị bữa ăn hay không.
Thời gian không dừng lại khi cuộc trò chuyện của bạn kết thúc.
Các hệ thống bộ nhớ truyền thống có thể trở nên lỗi thời. Ví dụ, bạn nói với ChatGPT “Tôi đang ở Singapore và cần một gợi ý ăn tối cho tối nay”. Sau đó thời gian trôi qua, chuyến đi của bạn kết thúc, và bạn tự hỏi tại sao ChatGPT vẫn nghĩ bạn đang ở Singapore.
Với dreaming, ký ức được tự động cập nhật khi thời gian trôi qua, cho phép ChatGPT sửa đổi bộ nhớ từ “Bạn sẽ đi Singapore vào tháng 7” thành “Bạn đã đi Singapore vào tháng 7 năm 2026” khi chuyến đi kết thúc. Sau đó, khi bạn về nhà, ChatGPT lại có thể đưa ra các đề xuất được điều chỉnh theo địa điểm nhà ở và múi giờ của bạn.
GPT-5.2 Instant
Mô hình nghĩ rằng người dùng vẫn đang ở Singapore.
GPT-5.3 Instant
Mô hình cung cấp các phản hồi liên quan đến địa điểm nhà riêng của người dùng.
GPT‑5.2 Instant cuối cùng cũng trả lời câu hỏi, nhưng trong nỗ lực giải thích các ranh giới an toàn của mình, lại mở đầu bằng một phần mở đầu dài dòng về những gì mô hình này không thể giúp ích. Mặt khác, GPT‑5.3 Instant đi thẳng vào câu trả lời.
Trong các đánh giá bộ nhớ của chúng tôi, chúng tôi đo lường liệu ChatGPT có thể phản hồi chính xác các câu lệnh mà sự trôi qua của thời gian ảnh hưởng đáng kể đến câu trả lời hoặc đề xuất đúng hay không. Dreaming mang lại sự cải thiện đáng kể trong lĩnh vực này:
Tại OpenAI, sứ mệnh của chúng tôi là đảm bảo trí tuệ nhân tạo tổng hợp mang lại lợi ích cho toàn thể nhân loại.
Mặc dù bộ nhớ dựa trên dreaming đã có sẵn cho người dùng Plus và Pro trong một thời gian, chỉ đến nay chúng tôi mới có thể cung cấp cho người dùng Free một phiên bản đáp ứng tiêu chuẩn chất lượng của chúng tôi và thực tế để phục vụ ở quy mô lớn. Những cải tiến gần đây đã giảm khoảng 5 lần lượng điện toán cần thiết để phục vụ dreaming cho người dùng Free, giúp có thể bắt đầu triển khai dreaming cho người dùng Free trong những tuần tới và tăng dung lượng bộ nhớ cho người dùng Plus và Pro.
Nhìn về phía trước, dreaming hiện cung cấp cho chúng tôi một nền tảng bộ nhớ chung cho tất cả người dùng. Bản cập nhật này đại diện cho hệ thống bộ nhớ có năng lực nhất của chúng tôi từ trước đến nay, và chúng tôi sẽ tiếp tục cải thiện nó.
Để tìm hiểu thêm về bản phát hành này và các quyền kiểm soát bộ nhớ dành cho người dùng, hãy truy cập Câu hỏi thường gặp về Bộ nhớ(mở trong cửa sổ mới) của chúng tôi.




