Dự đoán token tiếp theo

📖 Nội dung bài học

Bạn sẽ học được gì

Thời gian ước tính: 30 phút

Đến cuối bài học này, bạn sẽ có thể:

Giải thích Dự đoán token tiếp theo là cơ chế cốt lõi của AI tạo sinh và tại sao nó tạo ra cả sự trôi chảy và ảo giác
Xác định các tác vụ trên đường liên tục Dự đoán token tiếp theo (con đường mòn và lãnh thổ mới lạ)
Xác định tính cụ thể (tên, ngày tháng, trích dẫn, số liệu thống kê) là khu vực tập trung vào việc tạo ra
Nhận biết các tính năng sản phẩm (trích dẫn, báo hiệu sự không chắc chắn, tạo bị giới hạn, mẫu trình tạo-xác minh) là các biện pháp giảm thiểu cho giới hạn này

Cách các mô hình AI sử dụng dự đoán token tiếp theo

(4 phút)

AI tạo sinh giống như một tính năng tự động hoàn thành cực kỳ tinh vi hơn là một công cụ tìm kiếm. Nó viết câu trả lời từng từ một dựa trên những gì có xu hướng theo sau. Thuộc tính duy nhất đó mang lại cho bạn cả sự trôi chảy và ảo giác.

Tự động hoàn thành ở quy mô lớn

Trước khi bạn đọc

Bạn nghĩ "tóm tắt một báo cáo dài" nằm ở đâu trên đường liên tục Dự đoán token tiếp theo? Kéo điểm đánh dấu bên dưới, sau đó khóa phỏng đoán của bạn.

Hạn chế khả năng

Nhiệm vụ của bạn

Con đường mòn: tóm tắt, định dạng lại, giải thích các khái niệm phổ biến Lãnh thổ mới lạ, các mẫu thưa thớt, "đúng so với nghe có vẻ đúng"

Điều này cho phép

Văn bản trôi chảy, nghe tự nhiên ở hầu hết mọi kiểu hoặc định dạng
Tổng hợp nhanh chóng các ý tưởng trên các lĩnh vực khác nhau
Hiệu suất mạnh mẽ trên các tác vụ giống với những gì mô hình đã thấy trước đây
Tiếp tục mạch lạc của bất kỳ chủ đề nào (một câu chuyện, một lập luận, một khối mã)

Nơi nó thường thất bại

Ảo giác: phần tiếp theo có vẻ hợp lý không phải lúc nào cũng là sự thật
Bịa đặt: lấp đầy các khoảng trống bằng tài liệu có vẻ hợp lý thay vì đánh dấu chúng
Không nhất quán: lấy mẫu có nghĩa là cùng một prompt có thể tạo ra các kết quả khác nhau
Sự tự tin sai chỗ: văn xuôi mượt mà có thể bao bọc một phỏng đoán

Các tính năng sản phẩm đẩy lùi giới hạn

Trích dẫn & cơ sở nguồn: theo dõi những gì được hỗ trợ so với những gì được tạo ra
Báo hiệu sự không chắc chắn: mô hình đánh dấu sự không chắc chắn của chính nó
Tạo bị giới hạn / kỹ năng: thu hẹp không gian nơi việc bịa đặt lẻn vào

Kéo điểm đánh dấu để đặt phỏng đoán của bạn cho "tóm tắt một báo cáo dài". Bảng điều khiển sáng lên cho bạn biết cần chú ý điều gì.

Khóa phỏng đoán của tôi

Kiểm tra trực giác của bạn

Khóa phỏng đoán của bạn ở trên để so sánh với vị trí điển hình.

Tùy chỉnh

Chiều cao thanh

Kích thước hình tượng

Bảng màu Bầu trời → Đất sét Ô liu → Đất sét Xương rồng → Hình đá bảng → Đất sét

Những điểm chính cần ghi nhớ

Dự đoán token tiếp theo đề cập đến thực tế là AI tạo sinh viết câu trả lời từng từ một dựa trên những gì có xu hướng theo sau.
- Khu vực khả năng: các tác vụ giống với các mẫu mà mô hình đã thấy nhiều lần (tóm tắt, định dạng lại, giải thích các khái niệm phổ biến).
- Khu vực hạn chế: lãnh thổ mới lạ hoặc thưa thớt và bất cứ nơi nào tác vụ yêu cầu phân biệt "đúng" với "nghe có vẻ đúng".
- Việc bịa đặt tập trung vào tính cụ thể: tên, ngày tháng, số liệu thống kê, trích dẫn, URL, trích dẫn. Một tuyên bố càng chính xác, nó càng cần được xác minh.
- Các tính năng sản phẩm như trích dẫn, báo hiệu sự không chắc chắn, tạo bị giới hạn và vòng lặp trình tạo-xác minh tồn tại đặc biệt để đẩy giới hạn này ra xa hơn.
Kết nối 4D: Dự đoán token tiếp theo là nền tảng của Sự phân biệt. Biết đầu ra đã được tạo cho bạn biết chính xác loại kiểm tra nào cần áp dụng.

Bài tập

Bài tập: Bài kiểm tra xác minh

Tại sao? Bây giờ bạn biết rằng cùng một quy trình tạo sinh giúp AI trôi chảy là quy trình khiến nó bịa đặt. Đã đến lúc xem điều đó trên lãnh địa của riêng bạn, trong một lĩnh vực mà bạn sẽ bắt gặp nó.

Quay lại danh sách tác vụ của bạn và chọn tác vụ mà bạn tự tin nhất về chuyên môn của mình. Bạn cần một chủ đề mà bạn là chuyên gia, bởi vì bạn cần có thể xác minh những gì trả về. Viết ra năm sự thật cụ thể, có thể kiểm tra được từ lĩnh vực đó: chức danh công việc của một người, ngày xuất bản, số liệu thống kê, thông số kỹ thuật sản phẩm, trích dẫn trực tiếp, URL. Những điều bạn biết là chính xác và có thể xác nhận một cách độc lập.

Bây giờ hãy chạy ba lần thăm dò:

Thăm dò 1: Khu vực khả năng. Yêu cầu AI giải thích hoặc tóm tắt một khái niệm nổi tiếng trong lĩnh vực của bạn. Một cái gì đó phổ biến và được ghi lại đầy đủ. Lưu ý sự trôi chảy. Kiểm tra tại chỗ nội dung. Đây là cảm giác của khu vực khả năng: trôi chảy, tự tin và phần lớn chính xác.
Thăm dò 2: Tính cụ thể dưới áp lực. Yêu cầu AI cung cấp năm thông tin cụ thể có thể kiểm tra được trong lĩnh vực của bạn: trích dẫn ba nguồn, nêu tên một tác giả, đưa ra các con số chính xác, cung cấp một URL. Xác minh mọi thứ. Chấm điểm trên năm: có bao nhiêu cái hoàn toàn chính xác? Nếu nó bịa đặt, hãy lưu ý nó nghe có vẻ tự tin như thế nào khi làm điều đó.
Thăm dò 3: Lấy mẫu trong hành động. Chạy chính xác cùng một yêu cầu về các sự kiện cụ thể trong một cuộc trò chuyện mới. So sánh hai kết quả. Điều gì vẫn nhất quán? Điều gì đã thay đổi? Sự thay đổi mà bạn thấy là quá trình lấy mẫu của Dự đoán token tiếp theo đang hoạt động.

Mục tiêu mở rộng: Chạy lại Thăm dò 2 trong một công cụ có trích dẫn được bật (chẳng hạn như chế độ Nghiên cứu trong Claude). Chấm điểm lại. Việc có các nguồn để kiểm tra có thay đổi điểm số không?

Phản ánh bài học

Bạn có bắt được những sự bịa đặt trong một lĩnh vực mà bạn không biết rõ không?
Hãy xem danh sách tác vụ của bạn: những tác vụ nào nằm chủ yếu trong khu vực khả năng và những tác vụ nào đẩy vào tính cụ thể cần được xác minh?

Tiếp theo là gì

Dự đoán token tiếp theo giải thích cách AI tạo ra. Tiếp theo, chúng ta xem xét nó đang tạo ra từ: thuộc tính Kiến thức. Mô hình thực sự biết gì, kiến thức đó đến từ đâu và những khoảng trống ở đâu?

Phản hồi

Khi bạn tiến bộ trong khóa học, chúng tôi rất muốn nghe từ bạn về cách bạn đang sử dụng các khái niệm từ khóa học trong công việc của mình, cộng với bất kỳ phản hồi nào bạn có thể có. Chia sẻ phản hồi của bạn tại đây.

Ghi nhận và giấy phép

Bản quyền 2026 Anthropic. Công trình gốc dựa trên Khung trôi chảy AI do GS. Rick Dakan (Đại học Nghệ thuật và Thiết kế Ringling) và GS. Joseph Feller (Đại học Cao đẳng Cork) phát triển. Phát hành theo giấy phép CC BY-NC-SA 4.0.

🎬 Bản ghi video

Source video: kl0gunXTvyk

📜 Mở rộng bản ghi (đã chỉnh sửa + dịch AI)

Thấu hiểu về Dự đoán Token tiếp theo (Next Token Prediction)

Chào mọi người, tôi là David thuộc đội ngũ an toàn tại Anthropic. Hôm nay, tôi sẽ chia sẻ về next token prediction – một đặc tính cốt lõi quyết định nguồn gốc thực sự của các câu trả lời từ AI. Chúng ta sẽ tìm hiểu điều gì thực sự xảy ra khi AI phản hồi, tại sao cùng một cơ chế tạo ra văn bản trôi chảy lại có thể tạo ra những sự thật giả mạo, và cách xác định nhiệm vụ của bạn đang nằm ở phân vùng nào.

Nếu bạn chỉ cần hiểu một điều duy nhất về cách AI tạo sinh hoạt động, thì đó chính là: cốt lõi của các hệ thống này là sự dự đoán. Dựa trên tất cả những gì đã được viết trước đó, mô hình sẽ dự đoán phần tiếp theo, từng mảnh một. AI tạo sinh đang tạo ra câu trả lời bằng cách cấu thành nó từng từ một dựa trên xu hướng từ nào thường đi sau từ nào. Nó giống như một hệ thống tự động hoàn thiện (auto-complete) cực kỳ tinh vi hơn là một công cụ tìm kiếm. Sự khác biệt này rất quan trọng, vì một trích dẫn trông có vẻ thật có thể thỏa mãn một cấu trúc mẫu (pattern) tốt ngang ngửa với một trích dẫn trỏ đến một bài báo thực sự tồn tại.

Vùng năng lực và Ngưỡng giới hạn

Hãy xem ví dụ thực tế. Tôi yêu cầu Claude tóm tắt lập luận trong một bài luận nổi tiếng. Hãy chú ý cách nó tạo ra văn bản mạch lạc, rõ ràng rất nhanh chóng. Đây là một "lối mòn" quen thuộc; mô hình đã gặp tác vụ này hàng ngàn lần.

Bây giờ, hãy xem điều gì xảy ra khi tôi yêu cầu một thứ ở vùng biên (the edge). Giả sử tôi yêu cầu nó liệt kê ba bài báo nghiên cứu của một nhà nghiên cứu tầm trung trong một lĩnh vực ngách kèm theo năm xuất bản. Nó vẫn giữ tông giọng tự tin và văn phong trôi chảy, nhưng "lối mòn" ở đây rất mờ nhạt, và mô hình đang tạo ra thứ trông có vẻ là một câu trả lời tốt. Một số thông tin có thể là thật, một số có thể là giả mạo – bạn buộc phải kiểm tra kết quả đầu ra.

Cùng một quy trình tạo sinh luôn vận hành khi bạn làm việc với AI. Điều thay đổi là mức độ "mòn" của lối đi đó. Những tác vụ mà mô hình đã thấy qua vô số biến thể sẽ nằm trong "vùng năng lực" (capability zone): tóm tắt, định dạng lại, giải thích các khái niệm phổ biến hoặc soạn thảo theo phong cách quen thuộc. Next token prediction tỏa sáng ở đây vì các mẫu (patterns) rất dày đặc và nhất quán. Khi bạn tiến dần về phía vùng biên, các mẫu này thưa dần. Những lãnh thổ mới lạ và các chủ đề ít người biết sẽ dịch chuyển về phía vùng biên; mô hình vẫn tiếp tục tạo nội dung trôi chảy, nhưng nền tảng bên dưới bắt đầu lung lay.

Ưu điểm và Hạn chế của Quy trình Tạo sinh

Ưu điểm và hạn chế thực chất là hai mặt của cùng một đặc tính. Sự trôi chảy của các khái niệm có liên quan rộng rãi đến từ next token prediction. Sự ảo giác (hallucination) cũng đến từ next token prediction. Bạn sẽ trải nghiệm một trong hai tùy thuộc vào việc tác vụ của bạn nằm ở đâu trên dải phân phổ đó.

Về mặt ưu điểm, chúng ta thấy:

Văn bản trôi chảy ở bất kỳ văn phong nào.
Khả năng tổng hợp nhanh chóng giữa các lĩnh vực.
Hiệu suất mạnh mẽ đối với bất kỳ nội dung nào tương tự như những gì mô hình đã thấy trước đây.
Sự tiếp nối mạch lạc cho bất kỳ luồng tư duy nào bạn đưa ra.

Về mặt hạn chế, chúng ta thấy:

Ảo giác (Hallucinations).
Tính thiếu nhất quán.
Sự tự tin đặt sai chỗ.

Các tính năng sản phẩm giúp Đối chiếu thực tế và An toàn

Các phòng thí nghiệm tiên phong đã xây dựng các tính năng sản phẩm để hỗ trợ vấn đề này:

Trích dẫn và đối chiếu nguồn (Citations and source grounding): Cho phép bạn truy xuất đâu là nội dung có căn cứ, đâu là nội dung được tạo ra.
Tín hiệu về sự không chắc chắn được đào tạo (Trained uncertainty signaling): Khi mô hình nói "Tôi không chắc về điều này", nó giúp mô hình tự gắn cờ cho sự thiếu ổn định của chính mình.
Tạo nội dung có ràng buộc và kỹ năng (Constrained generation and skills): Thu hẹp không gian mà sự giả mạo có thể len lỏi vào.
Vòng lặp agent kiểm chứng (Generator-verifier agent loops): Đảm bảo đầu ra đáp ứng các bước kiểm tra từ một nguồn bên ngoài.

Các tính năng này tồn tại chính vì hành vi cốt lõi bên dưới luôn là next token prediction.

Các phương pháp tốt nhất để Phân định AI

Khi làm việc với kết quả đầu ra của AI, hãy ghi nhớ các nguyên tắc sau:

Tông giọng tự tin không đồng nghĩa với sự chính xác. Sự trôi chảy và tính đúng đắn là hai biến số độc lập.
Sự cụ thể là nơi tập trung các thông tin giả mạo. Tên riêng, ngày tháng, số liệu thống kê, trích dẫn, câu trích dẫn và URL – khẳng định càng chi tiết thì càng cần được kiểm chứng.
Coi kết quả đầu ra là bản nháp cần xác thực. Điều này đặc biệt quan trọng khi rủi ro cao hoặc trong các lĩnh vực bạn không quen thuộc.
Đánh giá vị trí tác vụ của bạn trên dải quang phổ. Những lối mòn quen thuộc là những lựa chọn bàn giao an toàn; những lối mòn mờ nhạt cần được giám sát kỹ lưỡng hơn.
Tận dụng các giao diện sản phẩm. Nếu công cụ của bạn cung cấp tính năng trích dẫn hoặc đối chiếu nguồn, hãy sử dụng chúng. Mô hình không thể phân biệt một cách đáng tin cậy giữa nội dung có căn cứ và nội dung tự chế; bạn phải là người thực hiện phần việc đó.

Thấu hiểu về next token prediction là trọng tâm của khả năng phân định trong khung làm việc 4D. Bạn không thể đánh giá tốt một kết quả đầu ra nếu không hiểu rằng nó được tạo ra hoặc cấu thành để khớp với một hình thái nhất định. Nó cũng định hướng cho việc ủy thác: các tác vụ nằm sâu trong vùng năng lực là những lựa chọn bàn giao an toàn, trong khi các tác vụ gần vùng biên xứng đáng nhận được sự chú ý kỹ lưỡng hơn của bạn ở khâu hậu kiểm. Với kiến thức này, AI sẽ trở nên có thể dự đoán được thay vì gây bất ngờ.

🔁 Bài học liên quan

Bài tiếp: Try it out
Bài trước: How AI Gets Its Character
Cùng section: Try it out
Thuộc lộ trình: Path B
Docs tham khảo: Glossary · Skills atlas · By use-case

📚 Nguồn & ghi nhận

Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/ai-capabilities-and-limitations/456447
Crawl: 2026-04-23 · Chuẩn hoá: 2026-05-01