📖 Nội dung bài học
Bạn sẽ học được gì
Cuối bài học này, bạn sẽ có thể:
- Xác định các khả năng và hạn chế chính của AI tạo sinh hiện tại.
Khả năng & hạn chế
(7 phút)
Video này xem xét những gì AI tạo sinh có thể và không thể làm hiệu quả tại thời điểm này. Chúng tôi nêu bật tính linh hoạt của AI tạo sinh trong các tác vụ ngôn ngữ, khả năng duy trì luồng hội thoại và năng lực chuyển đổi giữa các tác vụ đa dạng mà không cần đào tạo thêm. Chúng tôi cũng đề cập đến các hạn chế bao gồm ngày cắt kiến thức, ảo giác (kết quả không chính xác về mặt thực tế), giới hạn cửa sổ ngữ cảnh và thách thức về lý luận. Chúng tôi nhấn mạnh cách lĩnh vực này đang phát triển nhanh chóng và giải thích rằng các ứng dụng hiệu quả nhất kết hợp thế mạnh bổ sung của con người và AI làm việc cùng nhau.
Điểm chính cần ghi nhớ
- AI tạo sinh tạo ra nội dung mới (văn bản, hình ảnh, mã) thay vì chỉ phân tích dữ liệu hiện có.
- Các hệ thống hiện đại như LLM có được là nhờ ba bước phát triển chính:
- Đột phá về thuật toán và kiến trúc (đặc biệt là kiến trúc transformer).
- Lượng lớn dữ liệu đào tạo kỹ thuật số.
- Sự gia tăng đáng kể về sức mạnh tính toán.
- AI tạo sinh học qua hai giai đoạn: tiền đào tạo (phân tích các mẫu trên hàng tỷ ví dụ) và tinh chỉnh (học cách làm theo hướng dẫn và đưa ra phản hồi hữu ích).
- Các khả năng hiện tại bao gồm tính linh hoạt trên nhiều tác vụ, nhận thức hội thoại và khả năng kết nối với các công cụ bên ngoài.
- Các hạn chế hiện tại bao gồm ngày cắt kiến thức, khả năng ảo giác, giới hạn cửa sổ ngữ cảnh và thách thức với lý luận phức tạp.
- Các ứng dụng hiệu quả nhất kết hợp thế mạnh của con người và AI, trong đó con người cung cấp tư duy phản biện, phán đoán, sáng tạo và giám sát đạo đức.
Bài tập
Suy ngẫm
Trước khi tiếp tục, hãy dành một chút thời gian để suy ngẫm:
- Việc hiểu các nền tảng kỹ thuật của AI tạo sinh (như dữ liệu đào tạo và tiền đào tạo/tinh chỉnh) thay đổi cách bạn nghĩ về việc làm việc với các hệ thống này như thế nào?
- Những cân nhắc đạo đức nào xuất hiện trong đầu bạn sau khi tìm hiểu về cách thức hoạt động của các hệ thống này và những hạn chế hiện tại của chúng?
Bước tiếp theo
Trong bài học tiếp theo, chúng ta sẽ xem xét kỹ hơn về năng lực đầu tiên trong bộ năng lực 4D: Ủy quyền. Bạn sẽ học cách đưa ra các quyết định chiến lược về việc phân chia công việc giữa bạn và AI dựa trên sự hiểu biết về cả mục tiêu của bạn và khả năng của AI. Nền tảng này sẽ giúp bạn xác định một cách chu đáo khi nào và làm thế nào để đưa AI vào quy trình sáng tạo và giải quyết vấn đề của bạn.
Phản hồi
Khi bạn tiến bộ trong khóa học, chúng tôi rất mong nhận được phản hồi từ bạn về cách bạn đang sử dụng các khái niệm từ khóa học vào cuộc sống, công việc hoặc lớp học của mình và bất kỳ phản hồi nào bạn có. Chia sẻ phản hồi của bạn tại đây.
Ghi nhận và giấy phép
Bản quyền 2025 Rick Dakan, Joseph Feller và Anthropic. Phát hành theo giấy phép CC BY-NC-SA 4.0. Khóa học này dựa trên The AI Fluency Framework của Dakan và Feller. Được hỗ trợ một phần bởi Cơ quan Giáo dục Đại học, Ireland, thông qua Diễn đàn Quốc gia về Nâng cao Giảng dạy và Học tập.
🎬 Bản ghi video
Source video:
W5cga7xipRI
📜 Mở rộng bản ghi (đã chỉnh sửa + dịch AI)
Hiểu về Generative AI: Khả năng và Hạn chế
Hãy cùng tìm hiểu những gì Generative AI có thể và không thể làm, tập trung vào các mô hình ngôn ngữ lớn (LLM) như Claude. Hãy coi đây là quá trình làm quen với một đồng nghiệp mới; việc hiểu rõ điểm mạnh và giới hạn của họ sẽ giúp bạn cộng tác hiệu quả hơn.
Thế mạnh của các LLM hiện đại
Đầu tiên, chúng ta sẽ tập trung vào những gì các hệ thống này thực hiện cực kỳ tốt. Bạn có thể sẽ ngạc nhiên về sự linh hoạt của các mô hình ngôn ngữ hiện đại. Chúng thành thạo ngôn ngữ theo những cách tưởng chừng như không thể chỉ vài năm trước: soạn thảo email đúng với văn phong của bạn, cô đọng các báo cáo dài thành bản tóm tắt rõ ràng, dịch thuật đa ngôn ngữ và giải thích các chủ đề phức tạp thuộc vô số lĩnh vực — từ vi sinh học đến chiến lược marketing.
Điều đặc biệt đáng lưu ý là cách các mô hình này có thể chuyển đổi giữa các tác vụ khác nhau mà không cần đào tạo thêm. Cùng một hệ thống vừa giúp bạn viết thơ hoặc lên ý tưởng cho tiệc sinh nhật, ngay sau đó có thể giúp bạn hiểu các khái niệm điện toán lượng tử hoặc phân tích xu hướng kinh doanh hàng quý, tất cả đều thông qua những cuộc hội thoại đơn giản.
Các mô hình này cũng có khả năng duy trì mạch hội thoại, ghi nhớ những gì bạn đã thảo luận trước đó và phát triển dựa trên đó. Ví dụ, nếu bạn tình cờ nhắc đến thời hạn của dự án và đề cập lại sau đó trong cuộc trò chuyện, chúng thường sẽ hiểu bạn đang nói về điều gì, giống như một người cộng sự thực thụ.
Nhiều LLM hiện đại giờ đây còn có thể mở rộng kiến thức vượt ra ngoài dữ liệu tự thân bằng cách kết nối với các công cụ và nguồn thông tin bên ngoài, cho phép chúng tìm kiếm web, xử lý tệp tin hoặc thậm chí sử dụng các ứng dụng khác để tăng cường năng lực. Điều này mở rộng đáng kể phạm vi hỗ trợ của chúng.
Ngày cắt mốc kiến thức và hiện tượng ảo giác
Tuy nhiên, giống như bất kỳ công nghệ nào, LLM hiện nay vẫn có những hạn chế nhất định. Thứ nhất, các mô hình AI bị giới hạn bởi dữ liệu đào tạo. LLM có một "ngày cắt mốc kiến thức" (knowledge cutoff date) dựa trên thời điểm chúng được đào tạo — thời điểm mà sau đó chúng không có kiến thức nội tại về thế giới. Ví dụ, một mô hình có ngày cắt mốc là tháng 11 năm 2024 nghĩa là nó không được đào tạo trên bất kỳ dữ liệu nào sau thời gian đó. Hãy tưởng tượng một người đi tu thiền mà không có internet từ một ngày cụ thể; họ sẽ không biết về các sự kiện xảy ra sau khi họ rời đi. Các mô hình cần các công cụ như tìm kiếm web để tìm hiểu về những diễn biến mới nhất.
Ngoài ra, quá trình đào tạo không xác minh mọi sự thật trong dữ liệu đầu vào. Điều này có nghĩa là các mô hình đôi khi có thể học và tái lập những thông tin sai lệch có sẵn trong dữ liệu đào tạo. chúng cũng có thể mắc lỗi khi cố gắng lắp ghép các thông tin đã học lại với nhau. Điều này dẫn đến hiện tượng thường được gọi là "ảo giác" (hallucination): AI khẳng định một cách đầy tự tin về một điều gì đó nghe có vẻ hợp lý nhưng thực tế lại sai. Không giống như các công cụ tìm kiếm chỉ đơn thuần truy xuất các tài liệu hiện có, LLM tạo ra phản hồi dựa trên các mô hình xác suất. Hãy tưởng tượng một người bạn kể chuyện với sự tự tin tuyệt đối, nhưng các chi tiết lại hoàn toàn sai lệch; AI đôi khi cũng giống như vậy.
Rào cản kỹ thuật: Context window và tính phi định hướng
Một hạn chế quan trọng khác là "context window". Nhắc lại một chút, đó là lượng thông tin mà AI có thể xử lý tại một thời điểm. Mỗi LLM đều có giới hạn tối đa về lượng thông tin mà nó có thể xem xét trong một lần tương tác. Nếu vượt quá giới hạn này, AI sẽ không thể nhớ thông tin nằm ngoài cửa sổ đó, thường theo nguyên tắc "vào trước, ra trước" (first-in, first-out). Tùy thuộc vào kích thước của mô hình, điều này có thể hạn chế khả năng xử lý các tài liệu lớn hoặc ghi nhớ toàn bộ cuộc hội thoại dài.
Hơn nữa, không giống như phần mềm truyền thống luôn đưa ra kết quả giống hệt nhau cho cùng một đầu vào, LLM có tính chất không dự đoán trước được theo mặc định, hay còn gọi là "phi định hướng" (non-deterministic). Nếu bạn hỏi cùng một câu hỏi hai lần, bạn có thể nhận được các câu trả lời hơi khác nhau mỗi lần. Sự biến thiên này xuất phát từ bản chất cách các mô hình này tạo văn bản; chúng đưa ra các quyết định dựa trên xác suất về từ ngữ tiếp theo dựa trên các mẫu trong dữ liệu đào tạo và một số cài đặt mà nhà phát triển có thể tinh chỉnh.
Sự biến thiên sáng tạo này có thể rất tuyệt vời cho việc lên ý tưởng (brainstorming), nhưng nó đòi hỏi sự lưu ý khi tính nhất quán hoặc độ chính xác là yếu tố then chốt. Một số giao diện LLM cung cấp các cài đặt để kiểm soát tính ngẫu nhiên này khi cần thiết; cài đặt này thường được gọi là "temperature".
Khả năng suy luận và truy cập dữ liệu
Ngoài ra, mặc dù các mô hình này đang cải thiện nhanh chóng, nhưng trong lịch sử chúng đã bộc lộ những hạn chế với các tác vụ suy luận phức tạp, đặc biệt là các bài toán toán học hoặc logic đòi hỏi nhiều bước giải. Tin tốt là các mô hình "reasoning" hoặc "tư duy mở rộng" mới hơn, được thiết kế đặc biệt để tư duy từng bước, đang cho thấy sự tiến bộ mạnh mẽ trong các lĩnh vực này.
Cuối cùng, mặc dù các mô hình như Claude hiện có thể truy cập các công cụ bên ngoài, chúng vẫn có thể thiếu quyền truy cập vào các nguồn dữ liệu cụ thể hoặc các công cụ chuyên dụng cần thiết cho một số tác vụ nhất định. Nó giống như việc có một đồng nghiệp xuất sắc nhưng không thể truy cập vào cơ sở dữ liệu nội bộ của công ty; khả năng hỗ trợ của họ sẽ bị hạn chế bất kể họ thông minh đến đâu. Nếu một mô hình không có quyền truy cập vào một phần dữ liệu hoặc một công cụ cần thiết để trả lời câu hỏi, nó không thể cung cấp một câu trả lời đầy đủ.
Lộ trình hướng tới sự am hiểu về AI
Lĩnh vực Generative AI đang phát triển nhanh chóng. Các nhà nghiên cứu đang nỗ lực giải quyết các hạn chế hiện tại thông qua các kỹ thuật như RAG (Retrieval-Augmented Generation), giúp kết nối các mô hình với kiến thức và nguồn dữ liệu bên ngoài, cũng như mở rộng khả năng tool use và cải thiện năng lực suy luận. Tuy nhiên, một số hạn chế có thể sẽ vẫn tồn tại trong tương lai gần.
Hiểu rõ những gì AI có thể hoặc không thể làm là điều thiết yếu để đạt được sự am hiểu về AI (AI fluency). Nó giúp bạn xác định thời điểm và cách thức tốt nhất để tích hợp các hệ thống này vào công việc và cuộc sống hàng ngày một cách hiệu quả. Các ứng dụng hiệu quả nhất sẽ tận dụng được thế mạnh bổ trợ của cả con người và AI. Chúng ta mang đến tư duy phản biện, sự phán đoán, sáng tạo và giám sát đạo đức mà AI khó có thể sao chép, trong khi AI cung cấp tốc độ, quy mô, khả năng nhận diện mẫu và xử lý lượng thông tin khổng lồ.
Những thế mạnh bổ trợ này sẽ tiến hóa cùng với sự phát triển của công nghệ. Đó là lý do tại sao việc học hỏi và thử nghiệm liên tục là vô cùng giá trị. Chúng giúp bạn cập nhật những thay đổi này và khám phá những khả năng mới. Thông qua các bài tập trong khóa học này, bạn sẽ có cơ hội trực tiếp khám phá các khái niệm này thông qua các cuộc hội thoại với Claude. Trải nghiệm trực tiếp này sẽ giúp bạn phát triển cảm nhận trực quan về những gì Generative AI có thể làm, những gì nó không thể và cách tốt nhất để làm việc với nó.
🔁 Bài học liên quan
- Bài tiếp: A closer look at Delegation
- Bài trước: Generative AI fundamentals
- Cùng section: Generative AI fundamentals
- Thuộc lộ trình: Path A · Path B · Path E · Path F · Path G
- Docs tham khảo: Glossary · Skills atlas · By use-case
📚 Nguồn & ghi nhận
- Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/ai-fluency-framework-foundations/291880
- © 2025 Anthropic. Chỉ dùng cho mục đích giáo dục, fair-use.
- Crawl: 2026-04-23 · Chuẩn hoá: 2026-05-01