Bỏ qua đến nội dung chính

Lesson 3B: Capabilities & limitations | AI Fluency: Framework & Foundations Course

TL;DR

  • Mô hình ngôn ngữ lớn (LLM) như Claude có khả năng vượt trội trong các tác vụ ngôn ngữ, chuyển đổi giữa các tác vụ, duy trì mạch hội thoại và mở rộng khả năng thông qua kết nối với công cụ bên ngoài.
  • Tuy nhiên, LLM bị giới hạn bởi dữ liệu huấn luyện, có thể tạo ra "ảo giác" (thông tin không chính xác), bị giới hạn bởi "cửa sổ ngữ cảnh", và cho ra kết quả không xác định (non-deterministic).
  • Làm việc hiệu quả với AI đòi hỏi hiểu rõ điểm mạnh và hạn chế của chúng, tận dụng sự bổ trợ giữa tư duy con người và khả năng xử lý của AI, cùng với việc học hỏi và thử nghiệm liên tục.

Điểm chính

  • Kỹ năng ngôn ngữ đa dạng: LLM xuất sắc trong soạn thảo văn bản, tóm tắt, dịch thuật và giải thích chủ đề phức tạp trên nhiều lĩnh vực.
  • Linh hoạt tác vụ: Chúng có thể chuyển đổi giữa các loại tác vụ khác nhau (sáng tạo, phân tích, giải thích) mà không cần huấn luyện bổ sung.
  • Duy trì ngữ cảnh: LLM có khả năng ghi nhớ và xây dựng dựa trên thông tin đã thảo luận trong một cuộc trò chuyện, giống như đối tác con người.
  • Mở rộng khả năng qua công cụ: Nhiều LLM hiện đại có thể kết nối với các công cụ và nguồn thông tin bên ngoài (tìm kiếm web, xử lý tệp) để vượt qua giới hạn kiến thức riêng.
  • Giới hạn dữ liệu huấn luyện: LLM có "ngày cắt giảm kiến thức" và không có thông tin về các sự kiện sau thời điểm đó, cần công cụ bên ngoài để cập nhật.
  • Nguy cơ "ảo giác": AI có thể tự tin đưa ra thông tin không chính xác do học từ dữ liệu sai hoặc ghép nối thông tin không phù hợp, khác với công cụ tìm kiếm chỉ truy xuất.
  • Cửa sổ ngữ cảnh: LLM có giới hạn về lượng thông tin có thể xử lý cùng lúc; thông tin vượt quá giới hạn này sẽ bị lãng quên.
  • Tính không xác định: Với cùng một đầu vào, LLM có thể tạo ra các phản hồi hơi khác nhau. Tính ngẫu nhiên này có thể được điều chỉnh bằng cài đặt "nhiệt độ" (temperature).
  • Hạn chế suy luận phức tạp: LLM đôi khi gặp khó khăn với các tác vụ suy luận nhiều bước hoặc các bài toán logic/toán học phức tạp, dù các mô hình mới đang cải thiện.
  • Tương lai và RAG: Lĩnh vực AI tạo sinh đang phát triển nhanh, với các kỹ thuật như Retrieval Augmented Generation (RAG) giúp kết nối AI với nguồn kiến thức và dữ liệu bên ngoài để giải quyết hạn chế.

Từ vựng

  • AI tạo sinh — Generative AI
  • Mô hình ngôn ngữ lớn (LLM) — Large Language Model (LLM)
  • Ảo giác — Hallucination
  • Cửa sổ ngữ cảnh — Context Window
  • Tính không xác định — Non-deterministic
  • Nhiệt độ — Temperature (setting)
  • Tạo sinh tăng cường truy xuất (RAG) — Retrieval Augmented Generation (RAG)
  • Khả năng làm việc hiệu quả với AI — AI fluency

Nội dung chi tiết

Khám phá Khả năng của AI tạo sinh

Hãy cùng tìm hiểu những gì AI tạo sinh có thể và không thể làm, tập trung vào các Mô hình ngôn ngữ lớn (LLM) như Claude. Hãy xem việc này giống như việc làm quen với một đồng nghiệp mới. Việc hiểu rõ điểm mạnh và hạn chế của chúng sẽ giúp bạn cộng tác hiệu quả hơn.

Khả năng vượt trội của Mô hình ngôn ngữ lớn

Để bắt đầu, chúng ta sẽ tập trung vào những gì các hệ thống AI này làm đặc biệt tốt. Bạn có thể ngạc nhiên về sự linh hoạt của các mô hình ngôn ngữ lớn hiện đại. Chúng có kỹ năng ngôn ngữ theo những cách tưởng chừng không thể chỉ vài năm trước: soạn email thể hiện giọng văn của bạn, tóm tắt các báo cáo dài thành bản rõ ràng, dịch giữa các ngôn ngữ và giải thích các chủ đề phức tạp trong vô số lĩnh vực, từ vi sinh học đến chiến lược tiếp thị.

Điều đáng chú ý đặc biệt là cách các mô hình AI này có thể chuyển đổi giữa các tác vụ khác nhau mà không cần huấn luyện bổ sung. Chính hệ thống AI giúp bạn viết thơ hoặc lên ý tưởng cho bữa tiệc sinh nhật của mình cũng có thể giúp bạn hiểu các khái niệm điện toán lượng tử hoặc phân tích xu hướng kinh doanh hàng quý, tất cả chỉ thông qua một cuộc trò chuyện đơn giản. Những mô hình AI này cũng có thể duy trì mạch cuộc trò chuyện, ghi nhớ những gì bạn đã thảo luận trước đó và xây dựng dựa trên đó. Ví dụ, nếu bạn đề cập đến thời hạn dự án một cách ngẫu nhiên và sau đó quay lại vấn đề đó trong cuộc trò chuyện, chúng thường sẽ hiểu bạn đang nói về điều gì, giống như một đối tác cuộc trò chuyện là con người. Nhiều Mô hình ngôn ngữ lớn (LLM) hiện đại giờ đây cũng có thể vượt ra ngoài kiến thức của riêng chúng bằng cách kết nối với các công cụ và nguồn thông tin bên ngoài, cho phép chúng tìm kiếm trên web, xử lý tệp hoặc thậm chí sử dụng các ứng dụng khác để tăng cường khả năng của mình. Điều này mở rộng đáng kể những gì chúng có thể hỗ trợ.

Hạn chế: Giới hạn dữ liệu huấn luyện và ảo giác

Tuy nhiên, giống như bất kỳ công nghệ nào, các Mô hình ngôn ngữ lớn (LLM) tồn tại ngày nay cũng có những hạn chế nhất định. Thứ nhất, các mô hình AI bị giới hạn bởi dữ liệu huấn luyện của chúng. Các LLM có ngày cắt giảm kiến thức, dựa trên thời điểm chúng được huấn luyện, tức là thời điểm sau đó chúng không có kiến thức bẩm sinh về thế giới. Ví dụ, một mô hình AI có ngày cắt giảm là tháng 11 năm 2024 có nghĩa là nó không được huấn luyện trên bất kỳ dữ liệu nào sau ngày 24 tháng 11. Hãy tưởng tượng một người đã đi ẩn cư mà không có quyền truy cập internet vào một ngày cụ thể. Họ sẽ không biết về các sự kiện xảy ra sau khi họ rời đi. Các mô hình AI cần các công cụ như tìm kiếm trên web để tìm hiểu thêm về các phát triển gần đây.

Ngoài ra, quá trình huấn luyện không xác minh mọi sự kiện trong dữ liệu huấn luyện. Điều này có nghĩa là các mô hình AI đôi khi có thể học và tái tạo những thông tin không chính xác có trong dữ liệu huấn luyện của chúng. Chúng cũng có thể mắc lỗi khi cố gắng ghép nối thông tin đã học. Điều này dẫn đến điều thường được gọi là "ảo giác": AI tự tin khẳng định điều gì đó nghe có vẻ hợp lý nhưng thực tế lại không chính xác. Không giống như các công cụ tìm kiếm chỉ đơn thuần truy xuất các tài liệu hiện có, các LLM tạo ra phản hồi dựa trên các mẫu thống kê, đôi khi tạo ra ảo giác. Hãy tưởng tượng một người bạn kể chuyện với sự tự tin tuyệt đối, nhưng các chi tiết lại hoàn toàn sai. AI đôi khi có thể như vậy.

Hạn chế: Cửa sổ ngữ cảnh và tính không xác định

Một hạn chế quan trọng khác là cửa sổ ngữ cảnh mà chúng ta đã đề cập trước đó. Xin nhắc lại, đó là lượng thông tin mà một AI có thể xử lý cùng một lúc. Mỗi Mô hình ngôn ngữ lớn (LLM) có một giới hạn tối đa về lượng thông tin mà nó có thể xem xét trong một lần tương tác. Nếu giới hạn này bị vượt quá, AI sẽ không thể nhớ thông tin nằm ngoài cửa sổ ngữ cảnh, thường là theo nguyên tắc vào trước ra trước. Tùy thuộc vào kích thước của mô hình AI, điều này có thể hạn chế khả năng xử lý các tài liệu lớn hoặc ghi nhớ toàn bộ cuộc trò chuyện.

Hơn nữa, không giống như phần mềm truyền thống tạo ra các kết quả đầu ra giống hệt nhau với cùng một đầu vào, các LLM không thể đoán trước được theo mặc định, còn được gọi là không xác định (non-deterministic). Hỏi cùng một câu hỏi hai lần và bạn có thể nhận được các phản hồi hơi khác nhau mỗi lần. Sự biến đổi này bắt nguồn từ bản chất cách các mô hình AI này tạo ra văn bản. Chúng đưa ra các quyết định dựa trên xác suất về văn bản tiếp theo nên là gì, dựa trên các mẫu trong dữ liệu huấn luyện của chúng và các cài đặt nhất định mà nhà phát triển có thể điều chỉnh. Sự biến đổi sáng tạo này có thể rất tốt cho việc động não và tạo ra các ý tưởng đa dạng, nhưng cần lưu ý khi sự nhất quán hoặc độ chính xác là rất quan trọng. Một số giao diện LLM cũng cung cấp các cài đặt để kiểm soát sự ngẫu nhiên này khi cần. Cài đặt này thường được gọi là nhiệt độ (temperature).

Hạn chế: Suy luận phức tạp và truy cập công cụ

Ngoài ra, mặc dù các mô hình AI này đang cải thiện nhanh chóng, nhưng theo lịch sử, chúng đã cho thấy những hạn chế với các tác vụ suy luận phức tạp, đặc biệt là với các bài toán toán học hoặc logic đòi hỏi nhiều bước. Tin tốt là các mô hình AI suy luận hoặc tư duy mở rộng mới hơn được thiết kế đặc biệt để tư duy từng bước đang cho thấy tiến bộ mạnh mẽ trong các lĩnh vực này.

Và cuối cùng, mặc dù các mô hình AI như Claude hiện có thể truy cập các công cụ bên ngoài, chúng vẫn có thể thiếu quyền truy cập vào các nguồn dữ liệu cụ thể hoặc các công cụ chuyên biệt cần thiết cho một số tác vụ. Điều này giống như việc có một đồng nghiệp xuất sắc nhưng không thể truy cập cơ sở dữ liệu nội bộ của công ty bạn. Khả năng giúp đỡ của họ sẽ bị hạn chế cho dù họ có thông minh đến đâu. Nếu một mô hình AI không có quyền truy cập vào một mẩu dữ liệu hoặc một công cụ cần thiết để trả lời câu hỏi, thì không có gì ngạc nhiên khi nó sẽ không thể giúp trả lời câu hỏi đó.

Tương lai của AI tạo sinh và Sự hợp tác hiệu quả

Lĩnh vực AI tạo sinh đang phát triển nhanh chóng. Các nhà nghiên cứu đang nỗ lực giải quyết các hạn chế hiện tại thông qua các kỹ thuật như tạo sinh tăng cường truy xuất (Retrieval Augmented Generation - RAG), kết nối các mô hình AI với các nguồn kiến thức và dữ liệu bên ngoài, cũng như mở rộng khả năng sử dụng công cụ và cải thiện năng lực suy luận của chúng. Tuy nhiên, một số hạn chế có thể sẽ vẫn tồn tại trong tương lai gần, ngay cả khi chúng ta không biết chính xác những hạn chế đó sẽ là gì.

Việc hiểu AI có thể hoặc không thể làm gì là điều cần thiết để có khả năng làm việc hiệu quả với AI (AI fluency) và giúp bạn xác định khi nào và làm thế nào để tích hợp hiệu quả các hệ thống AI này vào công việc và cuộc sống hàng ngày của mình. Các ứng dụng hiệu quả nhất sẽ tận dụng những điểm mạnh bổ trợ giữa con người và AI. Chúng ta mang đến tư duy phản biện, óc phán đoán, sự sáng tạo và giám sát đạo đức mà AI có thể gặp khó khăn trong việc tái tạo, trong khi AI mang lại tốc độ, quy mô, khả năng nhận dạng mẫu và khả năng xử lý lượng lớn thông tin. Những điểm mạnh bổ trợ này sẽ phát triển cùng với sự tiến bộ của công nghệ. Đó là lý do tại sao việc học hỏi và thử nghiệm liên tục lại rất có giá trị. Chúng giúp bạn luôn cập nhật những thay đổi này và khám phá những khả năng mới. Trong các bài tập của khóa học này, chúng ta sẽ có cơ hội khám phá những khái niệm này một cách trực tiếp thông qua các cuộc trò chuyện với Claude. Trải nghiệm trực tiếp này sẽ giúp bạn phát triển cảm nhận trực quan về những gì AI tạo sinh có thể làm, không thể làm và cách tốt nhất để làm việc với nó.

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?