Bỏ qua đến nội dung chính

Steerability

📖 Nội dung bài học

Bạn sẽ học được gì

Thời gian ước tính: 30 phút

Đến cuối bài học này, bạn sẽ có thể:

  • Giải thích tại sao khả năng điều khiển hoạt động (tinh chỉnh đã dạy mô hình tuân theo hướng dẫn) và tại sao nó có giới hạn (hướng dẫn được tuân theo thông qua khớp mẫu, không phải hiểu)
  • Dự đoán nơi kiểm soát chặt chẽ nhất (hướng dẫn ngắn gọn, cụ thể, có thể kiểm chứng) so với lỏng lẻo nhất (chuỗi suy luận dài, yêu cầu trừu tượng, các tác vụ có độ chính xác cao)
  • Xác định sự trôi dạt trong suy luận, "chữ hơn nghĩa" và số học dễ vỡ là những lỗi đặc trưng của khả năng điều khiển
  • Nhận biết system prompt, thực thi code, suy luận hiển thị và đầu ra có cấu trúc là các tính năng sản phẩm giải quyết giới hạn này

Khả năng điều khiển ảnh hưởng đến đầu ra của AI tạo sinh như thế nào

(5 phút)

Mô hình tuân theo hướng dẫn của bạn theo cách tương tự như mọi thứ khác: bằng cách tiếp tục một mẫu. Điều đó làm cho nó có khả năng điều khiển đáng kể. Nó cũng có nghĩa là luôn có một khoảng cách giữa những gì bạn dự định và những gì đạt được, và hầu hết các lỗi thú vị đều nằm trong khoảng cách đó.

Bạn thực sự kiểm soát được bao nhiêu?

Trước khi bạn đọc

Bạn nghĩ "viết chính xác 100 từ, không hơn" nằm ở đâu trên thang đo Khả năng điều khiển? Kéo dấu hiệu bên dưới, sau đó chốt dự đoán của bạn.

Giới hạn khả năng

Nhiệm vụ của bạn

Hướng dẫn ngắn gọn, cụ thể, có thể kiểm chứng ("trả lời dưới dạng bảng", "dưới 100 từ") Chuỗi suy luận dài, yêu cầu trừu tượng, độ chính xác cao

Điều này cho phép

  • Kiểm soát chính xác định dạng, kiểu, độ dài và giọng điệu
  • Thiết lập vai trò: đảm nhận một nhân vật hoặc khung chuyên môn và giữ nó
  • Thực hiện tác vụ nhiều bước theo một quy trình rõ ràng
  • Tinh chỉnh lặp đi lặp lại ("làm ngắn hơn", "cụ thể hơn ở đây")

Nơi nó thường thất bại

  • Sự trôi dạt trong suy luận: các lỗi nhỏ tích lũy theo chuỗi dài
  • Chữ hơn nghĩa: hướng dẫn được đáp ứng theo nghĩa đen, bỏ lỡ ý định
  • Prompt injection: các hướng dẫn không mong muốn/không an toàn trong tài liệu cũng có thể được tuân theo

Các tính năng sản phẩm đẩy giới hạn ra

  • System prompt / hướng dẫn tùy chỉnh: hướng dẫn cố định không bị pha loãng
  • Thực thi code: chuyển toán học cho một trình thông dịch thực tế
  • Suy luận hiển thị: bắt lỗi ở bước hai, không phải câu trả lời cuối cùng
  • Chế độ đầu ra có cấu trúc: cắt giảm sự lang thang "chữ hơn nghĩa"

Kéo dấu hiệu để đặt dự đoán của bạn cho "viết chính xác 100 từ, không hơn". Bảng sáng lên cho bạn biết cần chú ý điều gì.

Chốt dự đoán của tôi

Kiểm tra trực giác của bạn

Chốt dự đoán của bạn ở trên để so sánh với vị trí điển hình.

Tùy chỉnh

Chiều cao thanh

Kích thước biểu tượng

Bảng màu Bầu trời → Đất sét Ô liu → Đất sét Xương rồng → Vả Đá bảng → Đất sét

Những điểm chính cần ghi nhớ

  • Steerability có nghĩa là mô hình tuân theo hướng dẫn thông qua Dự đoán Token Tiếp theo.
    • Vùng khả năng: hướng dẫn ngắn gọn, cụ thể, có thể kiểm chứng. Thông số kỹ thuật định dạng, giới hạn độ dài, vai trò rõ ràng.
    • Vùng giới hạn: chuỗi suy luận dài, hướng dẫn trừu tượng hoặc mơ hồ, bất cứ điều gì yêu cầu độ chính xác số hoặc logic gốc.
    • Các lỗi đặc trưng: sự trôi dạt trong suy luận (các lỗi nhỏ tích lũy) và "chữ hơn nghĩa" (hướng dẫn được tôn trọng nhưng không đạt được ý định).
    • System prompt, thực thi code, suy luận hiển thị và chế độ đầu ra có cấu trúc tồn tại để ngăn ý định của bạn bị pha loãng.
    • Khi một hướng dẫn được tuân theo theo nghĩa đen nhưng vô ích, hãy phát biểu lại mục tiêu. Lặp lại hướng dẫn với lực mạnh hơn sẽ không thu hẹp khoảng cách.
  • Kết nối 4D: Khả năng điều khiển là điều làm cho Description mạnh mẽ và ràng buộc nó. Hiểu được khoảng cách giữa từ ngữ và ý định sẽ thay đổi cách bạn viết prompt và nơi bạn chèn các điểm kiểm tra.

Drift

OK

iterate

Bạn muốn AI làm gì

Steering levers

System prompt — vai trò + ràng buộc

Specific format — bảng, JSON, length

Few-shot examples — show, don't tell

Tools, code execution — escape token domain

Output gần với ý định

Kết quả như mong đợi?

Restate goal — không repeat lực

Done

Bài tập

Bài tập: Viết lại mục tiêu

Tại sao? Khoảng cách giữa những gì bạn nói và những gì bạn muốn nói là nơi hầu hết các lỗi về khả năng điều khiển xảy ra. Bài tập này dạy bạn prompt từ ý định, không chỉ từ hướng dẫn.

Chọn một tác vụ từ danh sách Bài 1 của bạn có liên quan đến nhiều bước hoặc một định dạng đầu ra cụ thể. Viết ra mục tiêu trong một câu: những gì bạn thực sự đang cố gắng hoàn thành, không chỉ những gì đầu ra sẽ trông như thế nào. ("Thuyết phục nhóm của tôi rằng dòng thời gian này là thực tế" là một mục tiêu. "Ba dấu đầu dòng" là một định dạng.)

Bây giờ chạy ba lần thăm dò:

  1. Thăm dò 1: Kiểm soát chặt chẽ. Đưa ra một hướng dẫn ngắn gọn, cụ thể, có thể kiểm chứng liên quan đến tác vụ của bạn: "trả lời dưới dạng bảng ba cột", "chính xác năm dấu đầu dòng", "ngôi thứ hai trong suốt". Kiểm tra xem nó có được giữ chính xác không. Đây là vùng khả năng: hướng dẫn đủ đơn giản để khớp mẫu hoàn hảo.
  2. Thăm dò 2: Sự trôi dạt trong suy luận. Yêu cầu một phiên bản tác vụ của bạn yêu cầu 4–5 bước phụ thuộc. Xem xét đầu ra từng bước. Một lỗi nhỏ ở giai đoạn đầu có lan đến cuối không? Bây giờ hãy thử lại, nhưng yêu cầu AI dừng lại và cho bạn xem kết quả của bước 2 trước khi tiếp tục. So sánh những gì bạn nhận được khi bạn chèn một điểm kiểm tra so với khi bạn để nó chạy.
  3. Thăm dò 3: Chữ so với nghĩa. Đưa ra một hướng dẫn có thể được đáp ứng theo nghĩa đen nhưng vô ích. "Làm cho điều này ngắn hơn" trên một bản nháp mà vấn đề thực sự là cấu trúc. "Làm cho điều này chuyên nghiệp hơn" trên một email mà vấn đề thực sự là nó đang che giấu yêu cầu. Xem bạn nhận được gì. Sau đó, prompt lại với mục tiêu được nêu rõ ràng cùng với hướng dẫn: "Làm cho điều này ngắn hơn. Mục tiêu của tôi là giữ sự chú ý của giám đốc điều hành thông qua kết luận chính ở trang hai." So sánh.

Quay lại danh sách tác vụ của bạn. Đối với bất kỳ tác vụ nhiều bước nào, hãy lưu ý nơi bạn sẽ chèn một điểm kiểm tra. Đối với bất kỳ tác vụ nào mà bạn đã prompt chỉ với định dạng, hãy soạn thảo tuyên bố mục tiêu mà bạn sẽ thêm vào lần tới.

Phản ánh bài học

  • Bạn đã bao nhiêu lần chỉ nêu định dạng mà không nêu mục tiêu? Điều gì thay đổi khi bạn bao gồm cả hai?
  • Một tác vụ lặp đi lặp lại mà bạn sẽ thêm một điểm kiểm tra giữa quá trình bắt đầu từ tuần này là gì?

Tiếp theo là gì

Bây giờ bạn đã gặp cả bốn thuộc tính riêng lẻ. Trong bài học tiếp theo, chúng ta xem xét cách chúng tương tác, bởi vì hầu hết các lỗi trong thế giới thực là hai thuộc tính gặp nhau.

Phản hồi

Khi bạn tiến bộ trong khóa học, chúng tôi rất muốn nghe từ bạn về cách bạn đang sử dụng các khái niệm từ khóa học trong công việc của mình, cộng với bất kỳ phản hồi nào bạn có thể có. Chia sẻ phản hồi của bạn tại đây.

Ghi nhận và giấy phép

Bản quyền 2026 Anthropic. Công trình gốc dựa trên Khung Năng lực AI do GS. Rick Dakan (Trường Nghệ thuật và Thiết kế Ringling) và GS. Joseph Feller (Đại học College Cork) phát triển. Phát hành theo giấy phép CC BY-NC-SA 4.0.

🔁 Bài học liên quan

📚 Nguồn & ghi nhận

Bài học có hữu ích không?

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?