Extended thinking

📖 Nội dung bài học

Ôi! Đã xảy ra lỗi, vui lòng thử lại.

Tóm tắt

Extended thinking là tính năng nâng cao của Claude, cho phép mô hình có thời gian suy nghĩ để giải quyết các vấn đề phức tạp trước khi đưa ra phản hồi cuối cùng. Hãy coi đó như là lời độc thoại nội tâm của Claude - bạn có thể thấy cách nó tiếp cận vấn đề từng bước.

Cách Extended Thinking Hoạt Động

Khi bạn bật extended thinking, phản hồi của Claude sẽ bao gồm hai phần thay vì một:

Phần Nội dung Suy luận (Reasoning Content Part) - Quá trình suy nghĩ nội bộ của Claude
Phần Văn bản (Text Part) - Phản hồi cuối cùng mà bạn thực sự mong muốn

Nội dung suy luận cho bạn thấy chính xác cách Claude phân tích vấn đề, những gì nó xem xét và cách nó đi đến câu trả lời cuối cùng. Sự minh bạch này có thể cực kỳ giá trị để hiểu và gỡ lỗi các tác vụ phức tạp.

Đánh đổi Cần Cân nhắc

Extended thinking đi kèm với những lợi ích và chi phí rõ ràng:

Độ chính xác cao hơn cho các tác vụ phức tạp
Chi phí cao hơn - bạn trả tiền cho tất cả các token suy nghĩ
Độ trễ tăng lên - suy nghĩ cần có thời gian

Điểm quyết định chính rất đơn giản: sử dụng kết quả evaluation của bạn. Nếu bạn đã tối ưu hóa prompt của mình nhưng vẫn chưa đạt được độ chính xác cần thiết, đó là lúc bạn nên cân nhắc extended thinking.

Chữ ký Số

Một chi tiết quan trọng bạn sẽ nhận thấy ngay lập tức là chữ ký số đính kèm vào nội dung suy luận:

Chữ ký này đảm bảo bạn không thể sửa đổi văn bản suy nghĩ. Nếu bạn muốn đưa suy luận trước đó của Claude vào cuộc trò chuyện tiếp theo, chữ ký sẽ xác minh rằng nội dung chưa bị giả mạo. Điều này ngăn chặn các vấn đề an toàn tiềm ẩn từ việc sửa đổi văn bản suy luận.

Nội dung Bị Che (Redacted Content)

Đôi khi suy nghĩ của Claude bị các hệ thống an toàn gắn cờ. Khi điều này xảy ra, bạn sẽ nhận được một trường redactedContent thay vì văn bản suy nghĩ có thể đọc được:

Nội dung bị che được mã hóa nhưng vẫn hoạt động - bạn có thể chuyển nó trở lại cho Claude trong các cuộc trò chuyện tương lai mà không làm mất ngữ cảnh. Nó chỉ đơn giản là không thể đọc được đối với bạn với tư cách là nhà phát triển.

Triển khai

Để bật extended thinking, bạn cần sửa đổi lệnh gọi API của mình với hai tham số:

additional_model_fields["thinking"] = {
    "type": "enabled",
    "budget_tokens": thinking_budget
}

thinking_budget kiểm soát số lượng token mà Claude có thể sử dụng cho việc suy luận. Mức tối thiểu là 1024 token, nhưng bạn có thể cần nhiều hơn cho các vấn đề phức tạp. Giống như mọi thứ khác với Claude, hãy sử dụng kết quả evaluation của bạn để tìm ngân sách phù hợp cho trường hợp sử dụng của bạn.

Đây là cách hàm chat được cập nhật trông như thế nào:

def chat(
    messages,
    system=None,
    temperature=1.0,
    stop_sequences=[],
    tools=None,
    tool_choice="auto",
    text_editor=None,
    thinking=False,
    thinking_budget=1024
):

Kiểm tra Triển khai của Bạn

Khi xây dựng các ứng dụng xử lý extended thinking, bạn sẽ muốn kiểm tra cả các trường hợp nội dung suy luận thông thường và nội dung bị che. Thực tế có một chuỗi văn bản kiểm tra đặc biệt buộc Claude trả về nội dung bị che - hữu ích để đảm bảo mã của bạn xử lý cả hai trường hợp một cách chính xác.

Điểm quan trọng nhất về extended thinking là quyết định sử dụng nó luôn phải dựa trên dữ liệu. Hãy chạy evaluation của bạn trước, tối ưu hóa prompt của bạn, và chỉ sau đó mới cân nhắc extended thinking nếu bạn cần thêm sự thúc đẩy về độ chính xác cho các tác vụ phức tạp.

Tải xuống

🔁 Bài học liên quan

Bài tiếp: Image support
Bài trước: Quiz on Retrieval Augmented Generation
Cùng section: Overview of Claude Models · Accessing the API · Making a request
Thuộc lộ trình: Path C
Docs tham khảo: Glossary · Skills atlas · By use-case

📚 Nguồn & ghi nhận

Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/claude-in-amazon-bedrock/276788
Crawl: — · Chuẩn hoá: 2026-05-01