📖 Nội dung bài học
Tóm tắt
Claude cung cấp ba dòng mô hình riêng biệt, mỗi dòng được tối ưu hóa cho các ưu tiên khác nhau. Cả ba mô hình đều chia sẻ các khả năng cốt lõi của Claude - chúng có thể xử lý tạo văn bản, lập trình, phân tích hình ảnh và các tác vụ khác. Điểm khác biệt chính là cách chúng cân bằng giữa trí thông minh, tốc độ và chi phí.

Claude Opus
Opus mang lại trí thông minh cao nhất của Claude. Nó được thiết kế cho các tình huống phức tạp đòi hỏi khả năng lập luận và lập kế hoạch tinh vi.
Opus vượt trội trong việc làm việc độc lập trên các dự án phức tạp trong thời gian dài. Nó có thể quản lý các quy trình nhiều bước và xử lý các yêu cầu khác nhau mà không cần nhiều sự can thiệp của con người. Mô hình hỗ trợ lập luận, nghĩa là nó có thể đưa ra phản hồi nhanh cho các tác vụ đơn giản hoặc dành thời gian suy nghĩ về các vấn đề phức tạp hơn.
Sự đánh đổi là độ trễ vừa phải và chi phí cao hơn. Bạn đang trả nhiều tiền hơn và chờ đợi lâu hơn cho trí thông minh bổ sung đó.
Claude Sonnet
Sonnet nằm ở điểm cân bằng của dòng sản phẩm Claude, mang lại sự kết hợp cân bằng giữa trí thông minh, tốc độ và chi phí, phù hợp với hầu hết các ứng dụng thực tế.
Điều làm cho Sonnet đặc biệt có giá trị là khả năng lập trình mạnh mẽ kết hợp với khả năng tạo văn bản nhanh chóng. Nhiều nhà phát triển đánh giá cao khả năng chỉnh sửa chính xác các cơ sở mã phức tạp mà không làm hỏng chức năng hiện có.
Claude Haiku
Haiku là mô hình nhanh nhất của Claude, được xây dựng đặc biệt cho các ứng dụng mà thời gian phản hồi là rất quan trọng. Nó được tối ưu hóa cho tốc độ và hiệu quả chi phí thay vì trí thông minh tối đa.
Một hạn chế quan trọng: Haiku không hỗ trợ khả năng lập luận mà Opus và Sonnet cung cấp. Điều này làm cho nó trở nên lý tưởng cho các ứng dụng hướng tới người dùng cần tương tác thời gian thực nhưng kém phù hợp hơn cho các tác vụ giải quyết vấn đề phức tạp.
Chọn mô hình phù hợp

Việc lựa chọn mô hình phụ thuộc vào việc hiểu sự đánh đổi giữa trí thông minh và chi phí/tốc độ. Đây là cách quyết định:
- Chọn Opus khi trí thông minh là ưu tiên hàng đầu của bạn. Nếu bạn có các tác vụ phức tạp đòi hỏi khả năng lập luận mạnh mẽ, bạn đang chọn chất lượng hơn tốc độ và chi phí.
- Chọn Haiku khi tốc độ là quan trọng nhất. Dành cho các tương tác người dùng thời gian thực hoặc xử lý khối lượng lớn, nơi bạn cần phản hồi nhanh nhất có thể.
- Chọn Sonnet khi bạn cần sự cân bằng. Hầu hết các ứng dụng đều hưởng lợi từ sự kết hợp của Sonnet về trí thông minh, tốc độ và chi phí hợp lý.
Sử dụng nhiều mô hình
Nhiều nhóm không chỉ sử dụng một mô hình. Thay vào đó, họ sử dụng các mô hình khác nhau cho các phần khác nhau của cùng một ứng dụng:
- Haiku cho các tương tác hướng tới người dùng, nơi tốc độ là rất quan trọng
- Sonnet cho logic nghiệp vụ chính
- Opus cho các tác vụ phức tạp đòi hỏi lập luận sâu hơn
Cách tiếp cận này cho phép bạn tối ưu hóa từng phần của ứng dụng cho các yêu cầu cụ thể của nó, đồng thời quản lý chi phí và hiệu suất tổng thể.
🔁 Bài học liên quan
- Bài tiếp: Accessing the API
- Bài trước: Introduction to the course
- Cùng section: Accessing the API · Making a request · Multi-Turn conversations
- Thuộc lộ trình: Path C
- Docs tham khảo: Glossary · Skills atlas · By use-case
📚 Nguồn & ghi nhận
- Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/claude-in-amazon-bedrock/303332
- © 2025 Anthropic. Chỉ dùng cho mục đích giáo dục, fair-use.
- Crawl: 2026-04-23 · Chuẩn hoá: 2026-05-01