Quiz on prompt evaluation

📖 Nội dung bài học

Điểm của bạn:

6/6 Đúng (100%)

Thời gian đã trôi qua:

2 phút

Hiển thị câu trả lời

Ẩn câu trả lời

Câu hỏi 1: Câu trả lời đúng

Bạn đã viết một prompt và thử nghiệm nó một lần. Nó hoạt động tốt, vì vậy bạn đã triển khai nó vào production. Rủi ro chính của cách tiếp cận này là gì?

Người dùng sẽ cung cấp các input không mong muốn làm hỏng nó

Prompt sẽ trở nên quá đắt

Prompt sẽ hoạt động quá chậm

Các nhà phát triển khác sẽ không hiểu nó

Câu hỏi 2: Câu trả lời đúng

Bạn cần các test case cho việc đánh giá prompt của mình. Bạn có hai lựa chọn: viết thủ công hoặc dùng Claude để tạo chúng. Bạn nên sử dụng mô hình nào để tạo?

Mô hình đắt nhất hiện có

Kết hợp nhiều mô hình

Một mô hình nhanh hơn như Haiku

Chính mô hình bạn đang kiểm thử

Câu hỏi 3: Câu trả lời đúng

Bạn đang chạy quy trình đánh giá prompt. Bạn đã dùng Claude để tạo một số response. Bước tiếp theo là gì?

Triển khai vào production

Viết lại prompt ban đầu

Tạo thêm câu hỏi kiểm thử

Đưa các response qua một grader

Câu hỏi 4: Câu trả lời đúng

Bạn muốn đo lường mức độ hiệu quả thực tế của các prompt. Bạn nên tập trung vào phương pháp nào?

Sử dụng nhiều ví dụ hơn

Các kỹ thuật prompt engineering

Viết prompt dài hơn

Các phương pháp đánh giá prompt

Câu hỏi 5: Câu trả lời đúng

Bạn đang sử dụng model grader để đánh giá các response. Để nhận được điểm tốt hơn chỉ là các số ở giữa, bạn nên yêu cầu gì cùng với điểm số?

Chỉ điểm số dạng số

So sánh với các response khác

Điểm mạnh, điểm yếu và lý do

Một lời giải thích dài hơn

Câu hỏi 6: Câu trả lời đúng

Loại grader nào sử dụng một AI model khác để đánh giá chất lượng của các output?

Model grader

Human grader

Syntax grader

Code grader

Làm lại bài này

🔁 Bài học liên quan

Bài tiếp: Prompt engineering
Bài trước: Exercise on prompt evals
Cùng section: Making a request · Multi-Turn conversations · Chat exercise
Thuộc lộ trình: Path C
Docs tham khảo: Glossary · Skills atlas · By use-case

📚 Nguồn & ghi nhận

Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/claude-with-the-anthropic-api/289118
Crawl: 2026-04-23 · Chuẩn hoá: 2026-05-01