Bỏ qua đến nội dung chính

Prompt engineering

📖 Nội dung bài học

Tóm tắt

Prompt engineering là quá trình cải thiện một prompt bạn đã viết để nhận được kết quả đáng tin cậy và chất lượng cao hơn. Quá trình này bao gồm việc tinh chỉnh lặp đi lặp lại - bắt đầu với một prompt cơ bản, đánh giá hiệu suất của nó, sau đó áp dụng có hệ thống các kỹ thuật kỹ thuật để cải thiện nó.

Quy trình cải tiến lặp đi lặp lại

Cách tiếp cận tuân theo một chu kỳ rõ ràng mà bạn có thể lặp lại cho đến khi đạt được kết quả mong muốn:

  1. Đặt mục tiêu - Xác định những gì bạn muốn prompt của mình đạt được
  2. Viết prompt ban đầu - Tạo bản nháp đầu tiên cơ bản
  3. Đánh giá prompt - Kiểm tra nó dựa trên các tiêu chí của bạn
  4. Áp dụng kỹ thuật prompt engineering - Sử dụng các phương pháp cụ thể để cải thiện hiệu suất
  5. Đánh giá lại - Xác minh rằng các thay đổi của bạn thực sự đã cải thiện kết quả

Bạn lặp lại hai bước cuối cùng cho đến khi hài lòng với hiệu suất. Mỗi lần lặp lại nên cho thấy sự cải thiện có thể đo lường được trong điểm số đánh giá của bạn.

iterate

1. Đặt mục tiêu

2. Viết prompt ban đầu

3. Đánh giá baseline

4. Áp dụng kỹ thuật

5. Đánh giá lại

Hài lòng — ship prompt

Ví dụ: Lập kế hoạch bữa ăn cho vận động viên

Hãy xem xét một ví dụ thực tế. Mục tiêu là tạo ra một prompt để tạo ra kế hoạch bữa ăn trong một ngày cho các vận động viên dựa trên đặc điểm thể chất và yêu cầu của họ.

Prompt này nhận các đầu vào này và nên tạo ra một kế hoạch bữa ăn toàn diện với tổng lượng calo, phân tích vĩ mô và chi tiết bữa ăn cụ thể với khẩu phần và thời gian.

Thiết lập Khung đánh giá

Để đo lường sự cải thiện một cách có hệ thống, bạn cần một thiết lập đánh giá mạnh mẽ. Khung này bao gồm:

  • Tạo tập dữ liệu - Tạo các trường hợp kiểm thử đại diện cho các tình huống thực tế
  • Chấm điểm tự động - Sử dụng các tiêu chí nhất quán để đánh giá kết quả
  • Theo dõi hiệu suất - Giám sát sự cải thiện qua các lần lặp lại

Khi thiết lập trình đánh giá của bạn, hãy lưu ý đến giới hạn tốc độ API. Bắt đầu với độ đồng thời thấp (1-3 yêu cầu đồng thời) và chỉ tăng nếu bạn không gặp lỗi giới hạn tốc độ.

Tạo Prompt ban đầu của bạn

Bắt đầu với một cái gì đó đơn giản, ngay cả khi bạn biết nó không tốt. Đây là ví dụ về một bản nháp đầu tiên cơ bản:

Người này nên ăn gì?

- Chiều cao: {prompt_inputs["height"]}
- Cân nặng: {prompt_inputs["weight"]}  
- Mục tiêu: {prompt_inputs["goal"]}
- Hạn chế ăn kiêng: {prompt_inputs["restrictions"]}

Prompt này cố tình đơn giản và có khả năng cho kết quả kém. Đó chính xác là những gì bạn muốn - một điểm cơ sở rõ ràng để cải thiện.

Thiết lập Tiêu chí đánh giá

Xác định các tiêu chí cụ thể mà prompt của bạn nên đáp ứng. Đối với ví dụ lập kế hoạch bữa ăn, kết quả tốt nên bao gồm:

  • Tổng lượng calo hàng ngày
  • Phân tích vĩ mô
  • Các bữa ăn với thực phẩm, khẩu phần và thời gian chính xác

Các tiêu chí này giúp mô hình đánh giá chấm điểm kết quả một cách nhất quán và cung cấp cho bạn các mục tiêu rõ ràng để cải thiện.

Đo lường Hiệu suất Cơ sở

Chạy prompt ban đầu của bạn thông qua khung đánh giá. Đừng nản lòng bởi điểm số thấp - điểm 2.3 trên 10 thực sự là hoàn hảo cho một điểm khởi đầu. Nó cho bạn nhiều chỗ để thể hiện sự cải thiện.

Phân tích Kết quả

Hầu hết các khung đánh giá đều tạo báo cáo chi tiết hiển thị cách mỗi trường hợp kiểm thử hoạt động. Các báo cáo này thường bao gồm:

  • Kết quả trường hợp kiểm thử riêng lẻ - Xem chính xác những gì mô hình đã tạo ra
  • Phân tích điểm số - Hiểu tại sao một số kết quả lại có điểm thấp
  • Lý do - Nhận phản hồi về những gì còn thiếu hoặc không chính xác

Sử dụng phản hồi chi tiết này để xác định các lĩnh vực cụ thể mà prompt của bạn cần cải thiện. Tìm kiếm các mẫu trên nhiều trường hợp kiểm thử để hiểu các vấn đề có hệ thống thay vì các sự cố chỉ xảy ra một lần.

Các bước tiếp theo

Với điểm cơ sở đã được thiết lập và khung đánh giá đã sẵn sàng, bạn đã sẵn sàng bắt đầu áp dụng các kỹ thuật prompt engineering cụ thể. Mỗi kỹ thuật bạn áp dụng sẽ mang lại sự cải thiện có thể đo lường được trong điểm số đánh giá của bạn, đưa bạn đến gần hơn với chất lượng đầu ra lý tưởng.

Điều quan trọng là thực hiện từng thay đổi một, đánh giá tác động, sau đó quyết định xem có giữ nguyên thay đổi đó hay thử một cách tiếp cận khác. Quy trình có hệ thống này đảm bảo bạn hiểu kỹ thuật nào hoạt động tốt nhất cho trường hợp sử dụng cụ thể của mình.

Tải xuống

🔁 Bài học liên quan

📚 Nguồn & ghi nhận

Bài học có hữu ích không?

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?