Bỏ qua đến nội dung chính

Xác Minh QA Có Căn Cứ

Bạn Làm Gì

Triển khai phân tách vai trò — một generator thực hiện, một evaluator review, và tùy chọn một planner. Chạy ba lần để đo lường tác động của mỗi vai trò được thêm vào.

Chọn một tính năng nâng cấp thực chất (hội thoại đa lượt, thiết kế lại citation panel, hoặc lọc tài liệu) và giữ nó nhất quán qua tất cả các lần chạy.

Công cụ

  • Claude Code hoặc Codex
  • Git
  • Node.js + Electron

Cơ chế Harness

Tự xác minh + Q&A có grounding + hoàn thành dựa trên bằng chứng

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?