Bỏ qua đến nội dung chính

So sánh Baseline và Harness Tối thiểu

Bạn Làm Gì

Xây dựng một ứng dụng Electron knowledge-base shell tối giản — một cửa sổ với danh sách tài liệu bên trái, panel Q&A bên phải, và thư mục dữ liệu cục bộ. Bản thân tác vụ không phức tạp. Điều phức tạp là cách bạn để agent hoàn thành nó.

Bạn chạy hai lần. Lần đầu: chỉ một prompt, không chuẩn bị gì. Lần hai: AGENTS.md, init.sh, feature_list.json được đặt sẵn trong repo. Sau đó so sánh.

Cốt lõi của dự án này không phải là viết mã — mà là tìm hiểu khoảng cách lớn thế nào giữa "dành 15 phút chuẩn bị quy tắc trước" và "cứ để agent tự làm."

Công cụ

  • Claude Code hoặc Codex (chọn một, sử dụng cho cả hai lần chạy)
  • Git (quản lý branch và so sánh)
  • Node.js + Electron (tech stack dự án)
  • Đồng hồ đo thời gian (ghi lại thời gian mỗi lần chạy)

Cơ chế Harness

Harness tối giản: AGENTS.md + init.sh + feature_list.json

Minimal Harness — rules-first

AGENTS.md chuẩn bị sẵn

init.sh khởi tạo workspace

feature_list.json định nghĩa scope

Agent đọc rules và tuân theo

Output ổn định, có thể lặp

Baseline — chỉ prompt

Prompt task

Agent đoán convention

Reinvent quy tắc mỗi session

Output không nhất quán

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?