So sánh Baseline và Harness Tối thiểu

Bạn Làm Gì

Xây dựng một ứng dụng Electron knowledge-base shell tối giản — một cửa sổ với danh sách tài liệu bên trái, panel Q&A bên phải, và thư mục dữ liệu cục bộ. Bản thân tác vụ không phức tạp. Điều phức tạp là cách bạn để agent hoàn thành nó.

Bạn chạy hai lần. Lần đầu: chỉ một prompt, không chuẩn bị gì. Lần hai: AGENTS.md, init.sh, feature_list.json được đặt sẵn trong repo. Sau đó so sánh.

Cốt lõi của dự án này không phải là viết mã — mà là tìm hiểu khoảng cách lớn thế nào giữa "dành 15 phút chuẩn bị quy tắc trước" và "cứ để agent tự làm."

Công cụ

Claude Code hoặc Codex (chọn một, sử dụng cho cả hai lần chạy)
Git (quản lý branch và so sánh)
Node.js + Electron (tech stack dự án)
Đồng hồ đo thời gian (ghi lại thời gian mỗi lần chạy)

Cơ chế Harness

Harness tối giản: AGENTS.md + init.sh + feature_list.json