Bỏ qua đến nội dung chính
Miễn phí mãi mãi · không paywall · không quảng cáo
Đề xuất khoá học
→
en
vi
claudem
y
.org
Lộ trình
Thư viện
Theo nhu cầu
Kỹ năng
Tìm khoá học, bài học…
⌘K
en
vi
Trang chủ
Thư viện YouTube
AI Engineer — Evals & Observability
Khoá học · Thư viện YouTube
AI Engineer — Evals & Observability
AI Engineer
6 bài học
5h 14m
Feedback-driven prompt optimization
1
Build a Prompt Learning Loop - SallyAnn DeLucia & Fuad Ali, Arize
Trung cấp
52m
Measuring AI agent developer productivity
2
How METR measures Long Tasks and Experienced Open Source Dev Productivity - Joel Becker, METR
Trung cấp
1h 16m
LLM evaluator calibration and optimization
3
Judge the Judge: Building LLM Evaluators That Actually Work with GEPA — Mahmoud Mabrouk, Agenta AI
Trung cấp
41m
Benchmarking LLM real-world limitations
4
What Do Models Still Suck At? - Peter Gostev, Arena.ai, BullshitBench
Nâng cao
20m
Building effective LLM agent eval platforms
5
Why building eval platforms is hard — Phil Hetzel, Braintrust
Trung cấp
26m
Observability for production AI systems
6
Shipping complex AI applications — Braintrust & Trainline
Trung cấp
1h 39m
💬
Góp ý / Báo lỗi
Phát hiện sai sót hoặc có ý tưởng cải thiện?
→