How do we assess the 4Ds?

📖 Nội dung bài học

[

chi tiết

5
tải về

Nội dung bạn sẽ học

Thời gian ước tính: 40 phút

Sau bài học này, bạn sẽ có thể:

Áp dụng các chiến lược đánh giá dựa trên kết quả (outcome-based), quy trình (process-based) và phản tư (reflection-based) để đo lường Độ thuần thục AI (AI Fluency).
Tạo các bảng tiêu chí (rubrics) để ghi nhận các năng lực trong khung tư duy 4D (4D Framework) trong bối cảnh giảng dạy cụ thể của bạn.

Làm thế nào để đánh giá khung 4D?

Video này khám phá ba phương pháp bổ trợ để đánh giá Độ thuần thục AI: dựa trên kết quả (tập trung vào những gì sinh viên tạo ra thông qua cộng tác với AI), dựa trên quy trình (xem xét cách sinh viên làm việc với AI theo thời gian) và dựa trên phản tư (đánh giá nhận thức siêu nhận thức). Video trình bày cách áp dụng ba phương pháp này cho từng chữ D trong khung 4D, cung cấp các ví dụ cụ thể về những gì cần tìm kiếm và cách đánh giá sự phát triển của sinh viên. Đối với Ủy thác (Delegation), chúng ta đánh giá việc thiết lập mục tiêu, chia nhỏ nhiệm vụ, lựa chọn công cụ; đối với Mô tả (Description), chúng ta đánh giá chất lượng hội thoại và tinh chỉnh lặp đi lặp lại; đối với Nhận thức (Discernment), chúng ta xem xét kỹ năng đánh giá phản biện; và đối với Cần mẫn (Diligence), chúng ta kiểm tra việc ra quyết định đạo đức và trách nhiệm giải trình. Video nhấn mạnh rằng việc kết hợp cả ba phương pháp đánh giá sẽ mang lại bức tranh đầy đủ nhất về sự phát triển Độ thuần thục AI của sinh viên.

Các điểm chính cần lưu ý

Đánh giá Độ thuần thục AI hiệu quả cần kết hợp các phương pháp tiếp cận dựa trên kết quả, quy trình và phản tư để có cái nhìn toàn diện.
Mỗi chữ D trong khung 4D yêu cầu các loại bằng chứng và chiến lược đánh giá khác nhau.
Đánh giá kết quả tập trung vào sản phẩm được tạo ra, đánh giá quy trình xem xét hành trình thực hiện, và đánh giá phản tư đo lường nhận thức siêu nhận thức.
Các hành động có thể quan sát được và các sản phẩm (artifacts) cụ thể đáng tin cậy hơn là những giả định về sự hiểu biết.
Đánh giá nên là một cơ hội học tập, không chỉ đơn thuần là đo lường.

Bài tập

Bài tập này giúp bạn tạo một bảng tiêu chí (rubric) thực tế để đánh giá Độ thuần thục AI trong bối cảnh khóa học cụ thể của bạn.

Bước 1: Thiết lập nền tảng đánh giá (5 phút)

Bắt đầu một cuộc hội thoại mới với Claude hoặc tiếp tục cuộc hội thoại từ Bài 1:

Thiết lập hội thoại:

Cung cấp cho AI các bản ghi (transcripts) từ hai video bài học.
Nếu bắt đầu mới, hãy chia sẻ bối cảnh giảng dạy của bạn và giải thích rằng bạn đang xây dựng phương pháp đánh giá để dạy Độ thuần thục AI.
Nếu tiếp tục, hãy nhắc Claude rằng bạn đang tập trung vào các chiến lược đánh giá cho khóa học của mình.
Mô tả một bài tập hoặc dự án cụ thể mà bạn dự định cho sinh viên sử dụng AI.
Giải thích khía cạnh nào của Độ thuần thục AI là quan trọng nhất cho bài tập cụ thể này.

Xác định ưu tiên đánh giá:

Thảo luận với AI xem chữ D nào (và các năng lực phụ tương ứng) trong khung 4D là phù hợp nhất với mục tiêu bài tập của bạn.
Khám phá xem "thành công" đối với sinh viên trong bối cảnh cụ thể này trông như thế nào.
Cân nhắc những thách thức hoặc hiểu lầm phổ biến mà bạn dự đoán sinh viên sẽ gặp phải.
Xác định bằng chứng nào sẽ thuyết phục bạn rằng sinh viên đã phát triển được độ thuần thục.

Bước 2: Lựa chọn phương pháp đánh giá (10 phút)

Làm việc với AI để khớp các phương pháp đánh giá với các năng lực:

Với mỗi chữ D bạn đang đánh giá, hãy khám phá:

Liệu các thước đo dựa trên kết quả có hiệu quả không (sản phẩm nào sẽ chứng minh được năng lực)?
Liệu các thước đo dựa trên quy trình có khả thi không (bạn có thể truy cập và đánh giá nhật ký chat - chat logs không)?
Liệu các thước đo dựa trên phản tư có thêm giá trị không (những câu hỏi nào sẽ bộc lộ hoặc thúc đẩy sự hiểu biết)?
Sự kết hợp các phương pháp nào mang lại cho bạn bức tranh rõ ràng nhất về sự phát triển của sinh viên?

Đưa ra quyết định thực tế:

Thảo luận với AI về những gì thực sự có thể đánh giá được dựa trên thời gian và nguồn lực của bạn.
Cân nhắc yếu tố nào có thể để sinh viên tự đánh giá hoặc đánh giá đồng đẳng (peer-assess).
Xác định những gì bạn cần đánh giá trực tiếp so với những gì sinh viên có thể tự ghi lại tài liệu.
Lên kế hoạch cân bằng giữa việc đánh giá toàn diện và hiệu quả chấm điểm.

Bước 3: Tạo các chỉ số có thể quan sát được (10 phút)

Phát triển các tiêu chí cụ thể, có thể quan sát được cùng với AI:

Xác định các mức độ hoàn thành:

Làm việc với AI để tạo ra ba mức độ rõ ràng (ví dụ: mới bắt đầu - emerging, đang phát triển - developing, thành thạo - proficient).
Với mỗi mức độ, hãy mô tả những gì bạn thực sự thấy trong bài làm của sinh viên.
Sử dụng ngôn ngữ cụ thể cho khóa học và bài tập của bạn thay vì các thuật ngữ chung chung.
Bao gồm các ví dụ cụ thể từ lĩnh vực chuyên môn của bạn nếu thấy hữu ích.

Viết các chỉ số rõ ràng:

Chuyển đổi các khái niệm trừu tượng thành các hành vi có thể quan sát được.
Thay thế các thuật ngữ mơ hồ như "hiểu biết tốt" bằng các hành động cụ thể.
Kết nối các chỉ số trực tiếp với yêu cầu bài tập của bạn.
Đảm bảo mỗi chỉ số là thứ bạn thực sự có thể đánh giá được.

Bước 4: Định dạng bảng tiêu chí (5 phút)

Tạo tài liệu bảng tiêu chí (rubric) cuối cùng:

Yêu cầu AI giúp cấu trúc rubric theo định dạng rõ ràng, dễ sử dụng.
Cùng AI xem xét liệu mỗi tiêu chí có thể phân biệt rõ ràng hay không.
Kiểm tra xem sự tiến triển giữa các mức độ có logic và khả thi không.
Xác nhận rằng rubric phù hợp với các mục tiêu học tập đã đề ra.
Cân nhắc cách bạn sẽ truyền đạt rubric này cho sinh viên.
Đảm bảo ngôn ngữ rõ ràng cho cả bạn và sinh viên.

Tiếp theo là gì

Trong bài học tới, chúng ta sẽ tập trung vào việc thiết kế các bài tập giúp sinh viên vừa phát triển vừa thể hiện được Độ thuần thục AI.

Phản hồi

Trong quá trình học, chúng tôi rất mong nhận được phản hồi từ bạn về cách bạn áp dụng các khái niệm trong khóa học vào cuộc sống, công việc hoặc lớp học. Chia sẻ phản hồi của bạn tại đây.

Lời cảm ơn và bản quyền

Bản quyền 2025 Rick Dakan, Joseph Feller, và Anthropic. Được phát hành theo giấy phép CC BY-NC-SA 4.0. Khóa học này dựa trên Khung Độ thuần thục AI (The AI Fluency Framework) của Dakan và Feller. Được hỗ trợ một phần bởi Cơ quan Giáo dục Đại học, Ireland, thông qua Diễn đàn Quốc gia về Tăng cường Giảng dạy và Học tập.

Tóm tắt

Tải về

🎬 Bản ghi video

Source video: jskB42hvdPI

📜 Mở rộng bản ghi (đã chỉnh sửa + dịch AI)

Chào mọi người, tôi là Joe Feller. Hãy cùng xem xét một trong những câu hỏi hóc búa nhất trong việc giảng dạy về sự thông thạo AI: Làm thế nào để chúng ta thực sự đánh giá được năng lực này? Làm sao để phân biệt giữa một sinh viên chỉ tình cờ tìm ra vài prompt khéo léo với một sinh viên đang thực sự phát triển kỹ năng cộng tác chuyên sâu?

Chúng ta cần hiểu rõ sự thông thạo AI biểu hiện như thế nào trong thực tế và phân biệt giữa tương tác AI bề mặt với năng lực cộng tác chuyên sâu. Chúng tôi đã tìm thấy ba phương pháp tiếp cận tổng quát có thể phối hợp hiệu quả với nhau.

Ba phương pháp đánh giá tổng quát

Đánh giá dựa trên kết quả (Outcome-based): Tập trung vào những gì sinh viên tạo ra thông qua việc cộng tác với AI. Chúng ta đánh giá liệu sinh viên có đạt được mục tiêu đề ra thông qua mối quan hệ đối tác giữa người và AI hay không.
Đánh giá dựa trên quy trình (Process-based): Xem xét cách sinh viên làm việc với AI theo thời gian. Phương pháp này ghi lại các mô hình lặp lại (iteration), cách phục hồi sau những lần thử thất bại và sự tinh tế trong phương pháp luận. Chúng ta quan tâm đến những gì xảy ra trong quá trình cộng tác, chứ không chỉ là sản phẩm cuối cùng.
Đánh giá dựa trên sự phản tư (Reflection-based): Tập trung vào nhận thức siêu nhận thức (metacognitive awareness) — khi sinh viên suy nghĩ về chính quá trình tư duy của mình. Chúng ta quan tâm đến kết luận của sinh viên về lý do tại sao một số chiến lược nhất định hiệu quả hoặc không, những gì họ đã học được và cách họ áp dụng bài học đó vào các tương tác trong tương lai.

Chúng tôi tin rằng các bài đánh giá sự thông thạo AI hiệu quả nhất là sự tích hợp của cả ba phương pháp này. Chúng không chỉ đánh giá những gì sinh viên có thể tạo ra với AI, mà còn đánh giá cách họ tư duy và trưởng thành với tư cách là những người cộng tác với AI.

Áp dụng khung đánh giá vào mô hình 4D

Hãy cùng xem xét từng yếu tố trong "4D" dưới các góc độ này.

1. Delegation (Ủy thác)

Delegation là việc thiết lập mục tiêu và quyết định liệu có nên, khi nào và làm thế nào để tương tác với AI.

Dựa trên kết quả: Kế hoạch ủy thác có hợp lý không? Các mục tiêu có thực tế không? Họ có chọn đúng tool cho công việc không?
Dựa trên quy trình: Có thể bao gồm việc xem xét các nhật ký chat có chú thích, nơi sinh viên thực hiện quy trình ủy thác với một AI assistant, cho thấy cách họ khám phá các lựa chọn và đưa ra quyết định.
Dựa trên sự phản tư: Yêu cầu sinh viên giải thích các lựa chọn của họ. Họ đã cân nhắc những gì khác, và các quyết định ủy thác đã định hình mọi thứ diễn ra sau đó như thế nào?

2. Description (Mô tả)

Description là khả năng giao tiếp hiệu quả của sinh viên để điều hướng các hành vi và đầu ra hữu ích của AI.

Dựa trên kết quả: Kiểm tra chất lượng của các prompt được tạo ra và phản hồi của AI. Các hướng dẫn có rõ ràng không? Chúng có cung cấp ngữ cảnh tốt không? Chúng ta cũng có thể đánh giá sự tiến hóa của prompt từ phiên bản đầu tiên đến phiên bản cuối cùng.
Dựa trên quy trình: Phân tích nhật ký hội thoại dựa trên rubric, cho thấy sự tinh chỉnh lặp lại, tài liệu hóa các cách tiếp cận thất bại và những bước chuyển hướng dẫn đến đột phá, cũng như bằng chứng về việc xây dựng ngữ cảnh chung theo thời gian.
Dựa trên sự phản tư: Khám phá phân tích của sinh viên về kỹ thuật mô tả nào hiệu quả nhất và tại sao. Chúng ta tìm kiếm sự nhận biết của họ về việc các nhiệm vụ khác nhau yêu cầu cách tiếp cận giao tiếp khác nhau như thế nào, và những hiểu biết về mối quan hệ giữa chất lượng mô tả và chất lượng đầu ra. Chúng ta có thể hỏi trực tiếp: "Chiến lược giao tiếp nào hiệu quả nhất và tại sao?" hoặc "Bạn đã điều chỉnh cách tiếp cận của mình như thế nào cho các nhiệm vụ khác nhau?"

3. Discernment (Sự phân định)

Discernment tập trung vào khả năng của sinh viên trong việc đánh giá chính xác tính hữu dụng của các đầu ra và hành vi của AI.

Dựa trên kết quả: Sinh viên có thể chú thích các đầu ra của AI để đánh dấu phần nào tốt và phần nào cần cải thiện. Bạn cũng có thể yêu cầu sinh viên ghi nhật ký quyết định, giải thích phần nào của đầu ra AI được giữ lại, sửa đổi hoặc loại bỏ.
Dựa trên quy trình: Tìm kiếm các nhận xét đánh giá trực tiếp trong nhật ký chat, bằng chứng về việc phát hiện và sửa lỗi của AI, và khả năng nhận diện quy luật qua nhiều lần tương tác. Điều này cho phép bạn thấy sinh viên phát triển tư duy phản biện trong thời gian thực.
Dựa trên sự phản tư: Tập trung vào phân tích của sinh viên về các tiêu chí đánh giá của họ và cách chúng tiến hóa, thảo luận về các vấn đề mà ban đầu họ đã bỏ lỡ, các bài học kinh nghiệm và so sánh các chiến lược phân định trên các loại nhiệm vụ khác nhau.

4. Diligence (Sự cẩn trọng)

Diligence liên quan đến việc chịu trách nhiệm về những gì chúng ta làm với AI và cách chúng ta thực hiện điều đó.

Dựa trên kết quả: Đánh giá chất lượng và tính đầy đủ của các tuyên bố về sự cẩn trọng, trích dẫn phù hợp, tài liệu minh bạch và bằng chứng về quy trình kiểm chứng sự thật (fact-checking). Hãy hỏi: "Họ ghi nhận vai trò của AI trong công việc của mình như thế nào?" hoặc "Họ sử dụng quy trình xác minh nào và chúng có hiệu quả trong việc phát hiện lỗi không?"
Dựa trên quy trình: Kiểm tra các thực hành xử lý dữ liệu hiển thị trong nhật ký chat, việc ra quyết định đạo đức trước, trong và sau khi cộng tác, việc xử lý có ý thức các thông tin nhạy cảm và việc lưu trữ tài liệu về việc xin phép hoặc kiểm tra các ràng buộc.
Dựa trên sự phản tư: Khám phá thảo luận của sinh viên về bất kỳ tình huống khó xử nào về đạo đức mà họ gặp phải. Họ hiểu trách nhiệm của mình như thế nào trong phạm vi cộng tác với AI? Những thách thức đạo đức nào làm họ ngạc nhiên, và họ dự định sử dụng những cảnh báo này như thế nào để cải thiện việc sử dụng AI có trách nhiệm trong tương lai?

Ví dụ thực tế: Bài luận có sự hỗ trợ của AI

Hãy kết hợp tất cả các khái niệm này và xem xét cách chúng ta có thể đánh giá một bài tập trong thực tế. Hãy tưởng tượng chúng ta yêu cầu sinh viên viết một bài luận về tác động của GenAI đối với xã hội với sự hỗ trợ của một AI assistant. Họ được yêu cầu nộp bài luận cuối cùng, một liên kết đến các tương tác của họ với AI, một tuyên bố về sự cẩn trọng và một nhật ký học tập thảo luận về trải nghiệm của họ.

Chúng ta đánh giá bài làm từ cả ba góc độ:

Góc độ dựa trên kết quả: Chúng ta xem xét chính bài luận và tuyên bố về sự cẩn trọng. Bài luận có đáp ứng được yêu cầu không? Có dấu hiệu rõ ràng về sự giám sát chặt chẽ của con người trong phiên bản cuối cùng không? Quy trình cộng tác với AI có được trình bày minh bạch không?
Góc độ dựa trên quy trình: Chúng ta xem xét chính tương tác với AI và những gì đã xảy ra ở hậu trường. Sinh viên có xây dựng ngữ cảnh chung với AI một cách hiệu quả không? Sinh viên đã tinh chỉnh việc prompting theo thời gian như thế nào? Có bằng chứng về việc chuyển hướng và điều chỉnh quy trình để phản hồi lại các lỗi, sự hiểu lầm hoặc thiếu rõ ràng không?
Góc độ dựa trên sự phản tư: Chúng ta xem xét nhật ký học tập. Sinh viên có thể giải thích điều gì hiệu quả và điều gì không? Họ có thể nêu ra các bài học kinh nghiệm để cải thiện việc cộng tác với AI trong tương lai không?

Các nguyên tắc cốt lõi trong đánh giá sự thông thạo AI

Đánh giá sự thông thạo AI đòi hỏi chúng ta phải nhìn xa hơn các sản phẩm cuối cùng để hiểu cách sinh viên thể hiện năng lực cộng tác với AI. Dưới đây là một số nguyên tắc hiệu quả:

Kết hợp các phương pháp tiếp cận: Sử dụng cả phương pháp kết quả, quy trình và phản tư để có được bức tranh toàn cảnh.
Tập trung vào những gì có thể quan sát được: Tìm kiếm các hành động có thể quan sát được trong các sản phẩm cụ thể thay vì đưa ra các giả định về sự hiểu biết.
Điều chỉnh phương pháp tiếp cận: Hãy nhớ rằng các năng lực khác nhau có thể phù hợp với các phương pháp đánh giá khác nhau.
Ưu tiên việc học tập: Quan trọng nhất, hãy biến việc đánh giá thành một cơ hội học tập, không chỉ là một phép đo. Giúp sinh viên nhận ra và tìm thấy giá trị trong sự phát triển của chính họ khi cộng tác với AI.

Bây giờ chúng ta đã thảo luận về cách đánh giá 4D, tiếp theo chúng ta sẽ khám phá việc thiết kế các bài tập dựa trên khung năng lực thông thạo AI.

🔁 Bài học liên quan

Bài tiếp: Designing assignments for AI Fluency
Bài trước: The Description-Discernment loop
Cùng section: Designing assignments for AI Fluency
Thuộc lộ trình: Path E
Docs tham khảo: Glossary · Skills atlas · By use-case

📚 Nguồn & ghi nhận

Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/teaching-ai-fluency/327280
Crawl: 2026-04-23 · Chuẩn hoá: 2026-05-01