📖 Nội dung bài học
Bạn sẽ học được gì
Thời gian dự kiến: 30 phút
Sau bài học này, bạn sẽ có thể:
- Nêu rõ các mối quan ngại về quyền riêng tư và đánh giá các công cụ AI dựa trên chính sách xử lý dữ liệu của chúng.
- Thực hành các chiến lược vệ sinh dữ liệu (data hygiene) để làm việc an toàn với các thông tin nhạy cảm.
Hiểu về quyền riêng tư và dữ liệu
(10 phút)
Video này giải quyết một trong những mối quan tâm phổ biến nhất của các chuyên gia phi lợi nhuận về AI: quyền riêng tư dữ liệu. Bạn sẽ học được điều gì thực sự xảy ra với dữ liệu bạn chia sẻ với các công cụ AI, cách đánh giá các nền tảng và gói dịch vụ khác nhau về khả năng bảo vệ quyền riêng tư, và cách chuẩn bị dữ liệu nhạy cảm để sử dụng AI an toàn.
Các điểm chính cần lưu ý
- AI đặt ra những cân nhắc mới về quyền riêng tư—đặc biệt là xoay quanh việc huấn luyện (training): Một số công cụ AI sử dụng dữ liệu đầu vào của bạn để huấn luyện các mô hình trong tương lai, nghĩa là các mẫu (pattern) từ dữ liệu của bạn có thể ảnh hưởng đến kết quả đầu ra sau này.
- Các công cụ khác nhau có quy định khác nhau: Công cụ AI miễn phí bạn dùng để lên ý tưởng cho sự kiện không giống với một tài khoản trả phí có chính sách lưu trữ dữ liệu nghiêm ngặt. Hãy chọn công cụ phù hợp với tác vụ—các công cụ có mức độ bảo vệ cao hơn cho phép chia sẻ dữ liệu nhạy cảm an toàn hơn.
- Sử dụng AI an toàn không phải là né tránh nó—mà là sử dụng có trách nhiệm: Áp dụng Nhận thức về Vấn đề (Problem Awareness) và Nhận thức về Nền tảng (Platform Awareness) trước khi bắt đầu một dự án mới. Thường thì bạn có thể nhận được đầy đủ lợi ích từ AI mà không cần chia sẻ thông tin nhạy cảm bằng cách chia nhỏ tác vụ thành các phần thành phần.
- Bạn thường có thể loại bỏ hoàn toàn thông tin định danh: Để phân tích mẫu, bạn có thể không cần tên, chi tiết liên lạc hoặc các thông tin định danh cá nhân (PII - Personally Identifiable Information) khác. Hãy đi ngược từ mục tiêu thực tế để xác định dữ liệu nào là thực sự cần thiết.
- Nếu có sự cố, bạn luôn có các lựa chọn: Xóa cuộc trò chuyện, yêu cầu xóa dữ liệu thông qua quy trình quyền riêng tư của nền tảng và tuân thủ các giao thức của tổ chức bạn.
Lưu ý về cài đặt quyền riêng tư của Claude
Riêng với Claude, bạn có thể tìm thông tin chi tiết về chính sách dữ liệu tại privacy.anthropic.com và trust.anthropic.com. Bạn có thể điều chỉnh cài đặt quyền riêng tư trực tiếp trong ứng dụng Claude, bao gồm cả việc từ chối (opt-out) cho phép sử dụng các cuộc trò chuyện của bạn để huấn luyện. Các nhà cung cấp AI khác cũng nên có các tài nguyên tương tự—nếu họ không có, đó có thể là một dấu hiệu cảnh báo.
Bài tập 1: Đánh giá mức độ nhạy cảm của dữ liệu
Bài tập này giúp bạn phát triển khả năng phán đoán về loại dữ liệu nào là an toàn để chia sẻ với các công cụ AI.
Phần I: Xem xét dữ liệu mẫu
Chọn một trong các tình huống sau đây phù hợp nhất với công việc của bạn:
- Một bảng tính lịch sử đóng góp của nhà hảo tâm với tên, số tiền và thông tin liên lạc.
- Phản hồi khảo sát từ những người tham gia chương trình bao gồm các chi tiết nhân khẩu học.
- Một bản dự thảo báo cáo tài trợ chứa các câu chuyện về người thụ hưởng và dữ liệu kết quả.
Phần II: Chú thích mức độ nhạy cảm
Đối với tình huống bạn đã chọn, hãy xác định:
- Trường dữ liệu hoặc phần nào chứa thông tin định danh cá nhân (PII)?
- Thông tin nào là thiết yếu cho việc phân tích bạn muốn thực hiện?
- Thông tin nào có thể được loại bỏ hoặc ẩn danh hóa (anonymized) mà không làm mất giá trị phân tích?
- Kịch bản tồi tệ nhất là gì nếu dữ liệu này bị lộ?
Phần III: Lập kế hoạch tiếp cận
- Bạn sẽ loại bỏ hoặc sửa đổi điều gì trước khi chia sẻ với AI?
- Công cụ/gói dịch vụ nào sẽ phù hợp với mức độ nhạy cảm này?
- Bạn sẽ thực hiện các bước xác minh nào sau khi nhận được phân tích từ AI?
Bài tập 2: Thực hành vệ sinh dữ liệu
Bài tập này hướng dẫn bạn cách chuẩn bị dữ liệu nhạy cảm để sử dụng AI an toàn.
Phần I: Chọn tài liệu
Chọn một tài liệu thực tế từ công việc của bạn có chứa một số thông tin nhạy cảm (hoặc tạo một mẫu thực tế). Đó có thể là:
- Một báo cáo chương trình với chi tiết về khách hàng.
- Một bản dự thảo liên lạc với nhà hảo tâm có đề cập đến số tiền đóng góp cụ thể.
- Ghi chú cuộc họp có nhắc đến tên nhân viên hoặc tình nguyện viên.
Phần II: Làm sạch (sanitize) tài liệu
Điểm qua tài liệu và:
- Thay thế tên bằng các định danh chung (Người A, Nhà hảo tâm 1, v.v.).
- Loại bỏ hoặc khái quát hóa chi tiết địa điểm nếu không thiết yếu.
- Xóa bỏ hoàn toàn thông tin liên lạc.
- Cân nhắc xem các số tiền cụ thể có cần chính xác hay có thể để theo khoảng.
Phần III: Thử nghiệm với AI
Chia sẻ tài liệu đã làm sạch của bạn với AI và đặt một câu hỏi liên quan đến công việc. Suy ngẫm:
- Việc loại bỏ thông tin định danh có làm hạn chế khả năng hỗ trợ của AI không?
- Bạn cần cung cấp thêm ngữ cảnh nào để bù đắp?
- Bạn có cảm thấy thoải mái với mức độ thông tin mình đã chia sẻ không?
Suy ngẫm sau bài học
- Việc suy nghĩ về quyền riêng tư AI có gì khác biệt so với cách bạn nghĩ về các công cụ phần mềm khác (email, lưu trữ đám mây, CRM)?
- Một thay đổi nào bạn sẽ thực hiện trong cách tiếp cận chia sẻ dữ liệu với AI dựa trên bài học này?
Bước tiếp theo
Trong bài học tới, chúng ta sẽ đưa các thực hành quyền riêng tư này vào hành động khi khám phá phân tích dữ liệu với AI—học cách nhận diện các mẫu (pattern), tạo ra thông tin chi tiết (insight) và củng cố các chương trình của bạn trong khi vẫn giữ an toàn cho các thông tin nhạy cảm.
Phản hồi
Trong quá trình học, chúng tôi rất mong nhận được phản hồi từ bạn về cách bạn áp dụng các khái niệm trong khóa học vào công việc. Chia sẻ phản hồi của bạn tại đây.
Lời cảm ơn và bản quyền
Bản quyền 2025 Anthropic và Giving Tuesday. Dựa trên Khung năng lực AI (AI Fluency Framework) được phát triển bởi Giáo sư Rick Dakan (Ringling College of Art and Design) và Giáo sư Joseph Feller (University College Cork). Phát hành theo giấy phép CC BY-NC-SA 4.0.
🎬 Bản ghi video
Source video:
e-9J17_yo0c
📜 Mở rộng bản ghi (đã chỉnh sửa + dịch AI)
Quyền riêng tư dữ liệu và AI: Hiểu rõ Rủi ro và Cơ hội
Quyền riêng tư dữ liệu là mối quan tâm hàng đầu của nhiều người khi cân nhắc ứng dụng AI. Việc ngần ngại về nơi dữ liệu sẽ đi đâu hoặc điều gì xảy ra với các thông tin nhạy cảm là dấu hiệu của một thái độ làm việc trách nhiệm. Trong lĩnh vực bảo mật, không có giải pháp nào phù hợp cho tất cả; luôn tồn tại sự đánh đổi mà ở đó rủi ro phải được cân bằng với những lợi ích tiềm năng cho đội ngũ.
Các vấn đề về quyền riêng tư chủ yếu vận hành trong Vòng lặp Cẩn trọng khi Ủy thác (Delegation Diligence Loop). Khung tư duy này hướng dẫn người dùng suy nghĩ thấu đáo về việc nên chọn nhiệm vụ nào cho AI và trách nhiệm đi kèm khi sở hữu kết quả đầu ra.
Cách AI xử lý dữ liệu của bạn
Mọi công cụ phần mềm—từ email, CRM đến các chương trình bảng tính—đều có các quy tắc xử lý dữ liệu: cách thức và nơi lưu trữ, thời gian lưu giữ và kiểm soát quyền truy cập. Về cơ bản, các công cụ AI có thể được đánh giá tương tự như phần mềm thông thường, với một ngoại lệ lớn.
Ngoại lệ: Huấn luyện trên dữ liệu người dùng
Mối quan ngại chính yếu và duy nhất đối với các công cụ AI là liệu chúng có dùng dữ liệu người dùng để huấn luyện (train) hay không. Một số điều khoản và điều kiện cho phép các công ty AI sử dụng dữ liệu đầu vào của bạn để huấn luyện mô hình, nghĩa là dữ liệu của bạn có thể ảnh hưởng đến các kết quả đầu ra trong tương lai.
Cần lưu ý rằng điều này hiếm khi có nghĩa là một ai đó sẽ nhận được bản sao chính xác dữ liệu bạn đã tải lên. Thay vào đó, AI học các khuôn mẫu (patterns) để tác động đến cách nó trả lời các câu hỏi tương tự từ người dùng khác. Điều này có khả năng tiết lộ các chủ đề hoặc số liệu thống kê từ dữ liệu của một tổ chức ngay cả khi không tái hiện nguyên văn từ ngữ.
Đánh giá các Nền tảng và Gói dịch vụ AI
Nhận thức về Nền tảng (Platform Awareness) dạy chúng ta rằng không phải mọi công cụ và gói dịch vụ đều được xây dựng giống nhau.
- Một số công ty huấn luyện trên dữ liệu người dùng; số khác thì tuyên bố rõ ràng là không.
- Hầu hết sẽ xóa các cuộc hội thoại sau một khoảng thời gian nhất định.
- Nhiều bên cung cấp các cài đặt và mức phí khác nhau với các lớp bảo vệ quyền riêng tư khác biệt.
Điều này cũng áp dụng cho các công cụ bên thứ ba có tích hợp tính năng AI, vì chúng có thể chuyển dữ liệu ngược lại cho nhà cung cấp AI tùy thuộc vào điều khoản sử dụng đã thỏa thuận.
Xác định các công cụ AI an toàn
Các cấu hình AI an toàn nhất là những cấu hình không huấn luyện trên dữ liệu người dùng và có cửa sổ lưu giữ dữ liệu rất ngắn, thường là 30 ngày hoặc ít hơn. Đối với các công việc có tính nhạy cảm cao, những biện pháp bảo vệ này là thiết yếu.
- Claude của Anthropic: Thông tin về chính sách dữ liệu có thể tìm thấy tại
privacy.claude.comvàtrust.anthropic.com, nơi bạn có thể điều chỉnh các cài đặt quyền riêng tư. - Zero Data Retention (ZDR - Không lưu giữ dữ liệu): Để bảo mật tối đa, hãy tìm kiếm các chính sách "xóa ngay lập tức".
Nếu một công ty không cung cấp tài liệu rõ ràng về chính sách dữ liệu, đó nên được coi là một dấu hiệu cảnh báo (red flag).
Chiến lược thực tế: Ủy thác nhiệm vụ và Tối thiểu hóa dữ liệu
Nhận thức về Vấn đề và Ủy thác Nhiệm vụ bao gồm việc chia nhỏ công việc thành các phần thành phần để hiểu AI nên xử lý phần nào và con người nên đảm nhận phần nào. Thông thường, bạn có thể tận dụng toàn bộ lợi ích của AI mà không gặp rủi ro chia sẻ thông tin nhạy cảm thông qua việc lập kế hoạch kỹ lưỡng.
Tình huống: Phân tích dữ liệu khảo sát nhạy cảm
Hãy tưởng tượng một ngân hàng thực phẩm thực hiện khảo sát khách hàng bao gồm tên, thông tin liên hệ, thu nhập hộ gia đình và tình trạng việc làm. Để phân tích dữ liệu này một cách an toàn:
- Xác định Mục tiêu: Bạn có thể chỉ cần tìm ra các khuôn mẫu trên toàn bộ tệp khách hàng thay vì các câu chuyện cá nhân cụ thể.
- Loại bỏ thông tin định danh: Nhận thấy rằng các phân tích chuyên sâu không yêu cầu thông tin định danh cá nhân (PII), bạn có thể xóa các cột nhạy cảm (như tên hoặc địa chỉ chính xác) trước khi tải dữ liệu lên.
- Tối thiểu hóa dữ liệu: Bạn có thể chỉ giữ lại dữ liệu cần thiết, chẳng hạn như mã bưu chính để phân tích địa lý, và loại bỏ tất cả những thứ khác.
Ngay cả khi dữ liệu đã được ẩn danh, phương pháp tốt nhất vẫn là sử dụng một mô hình không huấn luyện trên dữ liệu người dùng.
Đảm bảo sự Cẩn trọng và Minh bạch
Khi làm việc với AI, phần cẩn trọng trong vòng lặp là cực kỳ quan trọng:
- Cẩn trọng về Minh bạch: Xác định xem ai cần biết rằng AI đã tham gia vào quá trình phân tích.
- Cẩn trọng về Triển khai: Xác minh các khuôn mẫu do AI tạo ra so với quan sát thực tế của chính bạn. Không chia sẻ phân tích mà thiếu đi ngữ cảnh này.
- Quyền sở hữu: Nếu bạn đang viết một báo cáo hoặc đề xuất tài trợ dựa trên những hiểu biết này, bạn là người chịu trách nhiệm cho những khẳng định đó.
Để hiểu rõ hơn các điều khoản và điều kiện phức tạp, bạn có thể tải chính sách quyền riêng tư lên một công cụ AI và đặt các câu hỏi cụ thể. Luôn yêu cầu trích dẫn để xác minh văn bản gốc.
Quản lý sai sót và Xóa dữ liệu
Nếu bạn vô tình chia sẻ thông tin nhạy cảm trong một môi trường AI không an toàn, hãy thực hiện các bước sau:
- Xóa cuộc hội thoại: Hầu hết các nền tảng cho phép bạn xóa từng cuộc hội thoại khỏi lịch sử.
- Yêu cầu xóa dữ liệu: Nhiều nhà cung cấp có quy trình chính thức cho việc này. Đối với Claude, thông tin có sẵn tại
privacy.claude.com. - Tuân thủ quy trình của tổ chức: Nếu nơi làm việc của bạn có hướng dẫn xử lý dữ liệu, hãy thông báo cho người có thẩm quyền, giống như cách bạn làm nếu gửi nhầm một email nhạy cảm cho sai người nhận.
Các bài học chính cho tổ chức
- Các nguyên tắc cơ bản vẫn được áp dụng: AI mang đến những rủi ro mới liên quan đến việc huấn luyện mô hình, nhưng các nguyên tắc bảo vệ dữ liệu cơ bản vẫn có giá trị. Đừng chia sẻ những gì bạn không thể để mất. Hãy loại bỏ thông tin định danh và lựa chọn mức độ bảo vệ của công cụ tương xứng với độ nhạy cảm của dữ liệu.
- Công cụ khác nhau, Quy tắc khác nhau: Một công cụ AI miễn phí dùng để lên ý tưởng (brainstorming) không giống với một tài khoản doanh nghiệp trả phí có chính sách lưu giữ nghiêm ngặt. Hãy chọn công cụ phù hợp với nhiệm vụ.
- Sử dụng có trách nhiệm: Sử dụng AI an toàn không phải là né tránh, mà là trách nhiệm. Hãy vận dụng nhận thức về vấn đề, nhận thức về nền tảng và ủy thác nhiệm vụ trước khi bắt đầu một dự án. Sử dụng AI có trách nhiệm là biết cần kiểm tra điều gì trước khi bắt đầu và không ngừng học hỏi trong suốt quá trình.
🔁 Bài học liên quan
- Bài tiếp: Data analysis with AI
- Bài trước: Writing with AI
- Cùng section: Data analysis with AI
- Thuộc lộ trình: Path G
- Docs tham khảo: Glossary · Skills atlas · By use-case
📚 Nguồn & ghi nhận
- Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/ai-fluency-for-nonprofits/376883
- © 2025 Anthropic. Chỉ dùng cho mục đích giáo dục, fair-use.
- Crawl: 2026-04-23 · Chuẩn hoá: 2026-05-01