Bỏ qua đến nội dung chính

Citations

📖 Nội dung bài học

[

details

2
tải về Kích cỡ chữ Video này đang được xử lý. Vui lòng quay lại sau và tải lại trang.

Tóm tắt

Khi Claude trả lời câu hỏi dựa trên tài liệu bạn cung cấp, người dùng có thể lầm tưởng nó chỉ đang lấy kiến thức từ dữ liệu huấn luyện. Nhưng chuyện gì sẽ xảy ra nếu Claude có thể chỉ ra chính xác nơi nó tìm thấy thông tin? Đó là lúc chúng ta cần đến trích dẫn (citations) - một tính năng mạnh mẽ cho phép Claude tham chiếu đến các phần cụ thể trong tài liệu nguồn và cho người dùng thấy chính xác nguồn gốc của từng mẩu thông tin.

Tại sao trích dẫn lại quan trọng

Hãy tưởng tượng bạn hỏi Claude về quá trình hình thành khí quyển Trái Đất và nhận được câu trả lời chi tiết. Nếu không có trích dẫn, người dùng không có cách nào để xác minh thông tin hoặc hiểu rằng Claude thực sự đang tham chiếu một tài liệu cụ thể mà bạn đã cung cấp. Trích dẫn giải quyết vấn đề minh bạch này bằng cách tạo ra một dấu vết rõ ràng từ câu trả lời của Claude quay ngược lại tài liệu nguồn.

Kích hoạt trích dẫn

Để kích hoạt trích dẫn, bạn cần sửa đổi cấu trúc tin nhắn tài liệu. Thêm hai trường mới vào khối tài liệu (document block):

{
    "type": "document",
    "source": {
        "type": "base64",
        "media_type": "application/pdf",
        "data": file_bytes,
    },
    "title": "earth.pdf",
    "citations": { "enabled": True }
}

Trường title đặt cho tài liệu một cái tên dễ đọc, trong khi citations: {"enabled": True} yêu cầu Claude theo dõi nơi nó tìm thấy thông tin.

Hiểu về cấu trúc trích dẫn

Khi trích dẫn được kích hoạt, phản hồi của Claude sẽ trở nên phức tạp hơn. Thay vì văn bản thuần túy, bạn sẽ nhận được dữ liệu có cấu trúc bao gồm thông tin trích dẫn cho mỗi khẳng định.

Mỗi trích dẫn chứa một vài thông tin chính:

  • cited_text - Văn bản chính xác từ tài liệu hỗ trợ cho khẳng định của Claude.
  • document_index - Tài liệu nào Claude đang tham chiếu (hữu ích khi bạn cung cấp nhiều tài liệu).
  • document_title - Tiêu đề bạn đã gán cho tài liệu.
  • start_page_number - Trang bắt đầu của đoạn văn bản được trích dẫn.
  • end_page_number - Trang kết thúc của đoạn văn bản được trích dẫn.

Xây dựng giao diện người dùng với trích dẫn

Sức mạnh thực sự của trích dẫn đến từ việc xây dựng giao diện người dùng (UI) giúp thông tin này dễ tiếp cận. Bạn có thể tạo các yếu tố tương tác, nơi người dùng có thể di chuột qua các dấu trích dẫn để xem chính xác thông tin đến từ đâu.

Điều này tạo ra một trải nghiệm minh bạch, nơi người dùng có thể:

  • Thấy rằng câu trả lời của Claude được căn cứ (grounded) trên tài liệu nguồn thực tế.
  • Xác minh thông tin bằng cách kiểm tra tài liệu gốc.
  • Hiểu ngữ cảnh xung quanh từng mẩu thông tin được trích dẫn.

Trích dẫn với văn bản thuần túy (Plain Text)

Trích dẫn không chỉ giới hạn ở tài liệu PDF. Bạn cũng có thể dùng chúng với các nguồn văn bản thuần túy. Khi làm việc với văn bản, hãy sửa đổi cấu trúc tài liệu như sau:

{
    "type": "document", 
    "source": {
        "type": "text",
        "media_type": "text/plain",
        "data": article_text,
    },
    "title": "earth_article",
    "citations": { "enabled": True }
}

Với nguồn văn bản thuần túy, thay vì số trang, bạn sẽ nhận được vị trí ký tự (character positions) xác định chính xác vị trí trong văn bản mà Claude đã tìm thấy từng mẩu thông tin.

Khi nào nên dùng trích dẫn

Trích dẫn đặc biệt giá trị khi:

  • Người dùng cần xác minh thông tin để đảm bảo độ chính xác.
  • Bạn đang làm việc với các tài liệu có thẩm quyền mà người dùng cần tham chiếu được.
  • Sự minh bạch về nguồn thông tin là yếu tố then chốt cho ứng dụng của bạn.
  • Người dùng muốn khám phá ngữ cảnh rộng hơn xung quanh các sự kiện cụ thể.

Bằng cách triển khai trích dẫn, bạn biến Claude từ một "hộp đen" (black box) đưa ra câu trả lời thành một trợ lý nghiên cứu minh bạch, biết cách trình bày các bước làm việc của mình. Điều này xây dựng niềm tin cho người dùng và cho phép họ đi sâu hơn vào tài liệu nguồn khi cần thiết.

Tải về

🔁 Bài học liên quan

📚 Nguồn & ghi nhận

Bài học có hữu ích không?

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?