Bỏ qua đến nội dung chính

PDF support

📖 Nội dung bài học

Tóm tắt

Claude có thể đọc và phân tích tài liệu PDF dễ dàng như xử lý hình ảnh. Khả năng này mở ra những khả năng mạnh mẽ cho việc phân tích tài liệu, tóm tắt và quy trình làm việc hỏi đáp.

Thiết lập Xử lý PDF

Để làm việc với PDF, bạn cần thực hiện một vài thay đổi chính cho cấu trúc tin nhắn tiêu chuẩn. Quy trình này tương tự như xử lý hình ảnh, nhưng có một số khác biệt quan trọng trong thông số kỹ thuật tài liệu.

Đầu tiên, đọc tệp PDF của bạn dưới dạng dữ liệu nhị phân:

with open("./earth.pdf", "rb") as f:
    file_bytes = f.read()

Cấu trúc Tin nhắn Tài liệu

Cấu trúc tin nhắn cho PDF khác với hình ảnh theo một số cách. Thay vì đối tượng "image", bạn sẽ dùng đối tượng "document" với các trường bắt buộc sau:

add_user_message(
    messages,
    [
        {"document": {"format": "pdf", "name": "earth", "source": {"bytes": file_bytes}}},
        {"text": "Summarize this document in one sentence"},
    ],
)

Các điểm chính về cấu trúc tài liệu:

  • Dùng "document" thay vì "image"
  • Đặt "format": "pdf"
  • Bao gồm trường "name" với tên tệp không có phần mở rộng
  • "source" chứa byte của tệp

Khi bạn chạy đoạn code này, Claude phân tích toàn bộ nội dung PDF và cung cấp phản hồi toàn diện. Trong trường hợp này, nó đã tóm tắt thành công bài viết Wikipedia về Trái đất, chứng minh khả năng xử lý các tài liệu nhiều trang với bố cục phức tạp, hình ảnh và thông tin có cấu trúc.

Claude có thể làm gì với PDF

Claude có thể xử lý nhiều tác vụ xử lý PDF khác nhau:

  • Trích xuất và tóm tắt thông tin chính
  • Trả lời các câu hỏi cụ thể về nội dung tài liệu
  • Phân tích cấu trúc và định dạng tài liệu
  • Xử lý hiệu quả các tài liệu nhiều trang
  • Làm việc với PDF có cả văn bản và hình ảnh

Khả năng xử lý PDF trở nên mạnh mẽ hơn khi kết hợp với các tính năng khác như trích dẫn, cho phép Claude tham chiếu các phần cụ thể của tài liệu trong phản hồi của nó. Điều này làm cho nó đặc biệt hữu ích cho nghiên cứu, phân tích tài liệu và quy trình làm việc trích xuất nội dung.

Tải xuống

🔁 Bài học liên quan

📚 Nguồn & ghi nhận

Bài học có hữu ích không?

Góp ý / Báo lỗiPhát hiện sai sót hoặc có ý tưởng cải thiện?