📖 Nội dung bài học
Tóm tắt
Claude có thể đọc và phân tích tài liệu PDF dễ dàng như xử lý hình ảnh. Khả năng này mở ra những khả năng mạnh mẽ cho việc phân tích tài liệu, tóm tắt và quy trình làm việc hỏi đáp.
Thiết lập Xử lý PDF
Để làm việc với PDF, bạn cần thực hiện một vài thay đổi chính cho cấu trúc tin nhắn tiêu chuẩn. Quy trình này tương tự như xử lý hình ảnh, nhưng có một số khác biệt quan trọng trong thông số kỹ thuật tài liệu.
Đầu tiên, đọc tệp PDF của bạn dưới dạng dữ liệu nhị phân:
with open("./earth.pdf", "rb") as f:
file_bytes = f.read()
Cấu trúc Tin nhắn Tài liệu
Cấu trúc tin nhắn cho PDF khác với hình ảnh theo một số cách. Thay vì đối tượng "image", bạn sẽ dùng đối tượng "document" với các trường bắt buộc sau:
add_user_message(
messages,
[
{"document": {"format": "pdf", "name": "earth", "source": {"bytes": file_bytes}}},
{"text": "Summarize this document in one sentence"},
],
)
Các điểm chính về cấu trúc tài liệu:
- Dùng
"document"thay vì"image" - Đặt
"format": "pdf" - Bao gồm trường
"name"với tên tệp không có phần mở rộng "source"chứa byte của tệp
Khi bạn chạy đoạn code này, Claude phân tích toàn bộ nội dung PDF và cung cấp phản hồi toàn diện. Trong trường hợp này, nó đã tóm tắt thành công bài viết Wikipedia về Trái đất, chứng minh khả năng xử lý các tài liệu nhiều trang với bố cục phức tạp, hình ảnh và thông tin có cấu trúc.
Claude có thể làm gì với PDF
Claude có thể xử lý nhiều tác vụ xử lý PDF khác nhau:
- Trích xuất và tóm tắt thông tin chính
- Trả lời các câu hỏi cụ thể về nội dung tài liệu
- Phân tích cấu trúc và định dạng tài liệu
- Xử lý hiệu quả các tài liệu nhiều trang
- Làm việc với PDF có cả văn bản và hình ảnh
Khả năng xử lý PDF trở nên mạnh mẽ hơn khi kết hợp với các tính năng khác như trích dẫn, cho phép Claude tham chiếu các phần cụ thể của tài liệu trong phản hồi của nó. Điều này làm cho nó đặc biệt hữu ích cho nghiên cứu, phân tích tài liệu và quy trình làm việc trích xuất nội dung.
Tải xuống
🔁 Bài học liên quan
- Bài tiếp: Citations
- Bài trước: Image support
- Cùng section: Overview of Claude Models · Accessing the API · Making a request
- Thuộc lộ trình: Path C
- Docs tham khảo: Glossary · Skills atlas · By use-case
📚 Nguồn & ghi nhận
- Bài học gốc Anthropic Academy: https://anthropic.skilljar.com/claude-in-amazon-bedrock/308839
- © 2025 Anthropic. Chỉ dùng cho mục đích giáo dục, fair-use.
- Crawl: — · Chuẩn hoá: 2026-05-01