Có nhiều phương pháp để chuyển đổi PDF thành Excel, nhưng trích xuất chỉ một phần dữ liệu là thách thức. Tuy nhiên, vẫn có cách giải quyết như sao chép và dán thủ công, sử dụng công cụ trực tuyến miễn phí như Docparser, hoặc sử dụng Adobe Acrobat Pro DC. Dưới đây là cách thực hiện.
Các Bước Trích Xuất
Sử dụng phương pháp sao chép và dán
1. Mở tập tin PDF trong chương trình đọc PDF. Nhấp đúp vào tập tin để mở nó trong trình xem PDF như Preview trên macOS hoặc Edge trên Windows.
Lựa chọn dữ liệu cần trích xuất từ PDF. Bạn có thể kéo chọn từ góc trên bên trái đến góc dưới bên phải để chọn dữ liệu. Khi đã chọn xong, phần dữ liệu sẽ được làm nổi bật.
Sao chép dữ liệu vào bộ nhớ tạm. Nhấp chuột phải vào phần được chọn và chọn Sao chép. Hoặc bạn có thể sử dụng lệnh Command + C trên Mac hoặc Control + C trên Windows.
Mở tài liệu Excel và chọn ô. Tương tự như cách bạn chọn dữ liệu từ PDF, kéo chuột từ ô góc trái đến ô góc phải để nhanh chóng chọn nhiều ô. Đảm bảo bạn đã chọn đủ ô cho dữ liệu cần trích xuất.
Dán dữ liệu vào tài liệu Excel. Nhấp chuột phải vào ô đã chọn và chọn Dán. Mặc dù bạn sẽ cần định dạng lại dữ liệu, nhưng bây giờ tập tin Excel của bạn đã có dữ liệu từ PDF!
Sử dụng Docparser
Đăng ký tài khoản tại https://app.docparser.com/account/signup. Docparser cung cấp nhiều gói dịch vụ với các mức phí khác nhau. Bạn có thể sử dụng gói miễn phí để trích xuất 30 tài liệu mỗi tháng.
Nhấp vào Tạo Phần Trích Xuất (Tạo Document Parser). Nút này có màu xanh dương và nằm ở giữa màn hình.
Nhập tên và chọn mẫu. Nếu văn bản bạn muốn trích xuất không phù hợp với mẫu có sẵn, hãy chọn Tùy chỉnh. Mẫu tùy chỉnh cần bạn thiết lập nguyên tắc riêng.
Tải lên PDF và nhấp vào Tiếp tục (Tiếp tục). Bạn có thể kéo và thả hoặc tải lên tập tin PDF từ máy tính. Sau khi tải lên, nhấp vào nút xanh lá phía trên góc phải.
Xem hoặc bỏ qua video hướng dẫn về nguyên tắc trích xuất. Video này giúp bạn hiểu rõ về cách đọc và chuyển đổi tập tin PDF. Nếu không muốn xem, bạn có thể nhấp vào nút “X” ở góc phải.
Thực hiện theo hướng dẫn trên màn hình. Đầu tiên, bạn chọn Text Variable Position, đặt tên cho quy định. Chương trình sẽ hiển thị thông tin chi tiết về dữ liệu, vị trí bộ lọc và cách xem trước dữ liệu đã lọc.
Thêm bộ lọc và điều chỉnh từng bộ lọc. Sử dụng các ô “Filtered Result” ở dưới để điều chỉnh bộ lọc. Mỗi ô có khung lựa chọn để cấu hình và xem trước dữ liệu.
Nhấp vào Lưu Nguyên Tắc Trích Xuất. Nút này ở góc dưới bên phải và có biểu tượng dấu chọn màu trắng.
Tạo nguyên tắc trích xuất mới hoặc thoát công cụ chỉnh sửa. Khi hoàn tất, nhấp vào Thoát Công Cụ Chỉnh Sửa Trích Xuất màu xám. Hoặc nhấp vào Tạo Nguyên Tắc Trích Xuất Khác màu xanh dương để tạo thêm nguyên tắc trích xuất.
Nhấp vào ô chọn bên cạnh tên văn bản. Dấu chọn màu đen sẽ hiển thị.
Chọn Chuyển sang Nhóm Chờ Trích Xuất. Trong trình đơn Thực Hiện Thao Tác phía trên góc trái màn hình.
Nhấp vào Ok, chờ và làm mới trang. Nếu không thấy văn bản, có thể đang được trích xuất. Chờ và chuyển đổi giữa các thẻ trong công cụ trích xuất văn bản.
Nhấp vào tên tập tin. Nút này ở bên trái trang có mũi tên hướng xuống.
Nhấp vào Tải về Excel. Bây giờ bạn đã có tài liệu Excel với dữ liệu từ PDF đã chọn!
Sử dụng Adobe Acrobat Pro DC
Mở tập tin PDF bằng phần mềm Acrobat. Nếu Acrobat không phải là ứng dụng mặc định để đọc PDF, bạn có thể mở tập tin bằng cách nhấp chuột phải và chọn Acrobat từ menu Mở bằng.
- Có thể bạn cần phải tìm kiếm Acrobat trong danh sách Mở bằng ứng dụng khác trên Windows hoặc trên Mac, nhấp vào Other….
Chọn phần dữ liệu mà bạn muốn trích xuất. Bạn có thể chọn dữ liệu bằng cách nhấp và kéo từ góc trên bên trái của vùng dữ liệu đến góc dưới bên phải. Bây giờ phần dữ liệu đã được đánh dấu.
Click chuột phải vào phần dữ liệu đã chọn và chọn Xuất phần đã chọn Dưới dạng… (Export Selection As…). Bạn sẽ thấy một cửa sổ mới hiển thị với các tùy chọn để trích xuất dữ liệu đã chọn từ tập tin PDF.
Chọn định dạng XLSX từ danh sách Lưu dưới dạng (Save As Type) và nhấp vào Lưu (Save). Bây giờ bạn đã có một bảng tính Excel với phần dữ liệu đã được trích xuất từ tập tin PDF!