Trong tập tin Excel chứa hàng nghìn bản ghi, sự trùng lặp dữ liệu là vấn đề thường gặp. Nếu phải thao tác thủ công, bạn sẽ mất rất nhiều thời gian và công sức. Dưới đây là hướng dẫn cách lọc và xử lý dữ liệu trùng nhanh chóng bằng công cụ tích hợp trong Excel.
Ví dụ, hãy xem xét bảng dữ liệu dưới đây, những bản ghi đỏ là trùng lặp. Nhiệm vụ của bạn là tìm và giữ lại bản ghi gốc, loại bỏ những bản ghi thừa.
Bước 1: Chọn toàn bộ dữ liệu cần lọc. Vào Data -> Remove Duplicate.
Bước 2: Trong hộp thoại Remove Duplicate, bạn có thể lựa chọn như sau:
- Để lọc theo tất cả các trường, hãy kích chọn Select All -> nhấn OK.
- Để lọc từng trường một, hãy kích chọn Unselect All -> tích vào các trường muốn lọc -> OK.
Bước 3: Hộp thoại Microsoft Excel xuất hiện -> nhấn OK. (Hộp thoại thông báo về số lượng bản ghi trùng, số bản ghi đã xóa, và tổng số giá trị đã được điều chỉnh sau khi xóa).
Kết quả sau khi lọc dữ liệu trong bảng:
Chúc mừng bạn đã thành công!