
Dữ liệu trùng lặp là một trong những nguyên nhân gây sai sót khi phân tích và xử lý thông tin trên Excel. Do đó, việc lọc trùng trong Excel là cần thiết để đảm bảo tính chính xác và sự gọn gàng của bảng tính. Bài viết dưới đây sẽ chia sẻ những phương pháp lọc trùng đơn giản, dễ thực hiện cho cả người mới và người dùng nâng cao.
Lọc trùng trong Excel là gì? Khi nào cần thực hiện thao tác này?
Lọc trùng trong Microsoft Excel là quá trình phát hiện và loại bỏ những giá trị bị lặp lại trong bảng tính. Tính năng này giúp bạn giữ lại một bản sao duy nhất cho mỗi giá trị, từ đó làm sạch dữ liệu và tránh các sai lệch trong thống kê do sự trùng lặp thông tin.
Lọc trùng là cần thiết khi:
- Dữ liệu được nhập từ nhiều nguồn khác nhau có thể chứa các bản sao trùng lặp.
- Cần tổng hợp các danh sách như khách hàng, sản phẩm, mã đơn hàng… mà không bị trùng lặp giá trị.
- Chuẩn bị dữ liệu phục vụ phân tích, báo cáo hoặc vẽ biểu đồ – yêu cầu dữ liệu phải chính xác và không trùng lặp.

Top 5+ cách lọc trùng Excel hiệu quả và đơn giản nhất
Dưới đây là những phương pháp lọc trùng trong Excel đơn giản và hiệu quả nhất giúp bạn làm sạch dữ liệu nhanh chóng chỉ với vài bước thao tác:
Hướng dẫn xóa dữ liệu trùng lặp trong Excel bằng tính năng Remove Duplicates
Tính năng Remove Duplicates trong Microsoft Excel giúp bạn nhanh chóng loại bỏ các giá trị trùng lặp trong bảng tính chỉ với một vài thao tác đơn giản. Dưới đây là các bước thực hiện:
- Bước 1: Chọn toàn bộ vùng dữ liệu cần kiểm tra và loại bỏ trùng lặp trong bảng tính.

- Bước 2: Vào tab Data trên thanh công cụ, sau đó nhấn vào Remove Duplicates trong nhóm Data Tools để tiến hành loại bỏ trùng lặp.

- Bước 3: Khi hộp thoại Remove Duplicates xuất hiện, chọn các cột cần kiểm tra trùng lặp; nếu muốn lọc tất cả các cột, chọn Select All, rồi nhấn OK.

- Bước 4: Excel sẽ tự động xử lý và thông báo kết quả, cho biết số lượng dòng trùng lặp đã được loại bỏ và số dòng duy nhất còn lại.

Lưu ý: Trước khi thực hiện việc lọc trùng, hãy sao lưu tệp gốc để đảm bảo dữ liệu quan trọng không bị mất trong quá trình xóa giá trị trùng lặp.
Cách đánh dấu dữ liệu trùng lặp trong Excel với Conditional Formatting
Tính năng Conditional Formatting trong Microsoft Excel giúp bạn dễ dàng tô màu và làm nổi bật các giá trị trùng lặp, từ đó dễ dàng theo dõi và lọc lại dữ liệu. Các bước thực hiện như sau:
- Bước 1: Chọn toàn bộ vùng dữ liệu cần kiểm tra để xác định các giá trị trùng lặp.

- Bước 2: Trên thanh menu, chọn Home → Conditional Formatting → Highlight Cells Rules → Duplicate Values để bắt đầu định dạng các giá trị trùng lặp.

- Bước 3: Khi hộp thoại Duplicate Values hiện lên, bạn sẽ thấy các lựa chọn sau:
- Duplicate: Đánh dấu các giá trị xuất hiện nhiều lần trong vùng chọn.
- Unique: Đánh dấu các giá trị xuất hiện duy nhất.

- Bước 4: Trong hộp thoại, chọn kiểu định dạng để làm nổi bật các giá trị trùng lặp, ví dụ:
- Light red fill with dark red text: Nền đỏ nhạt, chữ đỏ đậm.
- Yellow fill with dark yellow text: Nền vàng, chữ vàng đậm.
- Green fill with dark green text: Nền xanh, chữ xanh đậm.
- Red text / Red border: Chỉ thay đổi màu chữ hoặc tạo viền đỏ quanh ô.
- Custom format: Tùy chỉnh màu nền và màu chữ theo ý muốn.

Bước 5: Nhấn OK, các ô chứa dữ liệu trùng lặp sẽ được tô màu ngay lập tức, giúp bạn dễ dàng nhận diện và xử lý hoặc loại bỏ chúng.

Mẹo: Sau khi đánh dấu các giá trị trùng lặp, bạn có thể sử dụng bộ lọc (Filter) để lọc nhanh chóng và loại bỏ chúng nếu cần.
Hướng dẫn lọc trùng trong Excel bằng Advanced Filter
Tính năng Advanced Filter trong Excel giúp bạn tạo ra danh sách chỉ bao gồm các giá trị duy nhất, đồng thời loại bỏ mọi bản ghi trùng lặp. Làm theo các bước dưới đây để thực hiện:
- Bước 1: Chọn vùng ô hoặc cột dữ liệu cần lọc để loại bỏ các giá trị trùng lặp.

- Bước 2: Trên thanh công cụ, chọn tab Data, rồi nhấn vào Advanced trong nhóm Sort & Filter.

- Bước 3: Khi hộp thoại Advanced Filter xuất hiện, chọn tùy chọn Copy to another location để tạo một danh sách mới không chứa giá trị trùng lặp.
- Tại mục Copy to, chọn một ô trống bên cạnh bảng dữ liệu hiện tại để lưu kết quả lọc.
- Đánh dấu chọn vào Unique records only để chỉ lấy các giá trị duy nhất.
- Nhấn OK để thực hiện lọc.

- Bước 4: Ngay sau khi thực hiện, danh sách lọc đã được loại bỏ các giá trị trùng sẽ xuất hiện tại ô bạn đã chọn ở mục Copy to.

Lưu ý: Advanced Filter không xóa các dòng trùng trong vùng dữ liệu gốc mà chỉ tạo ra danh sách mới chỉ chứa các giá trị duy nhất, giúp bảo vệ dữ liệu ban đầu.
Lọc trùng trong Excel với Pivot Table
Sử dụng Pivot Table là một cách nhanh chóng để tạo danh sách chỉ chứa các giá trị duy nhất trong Excel mà không làm thay đổi dữ liệu gốc. Dưới đây là các bước thực hiện:
- Bước 1: Chọn một ô bất kỳ trong bảng dữ liệu hiện có (hoặc bôi đen toàn bộ). Vào tab Insert trên thanh công cụ, chọn PivotTable và nhấn OK để tạo bảng Pivot mới.

- Bước 2: Khi bảng Pivot Table trống hiện ra, kéo cột chứa tên hoặc giá trị cần lọc vào khu vực Rows để hiển thị toàn bộ danh sách các giá trị.

- Bước 3: Chuyển sang tab Design, vào Report Layout và chọn Show in Tabular Form, sau đó tích chọn Repeat All Item Labels để hiển thị dữ liệu dưới dạng bảng rõ ràng.

- Bước 4: Trong tab Design, chọn Subtotals và chọn Do Not Show Subtotals để ẩn các dòng tổng phụ, giúp bảng dữ liệu trở nên gọn gàng hơn.

- Bước 5: Sau khi hoàn tất các thao tác, bảng Pivot Table sẽ hiển thị danh sách các tên duy nhất, đây chính là dữ liệu đã được lọc bỏ các giá trị trùng lặp.

Mẹo: Bạn có thể sao chép danh sách các tên duy nhất này ra một vị trí khác để sử dụng mà không làm ảnh hưởng tới bảng dữ liệu gốc.
Lọc trùng trong Excel bằng Power Query
Power Query là công cụ mạnh mẽ hỗ trợ xử lý và chuyển đổi dữ liệu, đặc biệt hữu ích trong việc phát hiện và loại bỏ các giá trị trùng lặp. Dưới đây là các bước thực hiện:
- Bước 1: Chọn toàn bộ vùng dữ liệu cần kiểm tra trùng. Trên thanh công cụ, vào tab Data và nhấn From Table/Range để mở dữ liệu trong Power Query.

- Bước 2: Trong cửa sổ Power Query, chuyển đến tab Home và chọn Remove Duplicates để tự động loại bỏ các giá trị trùng trong cột đã chọn.

- Bước 3: Sau khi hoàn tất, bảng dữ liệu sẽ hiển thị danh sách đã được loại bỏ hoàn toàn các dòng trùng lặp.

- Bước 4: Để đưa dữ liệu đã làm sạch trở lại Excel, vào File → chọn Close & Load → nhấn Close & Load một lần nữa để hoàn tất quá trình xuất dữ liệu.

- Bước 5: Bảng dữ liệu đã loại bỏ giá trị trùng sẽ được tải về một trang tính mới trong Excel, sẵn sàng cho bạn tiếp tục làm việc.

Lưu ý: Power Query không thay đổi dữ liệu gốc, vì vậy bạn hoàn toàn có thể yên tâm khi sử dụng phương pháp này để kiểm tra và loại bỏ dữ liệu trùng lặp.
Cách lọc trùng trong Excel để so sánh dữ liệu trùng giữa nhiều sheet
Khi cần so sánh dữ liệu giữa hai sheet khác nhau, các phương pháp thông thường như Remove Duplicates hoặc Conditional Formatting không thể áp dụng. Trong trường hợp này, bạn có thể sử dụng công thức để tìm ra các giá trị trùng lặp.
Ví dụ tình huống:
- Sheet1: Chứa danh sách sản phẩm hiện tại, với mã sản phẩm nằm ở cột A.
- Sheet2: Chứa danh sách sản phẩm mới, bạn muốn kiểm tra xem mã sản phẩm ở cột A của Sheet2 có trùng với Sheet1 hay không.

Mục tiêu: Đánh dấu các mã sản phẩm trên Sheet2 có xuất hiện trong Sheet1.
Các bước thực hiện như sau:
- Bước 1: Trên Sheet2, thêm một cột mới và đặt tên là Trạng Thái. Đây là nơi bạn sẽ hiển thị kết quả là “Trùng Lặp” hoặc “Không Trùng” cho từng mã sản phẩm.

- Bước 2: Tại ô đầu tiên của cột Trạng Thái (ví dụ ô C2), nhập công thức: =IF(ISNUMBER(MATCH(A2,Sheet1!A:A,0)),”Trùng Lặp”,”Không Trùng”). Giải thích công thức:
- A2: Là ô chứa mã sản phẩm cần kiểm tra trên Sheet2.
- Sheet1!A:A: Là toàn bộ cột mã sản phẩm trên Sheet1 để so sánh.
- MATCH(A2,Sheet1!A:A,0): Tìm vị trí của giá trị trong A2 có tồn tại trong Sheet1 hay không.
- ISNUMBER(…): Trả về TRUE nếu tìm thấy giá trị, ngược lại là FALSE.
- IF(…): Nếu tìm thấy sẽ hiển thị “Trùng Lặp”, nếu không thì “Không Trùng”.

- Bước 3: Áp dụng cho toàn bộ cột: Kéo công thức vừa nhập xuống tất cả các dòng trong cột Trạng Thái để kiểm tra toàn bộ danh sách mã sản phẩm trên Sheet2.

Kết quả nhận được:
- Những mã sản phẩm có xuất hiện trên Sheet1 sẽ được đánh dấu là “Trùng Lặp”.
- Những mã không có trên Sheet1 sẽ hiển thị là “Không Trùng”.

Câu hỏi thường gặp khi thực hiện cách lọc trùng trong Excel
Có thể lọc dữ liệu trùng ở nhiều cột cùng lúc trong Microsoft Excel không?
Có. Excel hỗ trợ kiểm tra trùng lặp trên nhiều cột bằng Remove Duplicates. Khi bạn chọn nhiều cột rồi áp dụng tính năng này, Excel sẽ đối chiếu toàn bộ giá trị theo từng hàng. Chỉ những hàng có toàn bộ giá trị ở các cột được chọn giống nhau mới bị xem là trùng và bị loại bỏ, các hàng khác sẽ được giữ nguyên.
Nếu muốn xác định dữ liệu trùng mà không xóa dòng, bạn có thể:
- Dùng Advanced Filter để lọc ra danh sách giá trị duy nhất, vẫn giữ nguyên bảng gốc.
- Hoặc dùng Power Query để nhóm và xử lý dữ liệu phức tạp, phù hợp khi cần so sánh nhiều cột trong bảng lớn.
Nhờ vậy, bạn có thể kiểm tra dữ liệu trùng trên nhiều cột một cách an toàn và linh hoạt.

Cách lọc trùng trong Excel có làm bảng mất định dạng ban đầu không?
Việc lọc dữ liệu trùng trong Excel bằng công cụ Remove Duplicates sẽ không làm mất hoàn toàn định dạng của bảng, nhưng có thể ảnh hưởng một phần đến bố cục. Các yếu tố như kiểu chữ, màu nền, viền ô vẫn được giữ nguyên ở những hàng còn lại. Tuy nhiên, vì các hàng trùng sẽ bị xóa và những hàng bên dưới được dồn lên, thứ tự và bố cục ban đầu của bảng có thể bị thay đổi.
Để tránh rủi ro này, bạn có thể:
- Sao chép bảng dữ liệu sang một sheet mới trước khi thực hiện Remove Duplicates.
- Hoặc dùng Conditional Formatting → Highlight Duplicate Values để chỉ đánh dấu các ô trùng lặp mà không xóa, giúp giữ nguyên toàn bộ bố cục và định dạng gốc của bảng.

Kỹ năng lọc trùng trong Excel sẽ giúp bạn không chỉ tiết kiệm thời gian làm sạch dữ liệu mà còn tăng độ chính xác cho các báo cáo. Hãy linh hoạt áp dụng từng phương pháp phù hợp với từng tình huống để tối ưu hóa công việc xử lý bảng tính và tránh sai sót không đáng có trong quá trình làm việc.
Tham khảo bài viết liên quan:
