Power Query là một công cụ tuyệt vời trong Excel, giúp việc xử lý dữ liệu trở nên dễ dàng hơn. Bài viết này sẽ hướng dẫn cách sử dụng Power Query để tạo truy vấn nhập dữ liệu từ trang web một cách đơn giản nhất.
Để thực hiện công việc này, bạn cần điều hướng qua các bảng trên trang web và thực hiện các bước biến đổi để chỉ hiển thị dữ liệu cần thiết. Power Query sẽ ghi lại tất cả các bước này, giúp bạn lặp lại chúng khi cần.
Bước 1: Kết nối đến trang Wikipedia
Trong Excel 2016, nhấp vào tab Data, sau đó chọn New Query > From Other Sources > From Web. Nếu không thấy nút New Query, nhấp vào Data > From Web.
Trong Excel 2010-2013, nhấp vào tab Power Query, sau đó chọn From Web. Nếu không thấy tab Power Query, đảm bảo bạn đã tải và cài đặt add-in Power Query.
1. Trong hộp thoại From Web, dán URL Wikipedia (http://en.wikipedia.org/wiki/UEFA_European_Football_Championship) vào ô địa chỉ.
2. Nhấp vào OK.
Sau khi kết nối thành công với trang web, bạn sẽ thấy một danh sách các bảng biểu có sẵn trên trang Wikipedia trong ô Navigator. Bạn có thể nhấp vào từng bảng để xem trước nhanh, hiển thị ở bên phải dưới dạng bảng.
3. Nhấp đúp vào bảng Results[edit], Query Editor sẽ mở ra với dữ liệu giải đấu.
Bước 2: Định dạng dữ liệu
Bây giờ bạn đã mở bảng trong Query Editor. Bạn có thể lọc và định dạng dữ liệu theo nhu cầu của mình. Trong bước này, bạn sẽ định hình lại cấu trúc dữ liệu bằng cách xóa tất cả các cột ngoại trừ Year và Final Winers.
1. Trong ô lưới Query Preview, sử dụng Ctrl+Click để chọn cột Year và Final Winners.
2. Nhấp vào Remove Columns > Remove Other Columns.
Bước 3: Dọn dẹp dữ liệu
Bạn sẽ thực hiện nhiệm vụ này bằng cách thay thế các giá trị và lọc dữ liệu.
1. Lựa chọn cột Year.
2. Trong Query Editor, nhấp vào Replace Values.
3. Trong hộp thoại Replace Values, nhập “Details” vào ô Value to Find và để trống ô Replace With.
4. Nhấp vào OK.
Bước 4: Lọc các giá trị trong cột
Bây giờ bạn sẽ lọc cột Year để chỉ hiển thị các hàng không chứa năm.
1. Nhấp vào mũi tên xuống của bộ lọc trên cột Year.
2. Trong Filter, bỏ chọn Year.
3. Nhấp vào OK.
Bước 5: Đặt tên truy vấn
Giờ đã đến lúc đặt tên cho truy vấn đang tạo. Trong bảng Query Settings, nhập Euro Cup Winners vào ô Name. Nếu click vào liên kết All Properties, bạn cũng có thể nhập mô tả cho truy vấn vào ô Description.
Cuối cùng, bạn có thể tải truy vấn Euro Cup Winners vào trang tính.
Ở góc trên bên trái, nhấp vào Close & Load. Power Query sẽ đưa kết quả truy vấn vào bảng tính. Nếu bạn muốn cập nhật dữ liệu sau này, nhấp chuột phải vào bất kỳ nơi nào trong dữ liệu, sau đó nhấn Refresh. Mọi thông tin mới từ trang web sẽ được cập nhật tự động.
Bước 7: Khám phá nội dung phía sau
Nhấp vào bất kỳ nơi nào trong dữ liệu và trên tab Query, nhấp vào Edit.
Ở bên phải, chú ý đến danh sách Applied Steps. Sau khi thực hiện các tác vụ truy vấn, các bước xử lý dữ liệu đã được tạo. Mỗi bước có một công thức riêng, viết bằng ngôn ngữ “M”.
Dưới đây là bảng giải thích từng bước chi tiết:
Bước truy vấn | Tác vụ | Công thức |
Source | Kết nối tới nguồn dữ liệu web | = Web.Page(Web.Contents("http://en.wikipedia.org/wiki/UEFA_European_Football_Championship")) |
Navigation | Chọn bảng để kết nối | = Source{2}[Dữ liệu] |
Changed Type | Thay đổi kiểu - Power Query tự đọng thực thi nhiệm vụ này | = Table.TransformColumnTypes(Data2,{{"Year",gõ text}, {"Host", gõ text}, {"", gõ text}, {"Final Winner", gõ text}, {"Final Score", gõ text}, {t"Final Runner-up", gõ text}, {"2", gõ text}, {"Third place match Third place", gõ text}, {"Third place match Score", gõ text}, {"Third place match Fourth place", gõ text}, {"3", gõ text}, {"Number of teams", gõ text}}) |
RemovedOtherColumns | Xóa cột để chỉ hiển thị cột mong muốn | Table.SelectColumns = Table.SelectColumns(#"Changed Type",{"Final Winner", "Year"}) |
ReplacedValue | Thay thế giá trị trong cột lựa chọn | Table.ReplaceValue = Table.ReplaceValue(#"Removed Other Columns","Details","",Replacer.ReplaceText,{"Year"}) |
FilteredRows | Lọc các giá trị trong cột | Table.SelectRows = Table.SelectRows(#"Replaced Value", each ([Year] <> "Year")) |
Ghi chú: Bạn có thể xem toàn bộ mã M trong tùy chọn Advanced Editor ở thanh công cụ Power Query.
Hi vọng bạn thấy bài viết hữu ích!