Trong Google Sheets, bạn cần thu thập dữ liệu từ nhiều trang web khác nhau để cập nhật dữ liệu liên tục theo thời gian thực. Hãy sử dụng hàm IMPORTXML để thực hiện điều này. Hướng dẫn sau đây sẽ giúp bạn nhanh chóng lấy dữ liệu mà bạn cần. Cùng khám phá cách sử dụng hàm IMPORTXML nhé!
Video hướng dẫn cách sử dụng hàm IMPORTXML trong Google Sheets một cách đơn giản:
1. Hàm IMPORTXML là gì? Ứng dụng của hàm IMPORTXML trong Google Sheets
Khái niệm về hàm IMPORTXML
Hàm IMPORTXML được sử dụng để trích xuất dữ liệu từ các nguồn có cấu trúc như XML, CSV, HTML, TSV và các nguồn cung cấp dữ liệu RSS và ATOM XML.
Công thức của hàm IMPORTXML
- Phương pháp:
- Trong đó:
Một ví dụ về hàm IMPORTXML
Ví dụ về việc trích xuất giá bán hiện tại của đồng hồ đôi EIio từ trang web Mytour. Kết quả là 1.980.000đ (cập nhật vào ngày 24/08/2021).
- Phương pháp:
Ví dụ về hàm IMPORTXML
Ứng dụng của hàm IMPORTXML
Hàm IMPORTXML được dùng để cập nhật thông tin từ một trang web theo thời gian thực, giúp bạn theo dõi sự thay đổi của nội dung trên trang đó.
2. Hướng dẫn sử dụng hàm IMPORTXML trong Google Sheet
Yêu cầu bài toán: Trích xuất giá bán sản phẩm theo thời gian thực từ trang web Mytour.
Bước 1: Sao chép đường dẫn URL của sản phẩm (Trong ví dụ này, sản phẩm được lấy là máy tính bảng Samsung Galaxy Tab S7 FE).
Sao chép đường dẫn URL của sản phẩm
Bước 2: Dán đường dẫn URL vào một ô tính bất kỳ (Ví dụ: Ô A1).
Dán đường dẫn URL vào ô tính bất kỳ
Bước 3: Click chuột phải vào phần cần lấy dữ liệu (Giá sản phẩm) > Chọn Inspect.
Click chuột phải vào phần cần lấy dữ liệu và chọn Inspect
Bước 4: Xác định dòng chứa giá sản phẩm bằng cách click chuột phải > Chọn Copy > Chọn Copy XPath.
Sao chép XPath
Bước 5: Quay lại bảng tính và nhập công thức:
Sau khi thực hiện, bạn sẽ nhận được giá bán của máy tính bảng Samsung Galaxy Tab S7 FE là 11.990.000đ. (Giá bán được cập nhật ngày 24/08/2021).
Quay lại bảng tính và nhập công thức
Video hướng dẫn cách kết hợp hàm IMPORTXML với các hàm TRANSPOSE, INDEX, MATCH, và VLOOKUP:
3. Kết hợp hàm IMPORTXML với các hàm khác trong Google Sheet
Kết hợp với hàm TRANSPOSE
- Yêu cầu: Lấy thông tin bảng thông số kỹ thuật của Apple Watch S3 và chuyển đổi thông tin từ hàng sang cột.
- Công thức:
- Giải thích: Ô B1 chứa đường dẫn URL của Apple Watch S3. Ô B2 chứa truy vấn XPath cho bảng thông số kỹ thuật của Apple Watch S3. Hàm TRANSPOSE sẽ chuyển đổi thông tin từ hàng sang cột.
Kết hợp với hàm TRANSPOSE
Hướng dẫn cách tìm XPath cho bảng cấu hình
Kết hợp với các hàm INDEX, MATCH
Dùng bảng thông tin đường dẫn URL của các sản phẩm trong trang tính LINK_SP.
Bảng dữ liệu URL sản phẩm
- Yêu cầu: Lấy thông tin giá bán, giá cũ và giảm giá của điện thoại trên trang Mytour sử dụng các hàm IMPORTXML, INDEX và MATCH. (Giá sản phẩm được cập nhật ngày 24/08/2021).
- Công thức:
- Giải thích:
+ Tham chiếu đến bảng thông tin sản phẩm LINK_SP!A2:B11.
+ Xác định vị trí tên sản phẩm của ô A2 trong cột TÊN SP LINK_SP!A2:A11.
+ Số cột trong mảng chứa giá trị trả về.
+ XPath của thông tin cần lấy: /html/body/section/div[3]/div[2]/div[2]/div[2]/div.
Kết hợp với hàm INDEX, MATCH
Kết hợp với hàm VLOOKUP
- Yêu cầu: Sử dụng hàm IMPORTXML và VLOOKUP để lấy giá bán, giá cũ và giảm giá của sản phẩm điện thoại trên trang Mytour. (Giá sản phẩm được cập nhật ngày 24/08/2021).
- Công thức:
- Giải thích:
+ Giá trị dò tìm là tên sản phẩm từ ô A2.
+ Bảng chứa giá trị dò tìm là LINK_SP!A2:B11.
+ Vị trí cột chứa giá trị link URL là 2.
+ Dò tìm tương đối.
+ XPath của thông tin cần lấy là /html/body/section/div[3]/div[2]/div[2]/div[2]/div.
Kết hợp với hàm VLOOKUP
4. Lưu ý khi sử dụng hàm IMPORTXML trong Google Sheet
- URL và XPath cần được đặt trong dấu ngoặc kép khi nhập trực tiếp.
- Hàm IMPORTXML không phân biệt chữ hoa chữ thường. Ví dụ: IMPORTXML= importxml.
- Nhập các tham số hàm cần chính xác để tránh lỗi không mong muốn.
5. Các lỗi thường gặp khi sử dụng hàm IMPORTXML
Lỗi #N/A
- Nguyên nhân lỗi: Lỗi #N/A xảy ra khi nhập sai đường dẫn URL hoặc XPath. Bạn cần nhập chính xác và không thiếu đối số.
- Cách khắc phục: Sao chép thay vì nhập tay đường dẫn URL hoặc XPath để đảm bảo tính chính xác. Hàm IMPORTXML cần từ 2 đến 3 đối số.
Lỗi #N/A
Lỗi #VALUE
- Nguyên nhân lỗi: Lỗi #VALUE xảy ra khi đối số 1 không phải là URL hợp lệ.
- Cách khắc phục: Kiểm tra xem đường dẫn URL có đúng giao thức không (phải có https://).
Lỗi #VALUE
Lỗi #NAME
- Nguyên nhân lỗi: Lỗi #NAME? xảy ra khi nhập sai tên hàm.
- Cách khắc phục: Kiểm tra lại tên hàm đã nhập có đúng là IMPORTXML không.
Lỗi #NAME
Lỗi #REF
- Nguyên nhân lỗi: Lỗi #REF thường xảy ra khi sao chép cột hoặc hàng gần vị trí cột A hoặc hàng 1, làm dải ô di chuyển ra khỏi bảng tính hoặc lỗi quay vòng.
- Cách khắc phục: Hạn chế sao chép gần vị trí cột A hoặc hàng 1, hoặc cố định dải ô trước khi sao chép. Đảm bảo không gian trống trong ô tính khi lấy dữ liệu trả về nhiều dải ô.
Lỗi #REF
6. Bài tập thực hành với hàm IMPORTXML
Cho bảng thông tin chứa đường dẫn URL của các sản phẩm trong trang tính LINK_SP.
Bảng dữ liệu URL sản phẩm laptop
Bài tập 1: Lấy thông tin bảng thông số kỹ thuật của Laptop HP 15s fq2559TU và chuyển đổi thông tin từ hàng sang cột.
- Công thức:
- Giải thích: Sử dụng hàm IMPORTXML để trích xuất thông tin từ trang web. Sau đó, sử dụng hàm TRANSPOSE để chuyển đổi thông tin từ hàng thành cột.
Bài tập 2: Trích xuất giá bán, giá cũ và giảm giá của Laptop từ trang Mytour sử dụng hàm IMPORTXML, INDEX và MATCH.
- Công thức:
- Giải thích:
+ LINK_SP!A21:B30: Tham chiếu đến bảng thông tin sản phẩm tại LINK_SP!A2:B11.
+ MATCH('Laptop Lenovo IdeaPad Slim 5 15ITL05';LINK_SP!A21:A30;0): Vị trí của 'Laptop Lenovo IdeaPad Slim 5 15ITL05' trong cột TÊN SP của LINK_SP!A21:B30.
+ 2: Số cột trong mảng chứa giá trị trả về.
+ /html/body/section/div[3]/div[2]/div[3]/ul: XPath của thông tin cần lấy.
7. Các thắc mắc phổ biến khi sử dụng hàm IMPORTXML
Hàm IMPORTXML trong Google Sheet hoạt động như thế nào?
Hàm IMPORTXML trong Google Sheet giúp trích xuất dữ liệu từ tệp XML và sao chép nó vào bảng tính. Ví dụ, nếu bạn muốn lấy các liên kết từ trang web, bạn có thể sử dụng hàm IMPORTXML để trích xuất toàn bộ thông tin trong thẻ a. Nếu bạn muốn lấy toàn bộ văn bản từ một trang, bạn có thể trích xuất nó bằng cách lấy toàn bộ nội dung trong thẻ body hoặc thẻ p.
Trích xuất toàn bộ thông tin trong thẻ a
Đó là cách sử dụng hàm IMPORTXML trong Google Sheet. Hy vọng bạn tìm thấy thông tin hữu ích. Cảm ơn bạn đã theo dõi và chúc bạn thành công!