Każdy pracownik SEO, czy po prostu osoba chcąca podnieść pozycję swojej strony w wynikach wyszukiwania potrzebowała kiedyś pobrać konkretne informacje ze strony. Szczególnie często są to dane takie jak tytuł SEO, opis meta czy nagłówek H1. Dotychczas wiązało się to z korzystaniem ze stworzonych do tego specjalistycznych narzędzi lub po prostu grzebaniem w kodzie strony za pomocą narzędzia programistycznego dostępnego w ramach przeglądarki. Okazuje się jednak, że arkusze Google są świetnym rozwiązaniem dla osób, które chciałyby zautomatyzować ten proces, a nie mają czasu na naukę języka programowania.
Czym jest IMPORTXML?
IMPORTXML to dostępna w ramach arkusza Google funkcja, którą możemy zastosować w celu pobrania poszczególnych danych z interesujących nas stron internetowych. Strona wsparcia Google opisuje funkcje jako dającą możliwość zaimportowania różnych typów danych strukturalnych, takich jak:
- XML
- HTML
- CSV
- TSV
- RSS
- ATOM XML
Podsumowując, wykorzystanie funkcji IMPORTXML pozwoli Ci na pobranie dowolnych ustrukturyzowanych danych z wybranych stron internetowych, bez znajomości języków programowania!
Jak wykorzystać funkcję do pobrania elementów?
Samo użycie funkcji jest bardzo proste, polega podaniu jedynie dwóch wartości. Wartość pierwsza to dokładny link do strony, z której chcemy pobrać dane. Natomiast drugi element funkcji to zapytanie, które wyznaczenia jaki typ danych ma zostać pobranych. Najlepiej będzie to widać na poniższym przykładzie:
=IMPORTXML(“https://en.wikipedia.org/wiki/Moon_landing”, “//title”)
Funkcja rozróżnia wiele typów danych, które możemy pobrać, jednak najpopularniejszymi z nich są:
Tytuł SEO – W tym celu wpisujemy: //title
Opis meta danej podstony – //meta[@name=’description’]/@content
Nagłówki H1 występujące na stronie – pobieramy za pomocą zapytania : //h1
Linki na stronie – mogą zostać pobrane, przy użyciu: //@href
Odpowiednie wykorzystanie funkcji IMPORTXML w narzędziu, jakim są arkusze Google, może odjąć bardzo dużo pracy oraz pomóc zautomatyzować wiele zadań. Warto pamiętać, że dane pobierane są w czasie rzeczywistym, dzięki czemu wraz ze zmianą któregoś z elementów na stronie, nasz arkusz odnotuje tę zmianę oraz wyświetli aktualne dane. Sama funkcja jest dużo bardziej rozbudowana, natomiast dziś przytoczyliśmy jedynie jej najpopularniejsze funkcje.
Warto jednak mieć na uwadze, że odpowiednio przygotowany arkusz, w którym dana funkcja została połączona z innymi formułami oraz dodatkami może pozwolić na stworzenie narzędzia, które w innym wypadku wymagałoby od nas znajomości języków programowania takich jak przykładowo Python.