.animate-view{opacity: 1 !important;}

Jak wykorzystać arkusze Google do Web Scraping’u?

2min.

Komentarze:0

Jak wykorzystać arkusze Google do Web Scraping’u?d-tags
04 marca 2022
Czy można wykorzystać arkusze Google do pozyskiwania meta danych? Dowiedz się, jak w prosty sposób zaimportować podstawowe dane strukturalne do arkuszy bez konieczności wykorzystywania zaawansowanych narzędzi.

2min.

Komentarze:0

Każdy pracownik SEO, czy po prostu osoba chcąca podnieść pozycję swojej strony w wynikach wyszukiwania potrzebowała kiedyś pobrać konkretne informacje ze strony. Szczególnie często są to dane takie jak tytuł SEO, opis meta czy nagłówek H1. Dotychczas wiązało się to z korzystaniem ze stworzonych do tego specjalistycznych narzędzi lub po prostu grzebaniem w kodzie strony za pomocą narzędzia programistycznego dostępnego w ramach przeglądarki. Okazuje się jednak, że arkusze Google są świetnym rozwiązaniem dla osób,  które chciałyby zautomatyzować ten proces, a nie mają czasu na naukę języka programowania.

Czym jest IMPORTXML?

IMPORTXML to dostępna w ramach arkusza Google funkcja, którą możemy zastosować w celu pobrania poszczególnych danych z interesujących nas stron internetowych. Strona wsparcia Google opisuje funkcje jako dającą możliwość zaimportowania różnych typów danych strukturalnych, takich jak:
  • XML
  • HTML
  • CSV
  • TSV
  • RSS
  • ATOM XML
Podsumowując, wykorzystanie funkcji IMPORTXML pozwoli Ci na pobranie dowolnych ustrukturyzowanych danych z wybranych stron internetowych, bez znajomości języków programowania!

Jak wykorzystać funkcję do pobrania elementów?

Samo użycie funkcji jest bardzo proste, polega podaniu jedynie dwóch wartości. Wartość pierwsza to dokładny link do strony, z której chcemy pobrać dane. Natomiast drugi element funkcji  to zapytanie, które wyznaczenia jaki typ danych ma zostać pobranych. Najlepiej będzie to widać na poniższym przykładzie: =IMPORTXML(“https://en.wikipedia.org/wiki/Moon_landing”, “//title”) Funkcja rozróżnia wiele typów danych, które możemy pobrać, jednak najpopularniejszymi z nich są:  Tytuł SEO - W tym celu wpisujemy:  //title Opis meta danej podstony - //meta[@name='description']/@content Nagłówki H1 występujące na stronie - pobieramy za pomocą zapytania : //h1 Linki na stronie - mogą zostać pobrane, przy użyciu: //@href web scraping w arkuszach google Odpowiednie wykorzystanie funkcji IMPORTXML w narzędziu, jakim są arkusze Google, może odjąć bardzo dużo pracy oraz pomóc zautomatyzować wiele zadań. Warto pamiętać, że dane pobierane są w czasie rzeczywistym, dzięki czemu wraz ze zmianą któregoś z elementów na stronie, nasz arkusz odnotuje tę zmianę oraz wyświetli aktualne dane. Sama funkcja jest dużo bardziej rozbudowana, natomiast dziś przytoczyliśmy jedynie jej najpopularniejsze funkcje. Warto jednak mieć na uwadze, że odpowiednio przygotowany arkusz, w którym dana funkcja została połączona z innymi formułami oraz dodatkami może pozwolić na stworzenie narzędzia, które w innym wypadku wymagałoby od nas znajomości języków programowania takich jak przykładowo Python.
Autor
Logo Delante
Autor
Delante

Delante to agencja marketingu internetowego, specjalizująca się w generowaniu ruchu na stronach z wyszukiwarek internetowych (SEO/SEM) i z reklam płatnych. Ponad 80% naszych klientów to szybko rozwijająca się branża e-commerce.

Autor
Logo Delante
Autor
Delante

Delante to agencja marketingu internetowego, specjalizująca się w generowaniu ruchu na stronach z wyszukiwarek internetowych (SEO/SEM) i z reklam płatnych. Ponad 80% naszych klientów to szybko rozwijająca się branża e-commerce.

Uzyskaj bezpłatną wycenę

Nagrody

Nagroda - Deloitte 2021 Nagroda - IPMA Nagroda - US Search Awards 2021 Nagroda - European eCommerce Awards 2022 Nagroda - Global Agency Awards 2022 Nagroda - European Search Awards 2022