Jak sprawdzić, czy strona jest zindeksowana w Google?
Żeby zauważyć, że Twój serwis zniknął z wyników wyszukiwania, najpierw musisz wiedzieć, jak to zweryfikować. Nawet jeśli po wpisaniu danej frazy strona nie wyświetla się w SERPach, nie musi to oznaczać, że jest wyindeksowana. Być może z pewnych powodów algorytmy Google obniżyły widoczność witryny, ale dalej biorą ją pod uwagę, choć nie pokazuje się ona na wysokich pozycjach. Najprostszym sposobem na sprawdzenie indeksacji jest wysłanie do wyszukiwarki następującego zapytania: site:adresstrony.pl. Kiedy wpisałem site:delante.pl, Google wyświetliło mi następujący wynik:Najczęstsze błędy popełniane przez developerów
Przyczyn znikania strony z wyników wyszukiwania może być wiele. Oto przykładowe niewłaściwe działania developerów, które mogą do tego doprowadzić.- Umieszczenie tagu noindex – często na etapie tworzenia strony internetowej developerzy blokują witrynę przed jej zindeksowaniem przez wyszukiwarkę. Chcą, aby w wynikach pojawił się już gotowa wersja strony. Żeby to osiągnąć, korzystają z tagu noindex, który zatrzymuje roboty Google. Jak wygląda taki kod? Pojawia się w sekcji <head> strony i może to być:
<meta name="robots" content="noindex">
– jeśli chcesz zablokować roboty większości wyszukiwarek,
<meta name="googlebot" content="noindex">
– jeśli chcesz zablokować wyłącznie robota Google.
Nasze doświadczenia pokazują, że taki tag może pojawić się na stronie przypadkiem. Wystarczy go usunąć, by witryna zaczęła stopniowo wracać do indeksu. Jak możesz sprawdzić, czy powodem kłopotów jest właśnie noindex? Wyświetl źródło strony. Kliknij prawym przyciskiem myszy i wybierz odpowiednią opcję. W Chrome jest to właśnie „Wyświetl źródło strony”. Następnie użyj klawiszy CTRL+F, żeby uruchomić funkcję szukania i wpisz noidex. Jeśli znajdziesz w kodzie taki zapis, jak powyżej, usuń go.
- Blokada w pliku .htaccess – plik .htaccess jest odczytywany przy każdym ładowaniu strony, więc wprowadzone w nim zmiany mają natychmiastowy wpływ na działanie serwera. Kod, który jest przyczyną blokady może być różny. Najłatwiejszym sposobem na ocenę, czy źródłem trudności jest blokada tego pliku może być skorzystanie z Google Search Console. Użyj funkcji „Sprawdź dowolny URL w…”. Jeśli uda się pobrać stronę, to oznacza, że problem tkwi gdzie indziej.
- Blokada w pliku robots.txt – w tym pliku można nawet zablokować dostęp do całej witryny. Powinien się on znajdować w katalogu głównym strony, ale nie jest powiedziane, że w ogóle musisz go mieć. Żeby sprawdzić, czy on istnieje, wprowadź adres: twojastrona.pl/robots.txt. Jeśli się otworzy, zweryfikuj jego treść. Jeżeli znajdziesz tam poniższy kod, to oznacza, że strona nie będzie się indeksować:
- Usunięcie w Google Search Console – dzięki mapom dodanym do GSC możesz nie tylko szybciej zindeksować stronę WWW, ale znajdziesz tam również funkcje związane z przyspieszaniem usuwania podstron z wyszukiwarki. Po co Ci takie rozwiązanie? Np. jeżeli będziesz chciał, żeby dana treść nie została zindeksowana w Google, ale zapomnisz zablokować materiał i będzie on dostępny w wyszukiwarce. Opcja ta przyda Ci się również wtedy, gdy dojdzie do włamania na Twój serwis, w wyniku czego zostaną na nim umieszczone treści zawierające SPAM, a Ty będziesz je chciał szybko usunąć. Trzeba jednak z tej funkcji korzystać prawidłowo. Po zalogowaniu się do GSC, wybierz „Usunięcia”, a następnie „Nowa prośba” i wpisz URL, który chcesz wyindeksować. Jeśli podasz adres strony głównej i zaznaczysz „Usuń wszystkie URL-e z tym prefiksem”, to cała witryna zniknie z Google! GSC pokaże Ci ostrzeżenie:
- Kod odpowiedzi HTTP – sprawdź, czy dany URL zwraca kod HTTP 200, który oznacza, że wszystko jest w porządku. Jeśli jest on inny, to bardzo prawdopodobne, że Google nie zaindeksuje tej strony. Kod 400 informuje o problemach z danych żądaniem, a 500 potwierdza, że zostało ono zaakceptowane, ale nie jest spełnione ze względu na błąd na serwerze. Jak rozwiązać problem? Usunąć przyczynę błędu.
- Treści dostępne dla zalogowanych – posiadasz pewne treści, ale postanowiłeś, że zaczniesz je udostępniać wyłącznie dla użytkowników, którzy założą konto i zalogują się do Twojego serwisu? Robot Google niestety tego nie zrobi i przy ponownym sprawdzeniu danego URL-a prawdopodobnie go wyindeksuje.
- Źle wdrożony tag hreflang – tag ten służy do podpowiadania wyszukiwarkom, że dany serwis lub podstrona posiada różne wersje językowe. Ma to zastosowanie, kiedy oferta jest kierowana do użytkowników z różnych regionów, a celem jest zaprezentowanie jej w odpowiednim języku, dopasowanym do odwiedzającego witrynę. Niewłaściwe użycie tego tagu może doprowadzić do stopniowego wyindeksowania strony. Więcej na ten temat dowiesz się z innego wpisu na naszym blogu: Hreflan Jak prawidłowo oznaczać wersje językowe strony?
- Błędnie wdrożony tag rel=canonical – jeśli posiadasz na swojej stronie kilka podstron o takiej samej treści, to Google nie zindeksuje wszystkich, lecz wybierze jedną, niekoniecznie tę, na której Ci zależy. Jeżeli jednak wskażesz link kanoniczny, to wyszukiwarka powinna zaindeksować właściwy adres. Trudności mogą się pojawić wtedy, kiedy błędnie wdrożysz tag, bądź w sytuacji, gdy w ogóle tego nie zrobisz. Jego brak może się skończyć usuwaniem z indeksu duplikujących się treści. Pamiętaj również, że canonical jest konieczny w przypadku stron z wieloma wersjami językowymi – bez niego wspomniane hreflangi mogą być źle interpretowane.