Najnowsza informacja o pracy Googlebotów
Niedawna aktualizacja dokumentacji przyniosła ze sobą nowy zapis o pracy Googlebotów, a dokładniej o ich ograniczonym działaniu. Google poinformowało, że:Googlebot może zindeksować pierwsze 15 MB pliku HTML lub obsługiwanego pliku tekstowego. Wszystkie zasoby wymienione w kodzie HTML, takie jak obrazy, filmy, pliki CSS i JavaScript, są pobierane oddzielnie. Po przeskanowaniu pierwszych 15 MB pliku Googlebot zatrzymuje się i podczas indeksowania uwzględnia tylko te 15 MB. Limit rozmiaru pliku jest stosowany do danych nieskompresowanych. Inne roboty mogą mieć inne limity. Źródło: https://developers.google.com/search/docs/advanced/crawling/googlebotOznacza to, że wszystko, co znajduje się poza granicą 15 MB pliku, nie będzie brane pod uwagę w obliczeniach rankingu, a tym samym nie będzie indeksowane. Informacja ta wywołała pewne zamieszanie, jednak John Mueller rozwiał część wątpliwości na Twitterze. Poinformował on, że, po pierwsze, limit ten nie jest nowością - według niego istniał on znacznie wcześniej, jednak dopiero teraz poinformowano o nim użytkowników - i po drugie, że dotyczy on samego pliku HTML. Oznacza to, że do limitu nie wliczają się żadne zasoby czy treści osadzone za pomocą znaczników IMG.