Duplikacja treści: co to jest?
Duplikacja treści to, najprościej mówiąc, sytuacja, gdy ten sam tekst pojawia się na kilku różnych stronach internetowych albo kiedy występuje w różnych miejscach w obrębie tej samej witryny. Za duplikację najczęściej uważa się kopiowanie od kogoś, jednak „odpisywanie” treści nie jest jej jedynym źródłem. Duplikację treści możemy podzielić na zewnętrzną i wewnętrzną. Ta pierwsza będzie występowała poza naszą stroną (jako ta sama treść w kilku miejscach, gdzie linkujemy do naszej strony). Druga – w obrębie naszej strony (na przykład identyczny tekst na wielu podstronach). To o niej często zapominają właściciele sklepów internetowych, którzy chwalą się tworzonymi przez siebie unikalnymi opisami. Niestety nie pamiętają o tym, by nie dodawać do kilku produktów (czy kilku kart z wariantami – na przykład kolorystycznymi – jednego produktu) tego samego opisu. Czy to w przypadku duplikacji zewnętrznej, czy duplikacji wewnętrznej, powielenie treści powstaje albo w wyniku celowego działania, albo przez zaniedbanie określonych spraw technicznych.
Niezależnie od przyczyn będzie utrudniała pozycjonowanie i ograniczała widoczność strony w Google.
Duplikację treści bezwzględnie wytropi algorytm „Panda”, który został wprowadzony w lutym 2011 roku, a polskie wyniki wyszukiwania zaczął przeczesywać w sierpniu 2011. Głównym celem działania tego algorytmu jest pokazywanie wyżej wyłącznie stron zawierających unikatowe i wartościowe treści. Jeśli takich nie zamieścimy lub nie zadbamy o to, by treści nie powielały się mimo naszej woli, Google może uznać, że zduplikowanie treści jest manipulowaniem pozycją strony w rankingach i próbą oszukania użytkowników. Może wtedy wprowadzić zmiany w sposobie indeksowania i zmienić pozycję witryny na liście wyszukiwania. W najgorszym wypadku zostanie ona usunięta z wyników.
Z czego może wynikać duplikacja treści?
Sam Google podaje, że powielanie treści „zazwyczaj nie ma na celu oszustwa”. Wynika raczej z niedopatrzeń czy niewiedzy. Zobaczmy więc, jakie są powody powielania treści.
Przyczyny zewnętrznej duplikacji treści
Klony poza stroną pojawiają się, jeśli nasze treści kopiowane są przez inne witryny, albo odwrotnie: gdy „ściągamy” opisy od innych. Dzieje się to też, jeśli na serwisach typu Allegro czy Ceneo umieszczamy te same opisy produktów, co na naszej własnej stronie. Podobnie będzie, jeśli w płatnych katalogach wprowadzimy takie same informacje o firmie, jak na stronie, do której linkujemy, lub gdy opublikujemy gdzieś artykuł gościnnie, a potem powtórzymy go u siebie (lub odwrotnie). Często stosowanym zabiegiem jest również umieszczanie w mediach społecznościowych (najczęściej na Facebooku) opisu firmy takiego samego jak na stronie firmy, co też zwiększa duplikację zewnętrzną. Analogicznie jest także wtedy, gdy prowadzimy sklep oparty na dropshippingu i zaciągamy informacje z innych stron albo gdy jesteśmy producentem określonego towaru, a inne sklepy, które go sprzedają, kopiują opis. Wtedy należy zastrzec treści. Bywa też, że sprzedawcy kopiują opisy ze stron jak Wikipedia. Jest to działanie bezsensowne, ponieważ strony te mają zazwyczaj wysokie parametry, czyli i tak będą wyświetlane wyżej niż te, na które treści zostały skopiowane. Trudno się zresztą dziwić – Google chce przecież pokazać użytkownikom treść, która będzie jak najlepiej dopasowana do zapytania, a do tego unikatowa. Niewiele osiągniemy, jeśli nasza będzie skopiowana. Tak w największym zarysie przedstawiają się źródła zewnętrznego powielania treści. Jak jest z tym wewnętrznym?Przyczyny wewnętrznej duplikacji treści na stronie
1. Identyczne teksty w opisach kategorii i produktów
Identyczne opisy kategorii i produktów to prawdziwy problem w e-commerce. To problem najtrudniejszy do wyeliminowania. Wszystkie opisane dalej można rozwiązać mniejszym nakładem pracy poprzez optymalizacje techniczne. Przy dziesiątkach, a czasem setkach podobnych produktów trudno zadbać o wyjątkowy opis dla każdego pojedynczego przedmiotu, zwłaszcza kiedy ma jeszcze dodatkowo kilka kart. Duplikację powodują też filtrowanie, sortowanie i parametryzacja, podstawowe w e-commerce, oraz lite bloki tej samej treści na kolejnych podstronach (regulamin, stopka z treścią).2. Strona główna jest dostępna pod wieloma adresami
Jeśli nasza strona główna jest dostępna pod kilkoma różnymi adresami, może to być jednym z powodów duplikacji treści. Tak się stanie, jeśli w to samo miejsce prowadzą adresy jak: http://www.adres-strony.pl http://adres-strony.pl http://www.adres-strony.pl/index.html czy http://adres-strony.pl/index.html
Rozwiązanie: Poprawne przekierowania między poszczególnymi wersjami.
3. Nieprawidłowe przekierowania przy dodaniu certyfikatu SSL
Kiedy nieprawidłowo przekierujemy stronę z http na https przy wdrażaniu certyfikatu SSL, również możemy spodziewać się, że dla wyszukiwarki będą istniały dwie witryny o takiej samej treści.
Rozwiązanie: Poprawne wdrożenie certyfikatu SSL. O tym, jak uniknąć najczęstszych błędów przy wdrażaniu certyfikatu, przeczytasz w naszym wcześniejszym wpisie: Instalacja certyfikatu SSL – najczęstsze błędy przy przechodzeniu na HTTPS.
4. Nieprawidłowe wersje językowe
Innym powodem duplikacji mogą być błędne wersje językowe strony. Dzieje się tak, kiedy strona nie jest w całości przetłumaczona i przykładowo na jej obcojęzycznej wersji mamy teksty w odpowiednim języku, ale nazwy produktów są wciąż po polsku. Złym pomysłem jest też tłumaczenie tekstu za pomocą Google Translatora i wklejanie takiej treści na obcojęzyczną wersję strony.
Rozwiązanie: Osobny, poprawnie przetłumaczony tekst dla każdej wersji językowej.
5. Powielone znaczniki title i meta decription
Zdarza się, że na stronie występuje duplikacja znaczników meta, która również może być negatywnie traktowana przez Google. Zachodzi ona też wtedy, kiedy na stronę o wielu podstronach nie wprowadzimy różnorodnych znaczników title i odmiennych tagów meta description. Żeby roboty przeglądarki dobrze interpretowały stronę, elementy title muszą być różne dla każdej podstrony. Meta opisy mają mniejsze znaczenie, natomiast gdy będą zduplikowane – będą osłabiać pozycję strony. Je także warto wprowadzać ręcznie.
Rozwiązanie: Poprawne meta tagi. O wszystkich pisaliśmy już tutaj: Meta znaczniki – co to jest, jak je tworzyć i jak wpływają na SEO.
6. Niezoptymalizowana paginacja
Innym problemem jest paginacja. To pojęcie z zakresu drukarstwa i ogólnie produkcji książkowej, zapożyczyliśmy je jednak też do WWW. Oznacza stronicowanie, czyli szatkowanie treści na kawałki i umieszczanie ich na kolejnych podstronach. Stosuje się ją po to, by – jak w książkach – ułatwić użytkownikowi czytanie i przeglądanie, ale także wspomóc indeksowanie. Przykładem są chociażby wyniki filtrowania produktów i kilkustronicowe ich listy. Jeśli na każdej podstronie będą takie same znaczniki description i title, identyczny tekst i produkty, nastąpi – po raz kolejny – klonowanie.
Rozwiązanie: Osobne znaczniki description, title, nowy tekst i inne produkty na każdej podstronie lub też odpowiednie oznaczanie podstron w kodzie i w Google Search Console.
Jak wykryć duplikację treści?
Wiemy już, jak powstaje duplikacja treści. Czas powiedzieć, jak ją wytropić. Możemy zrobić to z użyciem narzędzi takich jak:- Google Search Console – pokaże nam, jakie mamy na stronie podwojone tytuły i opisy meta
- Ahrefs – również dzięki niemu można sprawdzić duplikację wewnętrzną
- Screaming Frog – namierzy powielone podstrony i meta tagi, a także nagłówki
- Sitebulb – również znajdzie powtórzone podstrony
- Siteliner – sprawdzi wewnętrzną duplikację
- Copyscape – tu znajdziemy zewnętrzną duplikację
- zwyczajna wyszukiwarka Google, do której wklejamy fragment napisanego tekstu i sprawdzamy, czy można go gdzieś już znaleźć.