Algorytm BERT: jak działa?
Do tej pory Google traktowało zdanie wpisywane w wyszukiwarkę jako zbiór słów. BERT nie tylko rozumie wyrazy w zapytaniu, ale także ich kontekst i kolejność. Bierze też pod uwagę stopwordsy, które wcześniej były uważane za nieistotne. Nowy algorytm Google BERT wpływa także na wyświetlanie się featured snippets.
Na razie (od kilku dni) wdrożony jest jedynie dla języka angielskiego, ale możemy się spodziewać, że niebawem jego działanie będzie się rozprzestrzeniać.
Google informuje, że nowy algorytm może wpłynąć na 1 z 10 wyszukiwań. To dość dużo :)
No dobra, to jak to działa w praktyce?
Przykład 1:
[caption id="attachment_17959" align="aligncenter" width="750"]
Źródło: https://blog.google/products/search/search-language-understanding-bert[/caption]
Pierwszym przykładem jest wzięcie pod uwagę stopwordsów. Fraza “2019 brazil traveler to usa need a visa” wyszukiwana przed wprowadzeniem algorytmu BERT pokazywała wynik, który odpowiadał na pytanie czy obywatel USA potrzebuje wizy do Brazylii. Wszystko przez to, że wyszukiwarka nie brała pod uwagę słowa “to” (pl. “do”), które przecież zmienia diametralnie znaczenie zdania. Po wprowadzenia algorytmu dostajemy bardziej sensowny wynik.
Przykład 2:
[caption id="attachment_17963" align="aligncenter" width="750"]
Źródło: https://blog.google/products/search/search-language-understanding-bert[/caption]
Drugim przykładem jest lepsze zrozumienie samego kontekstu zdania przy wyszukiwaniu frazy “Can you get medicine for someone pharmacy”.
Przykład 3:
[caption id="attachment_17965" align="aligncenter" width="750"]
Źródło: https://blog.google/products/search/search-language-understanding-bert[/caption]
Aktualizacja BERT wpłynie też na wyniki featured snippets. Przykładem jest fraza “Parking on a hill with no curb”. Wcześniej Google zwracało zbyt dużo uwagi na samo słowo “curb” (pl. “krawężnik”) nie biorąc pod uwagę słowa “no”. W rezultacie zamiast dowiadywać się o parkowaniu na drodze bez krawężnika widzieliśmy instrukcje całkiem odwrotne.
We wszystkich przykładach, które prezentuje nam Google widzimy, że największy nacisk postawiony jest na interpretację zaprzeczeń, zaimków, przyimków (i innych słów o trudnych określeniach, o których uczyłeś się na lekcjach polskiego), które wcześniej były pomijane.
d-tags

(ilość głosów: 7, średnia: 4,29 na 5)


