Google stara się cały czas walczyć z różnym patologiami. Nie żeby Google takie szlachetne było, dla nich jakość wyników wyszukiwania przekłada się bezpośrednio na wysokość dochodów. Przy tym oberwać mogą postronni obserwatorzy. Czy tacy postronni? Nie wiem, jedno jest pewne to zawsze będzie wyścig między dwoma stronami.
Google stara się utrzymać swoją dominująca pozycję na rynku wyszukiwania i jest to zrozumiałe. Z drugiej strony my jako konsumenci usług Googla dostajemy coraz lepsze wyniki wyszukiwania. Czy na pewno? Zależy jak zdefiniować najlepsze. Otóż teraz wraz z kolejnymi iteracjami zmian w algorytmie wyszukiwania Googla dostajemy wynik z mniejszą liczbą spamu. To jest dobre. Ale nie koniecznie dostajemy najbardziej wartościowe? Jak pokazuje historia EnjoyPerth.net – niekoniecznie. EnjoyPerth jest małym blogiem koncentrującym sie na zbieraniu informacji o wydarzeniach w stolicy zachodniej Australii. Dwa tygodnie temu zostało całkowicie usunięte z indeksów Googla. Czy słusznie? Nie wiem, to jest tak naprawdę sprawa między Google a EnjoyPerth. Ale trzeba być zdawać sobie sprawę, że przy obecnej dominacji Googla zostaje tylko jedno wyjście – tańczyć tak jak on zagra.
Cóż pozostaje tylko prosić konkurencję Googla aby się nie dała i w końcu odebrała jakiś większy kawałek tortu i nie istniało tylko jedno źródło ruchu przychodzącego z wyszukiwarek.
Także w ramach dostosowania własnych kroków do rytmu granego przez Googla ostatnio trochę poprawiłem robots.txt, tak aby zmniejszyć z punktu widzenia g-robota ilość zduplikowanej treści na moich blogach. Jako, że oba NetManiaki (polski i angielski) są oparte na Wordpresie, więc duża część treści jest zwielokrotniona – pojedyncze posty, strony kategorii, archiwum. Nie wiem jeszcze jak poradzić sobie z archiwum, jako że link do archiwum jest zbyt podobny do linku do postu. Pewnie zmienię linki do archiwum dodając do nich archive przed datą, tak aby Disallow mogło je rozróżnić.
Miesiąc temu poprawiłem robots.txt ograniczając dostęp g-robota do części treści na angielskim blogu. PR w ostatnich zmianach podskoczył z 2 do 4 i mam nadzieję, że to ma jakiś związek przyczynowo skutkowy (kiedyś blog miał już 4 ale jakieś pół roku temu spadł do skromnego 2).
Obecnie plik robots.txt wygląda tak:
User-agent: * Disallow: /wp/category/ Disallow: /wp/page/ Disallow: /pl/category/ Disallow: /pl/page/
Popularity: 8% [?]



