Przemierzanie sieci oraz interpretacja treści jest w przypadku wyszukiwarek ograniczona. Strona internetowa nie zawsze wygląda tak samo dla mnie i dla Ciebie. W tej części skupimy się na aspektach technicznych jeśli chodzi o budowanie strony internetowej dostosowanej dla wyszukiwarek i użytkowników sieci. To odpowiednia część podręcznika, którą warto podzielić się z programistami architektury informacji.
Płytka zawartość
Aby dana treść pojawiła się w wyszukiwarce musi być przygotowana w formacie tekstowym HTML. Obrazy, pliki Flash, aplety Java oraz inne pozbawione tekstu treści są często ignorowane, pomimo postępów indeksowania. Najprostszym sposobem, aby przekonać się, czy treść jest widoczna dla użytkowników w wyszukiwarce jest umieszczenie jej w formacie HTML na stronie. Istnieją również bardziej zaawansowane metody dla osób, którym bardzo zależy na wysokim stylu wizualnym.
- Obrazy w rozszerzeniu GIF, JPG lub PNG mogą być przypisywane do ?all atributes? w HTML dostarcza wyszukiwarkom tekstowych opisów treści wizualnych.
- Pola wyszukiwania mogą być uzupełnione nawigacją i przeglądanymi linkami.
- Flash lub Java plug-in zawierające treść mogą być uzupełnione o tekst na stronie.
- Audio i video powinny mieć transkrypcję.
Widzieć, jak wyszukiwarka internetowa
Wiele stron internetowych ma poważne problemy z indeksowaniem zawartości, dlatego podwójna kontrola się opłaca. Za pomocą narzędzi, takich jak pamięć podręczna Google, SEO-browser.com lub Moz Bar możesz sprawdzić, jakie elementy treści są widoczne i zindeksowane dla wyszukiwarek. Spójrz na tekst Google, który teraz czytasz. Widzisz, jak inaczej wygląda? Wow! To my tak wyglądamy?
Korzystanie z funkcji pamięci podręcznej Google umożliwia nam zobaczenie, jak wyszukiwarka internetowa widzi stronę JugglingPands.com. Strona internetowa nie zawiera wszystkich bogatych informacji, które widzimy, co znaczenie utrudnia trafne wyszukiwanie.
Ej, a co z zabawą?
Och? za pośrednictwem pamięci podręcznej Google możemy przekonać się, że strona jest jałowa, świeci pustkami. Nawet tekst nie mówi nam, że strona zawiera interesującą nas treść. Strona jest całkowicie zbudowana w technologii Flash, co niestety oznacza, że wyszukiwarka nie jest w stanie indeksować jakichkolwiek treści tekstowych, a nawet linków do poszczególnych gier. Bez jakiegokolwiek tekstu HTML, nie będzie zdobywać wysokich not w rankingu wyszukiwania.
Dobrze jest nie tylko sprawdzić zawartość tekstową, ale również korzystać z narzędzi SEO, aby dokładnie sprawdzić, czy strona jest widoczna dla wyszukiwarek. Odnosi się to także do zdjęć, o czy będzie mowa niżej.
Struktura linku
Wyszukiwarki, ale znaleźć treść muszą zarówno zobaczyć zawartość tekstową strony internetowej, ale także widzieć linki. Możliwa do przeglądania struktura linku jest niezbędna do znalezienia wszystkich stron w witrynie. Setki tysięcy witryn dokonują krytycznego błędu strukturyzacji ich nawigacji w uzyskiwaniu stron wymienionych w indeksach wyszukiwarek.
Anatomia linku
Tag linku może zawiera zdjęcia, tekst, lub inne obiekty, na które klikając użytkownicy mogą przejść na kolejną stronę. Jest to bardzo oryginalny element nawigacyjny w Internecie ? ?link?. Lokalizacja linku referencyjnego informuje przeglądarkę (i wyszukiwarki), gdzie łączy się link. W tym przypadku, URL http://www.jonwye.com odwołuje. Następnie widoczna część łącza dla odwiedzających zwana ?an chor text? opisuje punkty łącza. Strona została zaznaczona pasami, wykonanymi przez mojego przyjaciela z Waszyngtonu, Jona Wye, więc użyłem Anchor tekstu z ?Pasami Jona Wyea??. </A> tag zamyka całość, dzięki czemu potem link na stronie nie będzie atrybutem. Jest to najbardziej podstawowa forma odsyłaczy i jest to naprawdę zrozumiałe dla wyszukiwarek. Pająki wiedzą, że powinny dodać ten link do wykresu wyszukiwarek, a następnie do indeksu wskazanej strony. Kilka powodów, dla których strona może nie być osiągalna.
- Przeoczenie wymaganych formularzy – Jeżeli przed wejściem na pewne strony, użytkownicy muszą wypełnić pewne formularze on-line, możliwe, że wyszukiwarki nie zobaczą tych chronionych stron. Formularze mogą być chronione hasłem logowania.
- Linki w Javascript, które nie są możliwe do przeglądania – Jeżeli zastosuje się Javascript, może się okazać, że wyszukiwarki nie mają dostępu do linków tam się znajdujących. Javascript powinny być zastąpione standardowymi linkami HTML na każdej stronie.
- Linki kierujące do stron blokowanych przez meta robots Tag lub robots.txt – Tag meta robots i pliki robots.txt ograniczają dostęp do stron. Pamiętajcie jednak, że wielu webmasterów nieświadomie zastosowało te dyrektywy jako próbę blokowania dostępu do nieuczciwych botów, nie wiedząc o tym, że wyszukiwarki ich nie indeksują.
- Ramki, czyli E-ramki – Technicznie, linki w ramkach są indeksowane, ale pojawiają się pewne problemy. Jeżeli nie jesteś zaawansowanym użytkownikiem z dobrą znajomością o indeksowaniu wyszukiwarek i linków w ramkach, lepiej trzymaj się od nich z daleka.
- Roboty nie używają formularzy wyszukiwania – Niektórzy webmasterzy są przekonani, że jeśli umieszczą pole wyszukiwania na ich stronie, to wyszukiwarki będą w stanie znaleźć wszystko, czego oczekują użytkownicy. Niestety, miliony stron jest ukrytych za niedostępną ścianą, skazane na anonimowość.
- Linki w Flash, Java lub innych wtyczek – Linki wbudowane na stronie z Pandą (przykład wyżej) jest doskonałą ilustracją tego zjawiska. Chociaż przedstawiono dziesiątki pand, pająk nie jest w stanie do nich dotrzeć za pośrednictwem linków ? stają się one niewidzialne dla wyszukiwarek.
- Linki na stronach z wieloma setkami tysięcy linków
Jeżeli można uniknąć tych pułapek, będziesz miał czyste HTML, które będą miały łatwy dostęp do strony z treścią. Rel =?nofollow? może być używany z następującą składnią:
<a href=? http://www.seomoz.org”rel=”nofollow”> Lousy Punks! </ a>
Linki mogą mieć wiele cech dostosowanych do nich, ale wyszukiwarki ignorują prawie wszystkie, z istotnym wyjątkiem rel=?nofollow? tag. W tym przykładzie, dodając atrybut rel=nofollow powiedzieliśmy wyszukiwarce, że nie my, właściciele strony nie chcemy linku.
Nofollow dosłownie instruuje wyszukiwarki, aby nie śledzić łącza. Tag nofollow powstał, aby zatrzymać automatyczne komentowanie blogów, księgi gości i spamowanie.
Linki nofollow są złe?
Mimo, że linki nofollow nie mają takiej wartości co ich potomkowie, stanowią one naturalną część zróżnicowanego profilu linków. Strona z dużą ilością linków gromadzi wiele linków nofollow, a to wcale nie jest złe.