Indexácia webu

Indexácia webu je proces zhromažďovania, analýzy, ukladania a periodickej aktualizácii údajov zo všetkých webových stránok a ich následného pridávania na stránky vyhľadávacích nástrojov. Pokiaľ web nie je v indexe (databáze) vyhľadávača (napr. Google, Seznam a pod.), tak sa nezobrazí ani vo výsledkoch vyhľadávania.

Zjednodušene povedané indexácia webu je proces zahrnutia stránok webu do databázy vyhľadávačov. Indexácia je prvým krokom k prilákaniu organickej návštevnosti na web.

Ako funguje indexovanie

Vyhľadávacie nástroje prehľadávajú stránky pomocou robotov, tzv. crawlerov, ktoré skenujú obsah na webe:

  • texty,
  • kľúčové slová,
  • meta tagy,
  • mikroznačky,
  • servisné údaje,
  • obrázky,
  • videá,
  • a ďalší obsah.

Následne tieto informácie odovzdávajú ďalším algoritmom vyhľadávacích nástrojov, ktoré analyzujú kvalitu obsahu stránky. Ak stránka prejde všetkými kontrolami, pridá sa do indexu vyhľadávača.

Celkovo proces indexovania prebieha v troch fázach – prehľadávanie (skenovanie),hodnotenie a indexovanie.

1. Prehľadávanie

Skenovanie (prehľadávanie) je prvá interakcia vyhľadávacieho nástroja s webom. Crawler vie nájsť webovú stránku rôznymi spôsobmi, napr. cez odkaz na web z inej stránky alebo po pridaní stránky do zoznamov na overenie. V každom prípade, keď robot nájde vašu stránku, bude ju prehľadávať, aby zistil, čo sa na nej nachádza. 

Ako prvé crawler kontroluje súbory robots.txt, ktoré uvádzajú, či je možné informácie na webe skenovať. Správca webu môže indexácii zabrániť, napr. aby neboli skenované stránky s osobnými údajmi. Následne robot číta Meta tagy, popisy, kľúčové slová a iný obsah: texty, obrázky a videá.

2. Hodnotenie

Následne algoritmus hodnotí kvalitu stránky na základe mnohých faktorov, napr. technických: duplikácia obsahu – algoritmus nepridá do indexu dve rovnaké stránky. Do indexu tiež nebudú zaradené stránky s podvodným obsahom. 

Okrem iného algoritmus analyzuje obsah webových stránok a určuje ich relevantnosť. Faktorov pre hodnotenie je veľa, najdôležitejšími sú však: počet kľúčových slov, jedinečnosť a užitočnosť obsahu.

3. Indexovanie

Tretím a posledným krokom v tomto procese je samotné indexovanie. Po pridaní skontrolovaných stránok do indexu prehliadača, web sa môže začať zobrazovať v relevantných výsledkoch vyhľadávania a generovať organickú návštevnosť. Keď niekto odošle dopyt do vyhľadávania, nástroj prehľadá svoj index, aby našiel najrelevantnejšie stránky pre daný dopyt.

Ako skontrolovať indexovanie stránok vo vyhľadávačoch

Najjednoduchšími spôsobmi ako si viete skontrolovať indexovanie stránok sú nasledovné: 

Prejdite do ľubovoľného vyhľadávacieho nástroja a zadajte jeden z dopytov:

  • site:[URL stránky] – zobrazia sa všetky zaindexované stránky webu:
Zobrazenie zaindexovaných stránok na webe
Zdroj: Vlastný screenshot
  • cache:[adresa požadovanej stránky] – zobrazí sa dátum, kedy bola stránka naposledy prehľadávaná robotmi:
Zobrazenie posledného prehľadávania stránky robotmi
Zdroj: Vlastný screenshot
  • site:[adresa požadovanej stránky] – viete tak zistiť, či vyhľadávač zaindexoval presne požadovanú stránku.
Zobrazenie konkrétnej zaindexovanej stránky
Zdroj: Vlastný screenshot

Existujú aj špeciálne nástroje na kontrolu indexovania webových stránok, ktoré zobrazia stav indexovania, vyhľadávacie dopyty, chyby prehľadávania a tiež vám pomôžu optimalizovať viditeľnosť vašich webových stránok. Najpopulárnejším nástrojom na kontrolu indexovania v Google je Google Search Console.

Zoznam indexovaných a neindexovaných stránok v Search Console
Zdroj: Vlastný screenshot

Tip: sledujte počet indexovaných stránok so skutočným počtom existujúcich stránok na webe. Ak máte 200 stránok, ale indexovaných stránok je iba 150, znamená to, že vyhľadávač nevie o existencii ďalších 50 stránok na vašom webe, čo môže znižovať výkon vášho biznisu. 

Ako a kedy je potrebné blokovať indexovanie stránky 

Webové stránky, ktoré nie sú užitočné, zvyčajne vylučujú z indexovania. Ide napríklad o stránky s technickými informáciami, stránky s osobnými údajmi zákazníkov, duplikáty atď. Najčastejšie blokujú od robotov stránky, ktoré sú v procese prípravy alebo sa menia. 

Existuje niekoľko spôsobov, ako zakázať skenovanie webu.

Robots.txt

Najjednoduchším spôsobom pre blokovanie indexovania webu alebo niekoľkých stránok, je použitie špeciálneho súboru – robots.txt, kde predpisujú pravidlá pre vyhľadávacích robotov – ako má byť stránka indexovaná. Ak chcete zabrániť indexovaniu stránky, stačí pridať Disallow do súboru robots.txt pre stránku alebo súbor, ktorý nie je potrebné indexovať.

Meta tag robots

Do zdrojového kódu stránky viete pridať meta tag robots s direktívou noindex alebo none. Táto metóda je vhodná pre stránky s citlivými údajmi, ktoré by nikto nemal vidieť, napr. s osobnými údajmi používateľov.

<head>
 <meta name="robots" content="noindex">
</head>

CMS

Postup ako zabrániť robotom indexovanie stránky pomocou CMS závisí od konkrétneho systému. Napríklad, WordPress má implementované funkcie na správu indexovania, zatiaľ čo iné CMS budú vyžadovať špeciálne pluginy a nástroje. 

Ako urýchliť indexovanie stránok

Rýchlosť indexovania vôbec nezávisí od vás. Neviete ani donútiť robotov indexovať vašu stránku ihneď. Viete však priradiť vysokú prioritu svojim konkrétnym stránkam a pomôcť tak robotom v orientácii. Dodržiavaním týchto pravidiel môžete trochu ovplyvniť rýchlosť indexovania:

  1. Zaregistrujte svoj web na rýchlom hostingu.
  2. Svoju stránku môžete poslať na indexovanie do služieb Google napr. pomocou Google Search Console.
  3. Správne vygenerujte súbor robots.txt – vypnite indexovanie technických a servisných stránok.
  4. Vytvorte súbor sitemap.xml. Mapa webu musí byť umiestnená v koreňovom priečinku lokality.
  5. Skontrolujte, či stránky neobsahujú duplikáty.
  6. Skontrolujte obsah na počet kľúčových slov – ak je ich málo alebo naopak priveľa, kontrola webu bude trvať dlhšie.
  7. Na stránke pravidelne uverejňujte nový obsah, ktorý používateľov záujme. 
  8. Znížte veľkosť obrázkov a videí – príliš veľká grafika znížuje rýchlosť načítania stránky a má zlý vplyv na indexovanie.
  9. Zlepšite použiteľnosť stránky – pripravte jednoduchú navigáciu, jednoduchý dizajn, umiestnite potrebné tlačidlá a formuláre, ktoré zjednodušia proces nákupu, pridajte platbu jedným kliknutím, sekciu s informáciami o spoločnosti a doručení. Všetky tieto faktory ovplyvňujú pozíciu webu vo výsledkoch vyhľadávania.

Celkovo indexovanie trvá väčšine vyhľadávačov spravidla od 4 dní do 4 týždňov.

Záver

Indexácia webu je najdôležitejším krokom pre zaradenie sa do databázy vyhľadávačov. Ak chcete na svoju stránku prilákať väčšiu návštevnosť, je dôležité, aby bola indexovaná všetkými známymi vyhľadávačmi. V opačnom prípade sa potenciálni zákazníci o vašom webe jednoducho nedozvedia.

Páčila sa vám táto definícia? Zdieľajte ju s priateľmi