Práce vyhledávačů
Mnoho nováček webmasterů a jen fanoušci surfování na internetu se zabývá otázkou: jak fungují vyhledávače? Základní principy vyhledávačů dnes bude zvažovat zemi rad.
Moderní vyhledávač je celý komplex skládající se z nejkomplikovanějších programů a algoritmů pracujících s ohromující rychlostí. Představte si, že nový vyhledávací algoritmus Kofein od společnosti Google je schopen zpracovat informace, které odpovídají 3 km listům A4 za pouhý 1 vteřin!
Ve všech vyhledávačích lze softwarové komponenty rozdělit do pěti hlavních skupin:
- "Pavouci"
- "Cestující pavouci"
- indexátory
- databází
- systémy výsledků
Pavouci - pavouci (pavouci) - podle algoritmu jejich práce připomínají prohlížeče, ale nemají žádné vizuální komponenty. Spider načte html kód stránky pomocí http protokolů.
Požadavek robota na server obsahuje příkaz"Get / path / document" a některé další příkazy http požadavku. Na žádost pavouka dostane odpověď ze serveru jako textový řetězec, který obsahuje proprietární informace o dokumentu a ve vlastním dokladu. Pavouk je součástí indexačního modulu pro vyhledávače.
"Cestující pavouk" - crawler - je další součástíindexovací modul. Prolézací modul automaticky vyhledá všechny hypertextové odkazy, které byly nalezeny pavoukem na stránce, a tak vyhledá dokumenty, které zatím vyhledávač nezná.
Robot-Indexer (indexer) pracuje přímo s obsahem stránek načtených roboty spiderů. Indexátor provádí morfologickou, lexikální analýzu stránek a rozbíjí je do samostatných částí.
Databáze (databáze) jsou speciální software určený k uložení indexovaných dokumentů shromážděných a indexovaných komponentami.
Vyhledávač motorů výsledků - systém pro vydávání výsledků je jedním z nejdůležitějšíchkomponenty vyhledávače. Je to s výstupním systémem, který koncový uživatel řeší, který zadává dotaz do vyhledávacího řetězce. Systém výstupů výsledků na základě více než dvou set různých kritérií provádí výběr výsledků, které nejvíce vyhovují cílům vyhledávání.
Algoritmus takového výběru se obvykle nazývá algoritmus nebo mechanismus hodnocení. Aby se zabránilo podvodům ze strany webmasterů s cílem ovlivnit výsledky vydání, jsou vyhledávací motory s přesnou klasifikací algoritmů udržovány v nejtajnějším utajení.
Existuje však řada známých kritérií, která jsou zohledněna v práci vyhledávačů, což optimalizuje, které webmaster může "legálně" ovlivňovat výsledky vyhledávání. Například, Vyhledávač při analýze stránky bere v úvahu:
- zda v názvu stránky existuje klíčové slovo (název)
- Zobrazuje se klíčové slovo v adrese URL stránky?
- zda v hlavičkách H1-H6 existuje klíčové slovo, značky STRONG, B, EM, I
- jaká je hustota klíčových slov na stránce (Hustota)
- Existuje klíčové slovo v meta tagu: klíčová slova, popis
- Existují interní a externí odkazy na stránce?
Uživatel interaguje s vyhledávačem prostřednictvím vyhledávacího serveru. Přijatý vyhledávací dotaz od uživateleprocesy serveru a vysílá jako vstupního parametru pořadí modulu. Na druhé straně, jednotka provádí zpracování dokumentů, pro něž se informace uložené v databázi vyhledávače, a řadí stránky odpovídající žádost uživatele.
Následně systém generuje úryvek - textové informace, které se uživateli zobrazují ve formě stránky SERP (Výsledek vyhledávače) stránky výsledků vyhledávání.
Tak i krátký popis hlavníprincipy práce vyhledávacích systémů ukazují, jak jsou navzájem propojeny všechny softwarové komponenty systému a jak dobře by měl vyhledávač fungovat a jasně fungovat, aby poskytl uživateli nejrychlejší a nejspolehlivější informace o jeho vyhledávacím dotazu.