Od prvních internetových vyhledávačů až po současné pokročilé AI nástroje – cesta vyhledávání informací byla dlouhá a plná zvratů. Jak Google revolucionizoval internet s Page Rankem a jak nové technologie jako Retrieval Augmented Generation a Microsoft Copilot překračují hranice tradičního vyhledávání? Přečtěte si fascinující příběh evoluce vyhledávačů, objevte, proč vyhledávání již nikdy nebude jako dřív, a jak se AI stává klíčovým hráčem ve hře o informace.
Když se objevilo vyhledávání pomocí Google, šlo o naprostou revoluci. Většina prvních vyhledávačů (Altavista, Northern Light) využívala strojové indexování internetových stránek, ale Google přišel s převratnou myšlenkou, že je bude klasifikovat nikoliv na základě jejich obsahu, ale referencí. Úprava stránek pro změnu jejich pořadí ve vyhledávačích (SEO, Search Engine Optimization) se pro jednoduché vyhledávače dělala snadno – klíčová slova se na nich například mnohokrát opakovala, přičemž byla „zobrazena bílým písmem na bílém podkladě“ – byla tedy viditelná jenom pro strojové indexování.
Google přišel s myšlenkou, že měřil počet referencí mířících na danou stránku, tedy fakticky měřil její citační index. Tento systém, nazývaný Page Rank, v podstatě udával, jak je která internetová stránka důležitá „pro ty ostatní“ – a vycházel z toho, že pokud je nějaká stránka často odkazovaná, je důležitější, než podobná stránka, na kterou odkazy nemíří.
Systém Google býval po dlouhou dobu přesnější – tedy do doby, než se Google rozhodl měnit pořadí podle objemu placené reklamy, tvůrci stránek se naučili provádět úpravy SEO i pro Google Rank a hlavně do doby, než web začal přecházet na technologii „hlubokého webu“ (deep web). Deep web, prosím pěkně, NENÍ dark web, se kterým si to lidé často pletou: Dark web je „skrytý internet“ využívající kryptografii, aby se vyhnul regulaci a dozorování a je oblíbený například mezi hackery.
Deep web je něco úplně jiného. Je to webová technologie založená na databázích, kdy se obsah generuje na základě dotazu – a nejde tedy o klasické statické stránky, které mohou snadno vyhledávací služby procházet a indexovat. Deep web je založen na dotazování a generování stránek na základě dotazů, takže ho není snadné snadno procházet a odkazovat se na něj. S tím, jak se deep web začal rozšiřovat, klesala i účinnost vyhledávání, protože klasické vyhledávače jako je Google neumí podobné struktury efektivně prohledávat.
Klesající přesnost vyhledávání vedla k tomu, že se lidé museli méně spolehnout na automatické doporučení Google a používat více triků z oblasti formulování dotazů pomocí vyhledávacích operátorů. Ale ani to nestačilo na prohledávání deep webu, takže začaly vznikat systémy na prohledávání databází, v podstatě vyhledávače pro dané zdroje informací.
V současnosti jsme se dostali do situace, kdy umělá inteligence dovede nejenom vyhledávat, ale i sumarizovat informaci, takže začaly vznikat nástroje označované jako Retrieval Augmented Generation (RAG). Ty dovedou vzít dotaz formulované běžnou řečí, provést vyhledání informací a vygenerování odpovědi formou krátkého shrnutí. Tyto nástroje, jako přicházející Microsoft Copilot založený na technologii GPT od OpenAI, tak vlastně smazávají rozdíl mezi vyhledáváním informací a jejich kompilací do odpovědi: Jenom se zeptáte a systém vám odpoví.
i
Další seriály Michala Rybka na Alza.cz
Článek mapuje evoluci vyhledávání na internetu od prvních vyhledávačů přes Google a jeho revoluční Page Rank až po současné technologie hlubokého webu a využití umělé inteligence pro vyhledávání. Google transformoval vyhledávání díky hodnocení stránek na základě referencí, čímž zlepšil relevanci výsledků. Postupně se však efektivita vyhledávání snížila kvůli rozvoji deep webu a adaptaci SEO strategií. V současné době Retrieval Augmented Generation a nástroje jako Microsoft Copilot překonávají tyto výzvy umožněním vyhledávání a sumarizace informací v reálném čase, což mění způsob, jakým přistupujeme k informacím na internetu.

Michal Rybka
Michal Rybka je publicista a nadšenec s 20 lety zkušeností v IT a gamingu. Je kurátorem AlzaMuzea a YouTube kanálu AlzaTech. Napsal několik fantasy a sci-fi povídek, které vyšly v knižní podobě, a pravidelně pokrývá páteční obsah na internetovém magazínu PCTuning.