I motori di ricerca sono, in realtà, un centro di informazioni. Il mondo dei motori di ricerca include Google, Yahoo, Bing, Ask e AOL Search. Che cosa realmente fa un motore di ricerca? I motori di ricerca sono siti speciali del web che hanno lo scopo di aiutare le persone a trovare le informazioni memorizzate su altri siti. Questi motori di ricerca funzionano, basandosi su tre attività di base che includono le pagine mostrate sulla base di importanti parole chiave, tengono indice delle parole che trovano e dove le trovano e permettono all’utente di cercare parole o combinazioni di parole presenti in tale indice.
Gli indici dei motori di ricerca di centinaia di milioni di pagine rispondono a decine di milioni di query al giorno. Come riescono a mostrare tante pagine pertinenti in un secondo? Per trovare queste informazioni sulle centinaia di milioni di pagine web, i motori di ricerca utilizzano un particolare tipo di robot, chiamato spider, il quale aiuta nella costruzione delle liste di parole importanti presenti su vari siti web. Questo processo di costruzione delle liste è denominato Web crawling.
I soliti punti di partenza sono gli elenchi di server utilizzati e le pagine popolari. Lo spider inizierà con un popolare sito, indicizzando le parole sulle sue pagine e seguendo tutti i link trovati all’interno del sito stesso. Ogni “ragno” potrebbe mantenere circa 300 collegamenti a pagine Web aperte alla volta. Al suo massimo delle prestazioni, con quattro spider, il sistema potrebbe eseguire la scansione di oltre 100 pagine al secondo, generando circa 600 kilobyte di dati/s.
Sappiamo tutti che Google è il motore di ricerca più utilizzato al mondo. Invece di dipendere da un fornitore di servizi Internet per il DNS che traduce il nome di un server in un indirizzo, Google aveva i suoi propri DNS, in modo da mantenere al minimo i ritardi. Quando un utente cerca una parola specifica questi spider, anche nello stesso Yahoo!Search, presentano titoli, sottotitoli, meta tag e altre parole relative. Questi spider trovano le 100 parole più frequentemente utilizzate nella pagina e ogni parola nelle prime 20 righe di testo. È per questo che ogni volta che si cerca qualcosa su Google si avranno diversi risultati rilevanti da vari siti web.
1 commento su “Come funziona Yahoo”