I motori di ricerca

Gli spider


Come detto in precedenza, un motore di ricerca deve costruire un proprio indice in cui memorizzare per ogni parola chiave il corrispondente sito da visitare. Per costruire questo indice, i motori di ricerca usano i cosiddetti Spiders, ovvero dei piccoli programmi che partendo da una singola pagina Web (solitamente dalla home page) riescono a navigare attraverso tutte le pagine ad essa collegate

Supponiamo di aver creato un nostro sito personale e di volerlo inserire in un motore di ricerca (ad esempio Yahoo.it) in modo che sia più facile trovarci nel web. Se andiamo sul sito di Yahoo, troveremo nella home page una sezione dedicata all'inserimento di nuovi siti.

In tutti i motori di ricerca (Yahoo compreso) in cui vorrete registrare il vostro sito troverete differenti servizi per lo più a pagamento che vi garantiscono l'inserimento del vostro sito nell'indice principale in appena 24/48 ore. Fortunatamente è quasi sempre possibile segnalare il proprio sito anche gratuitamente ma ovviamente in questo caso i tempi di indicizzazione saliranno a 3-4 settimane!

Una volta specificato il tipo di servizio richiesto (gratuito o a pagamento), specifichiamo il nome del sito, l'indirizzo della pagina principale ed il tipo di contenuto, dopodichè inviamo il tutto a Yahoo ed aspettiamo.

Dopo qualche settimana, Yahoo attiverà il suo Spider sulla nostra segnalazione. Lo spider accederà alla pagina principale del sito che gli abbiamo segnalato e da li comincerà la sua navigazione seguendo i link presenti in essa. Per ogni link trovato aprirà una nuova sessione ed effettuerà la stessa identica ricerca accedendo agli altri link presenti. Ovviamente durante tutto questo viaggio tra le pagine del nostro sito provvederà a memorizzare le parole trovate, la frequenza con cui esse si ripetono (il cosiddetto peso) e la pagina web in cui esse sono state trovate.


Lo spider usa i link della pagina iniziale per visitare tutto il sito e
raccogliere informazioni con cui costruire l'indice

Il modo in cui le singole parole vengono selezionate e pesate può differire a seconda del metodo di indicizzazione usato che è proprio di ogni motore di ricerca.

Lo spider di Google ad esempio considera solamente le parole ed esclude gli articoli (a , al, di ,in ....) in modo da effettuare una ricerca più veloce. Quello di Altavista al contrario indicizza tutte le parole (articoli compresi) in modo da fornire dei risultati più accurati. Lycos invece indicizza solamente le 100 parole con più alta frequenza escludendo tutte le altre. Sono aprrocci differenti che rendono differenti i risultati che potete ottenere da differenti motori di ricerca.