Diventare Webmaster
Approfondimenti, trucchi ed astuzie
Diventare Webmaster
Approfondimenti, trucchi ed astuzie

Indirizziamo gli spider

Ciò che stiamo per osservare pone in risalto quanto sia importante essere nei data base delle directory che, per completarli, aggiungono dati provenienti da motori coi quali hanno accordi (seconda sorgente).
Non sottovalutiamo affatto le directory: migliorano la scalata delle posizioni sui motori che vi fanno riferimento (ad es. Google fa riferimento a Dmoz e quindi essere su Dmoz migliora il posizionamento).

Torniamo ai search engine. Siamo noi a doverci adattare agli spider, ma è anche possibile far adattare i robots alle nostre esigenze.
Se siamo in possesso di un dominio possiamo indirizzarli all'interno del sito creando un file di nome robots.txt: va posto nella root principale (www.nomesito.it/robots.txt) per inserirvi le istruzioni che guidino il ragno
Ecco qualche suggerimento.

  • Consentiamo l'accesso ai robots
    User-agent: *
    Disallow:
    (possiamo non creare il file o lasciarlo vuoto)
  • Impediamo tutti i robots
    User-agent: *
    Disallow: /
  • Impediamo a tutti i robots l'accesso a determinate cartelle
    User-agent: *
    Disallow: /calcio/
    Disallow: /volley/
  • Impediamo a un robot l'accesso a determinate cartelle
    User-agent: ArchitextSpider
    Disallow: /cgi_bin/
    Disallow: /secret/
    (nell'esempio abbiamo escluso Excite)
  • Lasciamo passare un unico robot
    User-agent: Slurp
    Disallow:
    User-agent: *
    Disallow: /
    (nell'esempio lasciamo passare Hotbot)
  • Escludiamo un determinato robot da tutti i file
    User-agent: Scooter
    Disallow: /
    (nell'esempio abbiamo escluso Altavista)
Rimando alle singole pagine dei motori di ricerca per conoscere i nomi di tutti i robots.
Se non disponiamo di un dominio tranquilli, un meta tag consente di ottenere risultati quasi all'altezza del file robots.txt.

<META NAME="ROBOTS" CONTENT="...">
Permette ai robots dei motori di ricerca di indicizzare o meno il documento secondo il valore che immetteremo.
  • index: i robots indicizzano la pagina
  • noindex: la pagina non viene indicizzata dai robots
  • follow: le pagine linkate alla pagina vengono indicizzate
  • nofollow: le pagine linkate alla pagina non vengono indicizzate
Es. 1: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
Es. 2:<META NAME="GOOGLEBOT" CONTENT="NOINDEX, NOFOLLOW">
(nel primo esempio escludiamo qualsiasi robot, nel secondo solo Google).
Editor e risorse on line Indirizzi per Webmaster Puntiamo all'indicizzazione Puliamo il codice sorgente
Saper promuovere all'interno Saper promuovere all'esterno Fidelizzazione degli utenti Collegamenti alla Home page
Sistema di collegamenti interni Indirizziamo gli spider Metadati nell'header del sito Valutazioni degli algoritmi
Flash per i motori di ricerca Evitare lo spamming Navigatori e comportamenti Scalare posizioni


Libbra Plus Home Page
CompuTime
Webmaster
Termini Tecnici

Active Channel, il canale attivo di Libbra.it e Max Media

Libbra.quiz Mettiti in gioco e prova l'ultimo Libbra.quiz. Chi sarà il migliore?
Scegli Libbra.it Come Home Page

Libbra.it
Pag. Iniziale

Inserisci Libbra.it fra i preferiti (segnalibro)

Aggiungi a Preferiti

Segnala Libbra.it ad uno o più amici

Consigliaci ad amici

 

 

staff@libbra.it RPS 98.3 FM RCA Sud  
Libbra.it - Più peso alle... Idee!