robots.txt per la SEO di un e-commerce Magento
Il file robots.txt è molto importante per l'indicizzazione del tuo e-commerce Magento.Tramite questo file è possibile "istruire" corretamente i crawler dei motori di ricerca per una corretta indicizzazione dei file del tuo sito web.
Puoi escludere cartelle, includerne altre e dare ulteriori informazioni per la lettura del sito.
In pratica i benefici ottenibili sono 2:
- Evitare l'indicizzazione di contenuti duplicati;
- Nascondere i file e le cartelle relativi a contenuti "tecnici" (repository .git, cartella admin, etc..)
Ecco un esempio di un file robots.txt per Magento opportunamente commentato:
## IMPOSTAZIONI GENERALI
## Abilita le regole del robots.txt per tutti gli spider dei motori di ricerca
User-agent: *
## Parametro Crawl-delay: il numero di secondi di attesa tra una richiesta e l'altra allo stesso server
## Questo parametro è molto utile per ridurre la frequenza delle richieste dei crawler, che talvolta possono creare problemi di traffico al server.
Crawl-delay: 30
## Sitemap: inserisci l'indirizzo della sitemap del tuo sito web
Sitemap: http://www.miosito.com/sitemap/sitemap.xml
## IMPOSTAZIONI PER SITI IN SVILUPPO
## Non navigare le cartelle dei repository (CVS, snv, .git, etc..), gli ambienti di sviluppo (phpStorm, Netbeans, etc..) e i dump del db (.sql, tgz, etc..)
Disallow: /CVS
Disallow: /*.svn$
Disallow: /*.idea$
Disallow: /*.sql$
Disallow: /*.tgz$
Disallow: /*.git$
## LE IMPOSTAZIONI PRECEDENTI SONO GENERALMENTE VALIDE ANCHE PER ALTRE PIATTAFORME COME JOOMLA, DRUPAL, ETC..
## IMPOSTAZIONI DI MAGENTO
## NON NAVIGARE LA CARTELLA ADMIN
Disallow: /admin/
## NON NAVIGARE LE CARTELLE DI SISTEMA DI MAGENTO
Disallow: /app/
Disallow: /downloader/
Disallow: /errors/
Disallow: /includes/
Disallow: /lib/
Disallow: /pkginfo/
Disallow: /shell/
Disallow: /var/
## NON NAVIGARE I FILE DI SISTEMA DI MAGENTO
Disallow: /api.php
Disallow: /cron.php
Disallow: /cron.sh
Disallow: /error_log
Disallow: /get.php
Disallow: /install.php
Disallow: /LICENSE.html
Disallow: /LICENSE.txt
Disallow: /LICENSE_AFL.txt
Disallow: /README.txt
Disallow: /RELEASE_NOTES.txt
## MIGLIORAMENTI ALLA SEO DI MAGENTO
## NON NAVIGARE LE PAGINE DELLE SOTTOCATEGORIE CHE VENGONO FILTRATE O ORDINATE
Disallow: /*?dir*
Disallow: /*?dir=desc
Disallow: /*?dir=asc
Disallow: /*?limit=all
Disallow: /*?mode*
## NON NAVIGARE IL DUPLICATO DELLA HOME SU INDEX.PHP. QUESTA IMPOSTAZIONE VA INSERITA SOLO SE E' STATA IMPOSTATA L'OTTIMIZZAZIONE SEO DEGLI URL DI MAGENTO
Disallow: /index.php/
## NON NAVIGARE I LINK CHE CONTENGONO L'ID DI SESSIONE
Disallow: /*?SID=
## NON NAVIGARE NELLE CARTELLE Do not crawl checkout and user account pages
Disallow: /checkout/
Disallow: /onestepcheckout/
Disallow: /customer/
Disallow: /customer/account/
Disallow: /customer/account/login/
## NON NAVIGARE PAGINE DI RICERCA E PAGINE DEL CATALOGO NON OTTIMIZZATE PER LA SEO
Disallow: /catalogsearch/
Disallow: /catalog/product_compare/
Disallow: /catalog/category/view/
Disallow: /catalog/product/view/
## IMPOSTAZIONI DEL SERVER
## NON INDICIZZARE FILE E CARTELLE DI SISTEMA DEL SERVER
Disallow: /cgi-bin/
Disallow: /cleanup.php
Disallow: /apc.php
Disallow: /memcache.php
Disallow: /phpinfo.php
## NON INDICIZZARE LA PAGINA 404
Disallow: /404/
Per attivare queste opzioni puoi copiare e incollare le istruzioni che trovi qui sopra in un file, nominarlo come robots.txt e inserirlo nella root del tuo sito Magento
Per saperne di più:
http://www.robotstxt.org/
Nessun commento:
Posta un commento