Robots.txt e .htaccess con All in One SEO: Configurazione Avanzata
I file robots.txt e .htaccess sono due elementi fondamentali della SEO tecnica che controllano rispettivamente come i motori di ricerca interagiscono con il tuo sito e come il server web gestisce le richieste. Una configurazione errata di questi file può causare problemi gravi, dalla deindicizzazione accidentale di pagine importanti fino a errori del server che rendono il sito inaccessibile. All in One SEO mette a disposizione strumenti integrati per gestire entrambi i file in modo sicuro e professionale. In questa guida vedremo come utilizzarli correttamente.
Cos’è il File Robots.txt
Il file robots.txt è un file di testo posizionato nella directory root del tuo sito web che fornisce istruzioni ai crawler dei motori di ricerca su quali aree del sito possono o non possono scansionare. È il primo file che i crawler visitano quando accedono a un sito e le sue direttive vengono generalmente rispettate da tutti i motori di ricerca principali, inclusi Google, Bing e Yahoo.
È fondamentale comprendere che il robots.txt non è uno strumento di sicurezza. Le direttive Disallow impediscono ai crawler di scansionare determinate pagine, ma non le rendono invisibili. Se altre pagine linkano a una URL bloccata dal robots.txt, Google potrebbe comunque indicizzarla mostrando solo l’URL senza snippet. Per impedire completamente l’indicizzazione di una pagina, devi utilizzare il meta tag noindex, configurabile tramite le impostazioni AIOSEO di ogni singolo contenuto.
Il Robots.txt Predefinito di WordPress
WordPress genera automaticamente un robots.txt virtuale che contiene le direttive di base. Questo file virtuale permette la scansione della maggior parte del sito ma blocca l’accesso alla directory /wp-admin/. Tuttavia, il robots.txt virtuale di WordPress è piuttosto basilare e non offre il livello di controllo necessario per un’ottimizzazione SEO professionale.
Con AIOSEO puoi sostituire il robots.txt virtuale con un file personalizzato che offre un controllo molto più granulare. Questo ti permette di bloccare directory specifiche, consentire l’accesso a risorse necessarie per il rendering e aggiungere riferimenti alla sitemap.

Configurare il Robots.txt con AIOSEO
Per modificare il robots.txt tramite AIOSEO, vai su AIOSEO > Strumenti > Robots.txt Editor. Qui troverai un editor visuale che ti permette di aggiungere, modificare ed eliminare le regole del robots.txt senza dover modificare manualmente il file. L’interfaccia mostra le regole in un formato tabellare con colonne per User-Agent, Direttiva (Allow/Disallow) e Percorso.
Per aggiungere una nuova regola, clicca su Aggiungi regola e compila i tre campi. Lo User-Agent specifica a quale crawler si applica la regola (* per tutti i crawler, Googlebot per solo Google, Bingbot per solo Bing). La Direttiva può essere Allow (permetti) o Disallow (blocca). Il Percorso è la directory o il pattern URL da bloccare o consentire.
Regole Consigliate per il Robots.txt
Ecco una configurazione robots.txt ottimale per la maggior parte dei siti WordPress. Queste regole rappresentano le best practice consolidate della SEO tecnica:
Bloccare /wp-admin/: la directory di amministrazione non deve essere scansionata dai crawler. Tuttavia, è importante permettere l’accesso a /wp-admin/admin-ajax.php, che è necessario per il corretto funzionamento di molti plugin e temi che utilizzano AJAX per caricare contenuti.
Bloccare /wp-includes/: questa directory contiene file di sistema di WordPress che non hanno valore SEO. Tuttavia, alcune risorse CSS e JavaScript necessarie per il rendering delle pagine risiedono qui, quindi valuta caso per caso se bloccarla completamente.
Bloccare i parametri di ricerca: le pagine di ricerca interna (/?s=) generano contenuti dinamici che possono creare problemi di contenuto duplicato. Bloccale con la regola Disallow: /?s=.
Bloccare le pagine di login e registrazione: le URL /wp-login.php e /wp-register.php non devono essere indicizzate. Bloccale nel robots.txt e imposta anche il noindex tramite AIOSEO.
Includere il riferimento alla Sitemap: aggiungi in fondo al robots.txt la riga Sitemap: https://tuosito.it/sitemap.xml per indicare ai crawler la posizione della tua sitemap XML. AIOSEO aggiunge automaticamente questo riferimento se la sitemap è attiva.
Cos’è il File .htaccess
Il file .htaccess (Hypertext Access) è un file di configurazione del server web Apache che controlla il comportamento del server per la directory in cui si trova e per tutte le sottodirectory. Su WordPress, il file .htaccess viene utilizzato principalmente per gestire i permalink (URL permanenti), ma può essere configurato per implementare redirect, regole di sicurezza, compressione, caching e molto altro.
A differenza del robots.txt, che è un semplice file di testo con direttive per i crawler, il .htaccess è un file di configurazione del server con una sintassi specifica. Errori nella configurazione del .htaccess possono causare errori 500 del server, rendendo il sito completamente inaccessibile. Per questo motivo, è fondamentale procedere con cautela e fare sempre un backup prima di qualsiasi modifica.
L’Editor .htaccess di AIOSEO
AIOSEO include un editor integrato per il file .htaccess accessibile da AIOSEO > Strumenti > .htaccess Editor. Questo editor mostra il contenuto attuale del file e ti permette di modificarlo direttamente dalla dashboard di WordPress, senza dover accedere al server tramite FTP.
L’editor di AIOSEO crea automaticamente un backup del file .htaccess prima di ogni modifica, permettendoti di ripristinare la versione precedente in caso di problemi. Questa funzionalità di sicurezza è fondamentale perché un errore nel .htaccess può rendere il sito inaccessibile, impedendoti di accedere alla dashboard per correggere l’errore.

Configurazioni .htaccess Utili per la SEO
Ci sono diverse configurazioni .htaccess che possono migliorare la SEO e le prestazioni del tuo sito. Ecco le più importanti:
Redirect da www a non-www (o viceversa): è fondamentale che il tuo sito sia accessibile da una sola versione dell’URL. Se il sito è raggiungibile sia da www.tuosito.it sia da tuosito.it, i motori di ricerca potrebbero interpretarle come due siti distinti, diluendo l’autorità. Configura un redirect 301 dalla versione non preferita a quella preferita.
Forzare HTTPS: se il tuo sito ha un certificato SSL, assicurati che tutte le richieste HTTP vengano reindirizzate a HTTPS. Questo è un fattore di ranking confermato da Google e migliora la sicurezza del sito. La regola .htaccess per forzare HTTPS utilizza il modulo mod_rewrite per intercettare le richieste HTTP e reindirizzarle alla versione sicura.
Compressione GZIP: abilitare la compressione GZIP riduce significativamente la dimensione dei file trasferiti dal server al browser, migliorando la velocità di caricamento. Puoi abilitarla aggiungendo le direttive mod_deflate nel .htaccess. Nota: se utilizzi un plugin di caching come WP Rocket, questa configurazione potrebbe essere già gestita dal plugin.
Browser caching: configurare gli header di cache permette ai browser di memorizzare localmente le risorse statiche (immagini, CSS, JavaScript), riducendo i tempi di caricamento per le visite successive. Le direttive mod_expires nel .htaccess definiscono per quanto tempo ogni tipo di risorsa deve essere memorizzata nella cache del browser.
Redirect 301 tramite .htaccess
I redirect 301 (redirect permanenti) sono fondamentali quando cambi la struttura degli URL del tuo sito, elimini pagine o migri da un altro dominio. Un redirect 301 comunica ai motori di ricerca che la pagina si è spostata definitivamente a un nuovo URL, trasferendo la maggior parte dell’autorità SEO alla nuova destinazione.

Sebbene AIOSEO Pro offra un Redirect Manager dedicato (che vedremo in un articolo separato), è utile sapere che i redirect possono essere implementati anche direttamente nel .htaccess. La sintassi base è Redirect 301 /vecchio-percorso https://tuosito.it/nuovo-percorso. Per redirect più complessi con pattern e variabili, si utilizzano le regole RewriteRule del modulo mod_rewrite.
Bloccare Bot Malevoli e Spam
Il file .htaccess può essere utilizzato per bloccare bot malevoli, scraper e crawler di spam che consumano risorse del server e possono compromettere le prestazioni del sito. Puoi bloccare specifici User-Agent, indirizzi IP o intervalli di IP che generano traffico indesiderato.
Tuttavia, è importante procedere con cautela per non bloccare accidentalmente crawler legittimi o utenti reali. Prima di aggiungere regole di blocco, verifica nei log del server quali User-Agent o IP stanno generando traffico anomalo e assicurati che non si tratti di crawler dei motori di ricerca o di servizi legittimi.
Proteggere il File wp-config.php
Il file wp-config.php contiene le credenziali del database e altre informazioni sensibili del tuo sito WordPress. Sebbene il server web non serva normalmente i file PHP come testo, è una buona pratica aggiungere una regola .htaccess che blocca esplicitamente l’accesso a questo file. AIOSEO non gestisce direttamente questa configurazione, ma puoi aggiungerla tramite l’editor .htaccess del plugin.
Errori Comuni e Soluzioni
L’errore più comune nella configurazione del robots.txt è bloccare accidentalmente risorse necessarie per il rendering delle pagine. Se blocchi file CSS o JavaScript nel robots.txt, Google non sarà in grado di renderizzare correttamente le tue pagine e potrebbe penalizzare il posizionamento. Utilizza lo strumento "Ispezione URL" di Google Search Console per verificare che Google riesca a visualizzare correttamente le tue pagine.
Per quanto riguarda il .htaccess, l’errore più frequente è un errore di sintassi che causa un errore 500 Internal Server Error. Se dopo una modifica al .htaccess il sito diventa inaccessibile, collegati al server tramite FTP, rinomina o elimina il file .htaccess e il sito tornerà online. Poi ricrea il file con le regole corrette, testando una modifica alla volta.
Un altro errore comune è creare loop di redirect nel .htaccess, dove una regola reindirizza a un URL che viene a sua volta reindirizzato dalla stessa o da un’altra regola, creando un ciclo infinito. I browser mostrano l’errore "Too many redirects" in questo caso. Per evitare i loop, utilizza sempre le condizioni RewriteCond per limitare l’applicazione delle regole.
Testare le Modifiche
Prima di applicare modifiche al robots.txt o al .htaccess di un sito in produzione, è consigliabile testare le modifiche in un ambiente di staging. Se non hai un ambiente di staging, testa le modifiche una alla volta, verificando dopo ogni modifica che il sito funzioni correttamente e che le pagine siano raggiungibili.
Per il robots.txt, puoi utilizzare lo strumento Robots Testing Tool di Google Search Console per verificare che le tue regole funzionino come previsto. Inserisci un URL e lo strumento ti dirà se quel URL è bloccato o consentito dalle regole del tuo robots.txt.
Best Practice e Raccomandazioni
Per il robots.txt, mantieni le regole semplici e chiare. Non bloccare risorse necessarie per il rendering. Includi sempre il riferimento alla sitemap. Per il .htaccess, fai sempre un backup prima di ogni modifica. Testa le modifiche una alla volta. Non duplicare funzionalità già gestite da plugin. Utilizza commenti per documentare ogni regola aggiunta. Seguendo queste raccomandazioni, potrai configurare il robots.txt e il .htaccess in modo ottimale per la SEO del tuo sito.
Approfondisci la SEO del tuo sito con le nostre guide su Rank Math, Broken Link Checker e SEO per WooCommerce.
Conclusioni
La corretta configurazione del robots.txt e del .htaccess è un aspetto avanzato ma cruciale della SEO tecnica. All in One SEO semplifica la gestione di entrambi i file con editor integrati, backup automatici e un’interfaccia intuitiva. Se hai bisogno di supporto per la configurazione tecnica del tuo sito WordPress, contatta il nostro team oppure scopri i nostri servizi di posizionamento SEO.
Migliora il Tuo Sito WordPress
Scopri le nostre altre guide dedicate ai migliori plugin e strumenti per WordPress:
- Elementor – Il page builder più utilizzato per creare pagine professionali senza codice
- WP Rocket – Il plugin di caching premium per velocizzare il tuo sito WordPress
- SEOPress – Un’alternativa leggera e potente per la SEO del tuo sito
- UpdraftPlus – La soluzione più affidabile per il backup automatico di WordPress