Questo articolo è stato pubblicato, come sempre, sul mio Sito, nella mia Newsletter Substack e su quella in Linkedin.
Dai che ce lo siamo chiesto in tanti, vero?
Google se ne accorge se i testi sono scritti da ChatGPT o altri sistemi basati sull’AI?
E come molte cose sull’internet contemporaneo, ci si schiera da una parte e dall’altra, anche se fondamentalmente la statistica è inquinata da un sacco di gente che non avendo proprie piattaforme editoriali si schiera per il SÌ senza starci troppo a pensare.
Avviene spesso, se si intravede un vantaggio economico per qualcuno, allora strali e saette.
A seguire anche i giornali, come l’esempio qui sotto: è curioso leggere che in un mondo devastato dall’inquinamento, la pandemia e una guerra alle porte dell’Europa, “l’allarme” riguardi un’app che scrive i testi.
Al netto della colorita introduzione, se si è “nel giro” dei SEO bravi, e si seguono le conversazioni in merito alla Search Engine Optimization, si è al corrente del fatto che la generazione di testi con sistemi basati sull’AI esisteva già da diverso tempo, prima che ChatGPT diventasse “di moda”.
Tanto da resistere anche a diversi aggiornamenti dell’algoritmo di Google.
Ovviamente io essendo una sorta di San Tommaso nerd ho voluto testare di persona su alcune parole chiave che secondo gli strumenti di analisi keywords di Google Ads, dovrebbero avere un volume di ricerca mensile tra le 100.000 e il Milione.
Sulle Serp sono presenti diversi siti competitor, di cui uno principale che assorbe ad occhio circa il 95% di questo traffico.
L’url del sito l’ho impostato su una keyword secondaria, aggiungendo quella principale (del principale competitor) nei metadati della home e nei testi.
Il resto delle pagine, il grosso del sito, sono state scritte al 98% da ChatGPT.
Prima di arrivare ai risultati del test, una piccola precisazione circa il funzionamento di ChatGPT: è bene scrivere in inglese altrimenti, anche alla richiesta esplicita della stesura di un articolo, il limite si aggira intorno alle 300 parole nella versione free, una cosa che può andar bene per le Taxonomy Pages, non certo per Pillar Content o simili.
In generale l’inglese con ChatPGT assicura un risultato migliore, anche in termini di “ragionamento” dietro l’output prodotto.
C’è anche da dire che questo esperimento parte addirittura con un handicap: non si tratta di una nicchia o di un argomento nuovo, internet è pieno di pagine sugli argomenti trattati dal mio sito esperimento, quindi non sto aggiungendo nulla di nuovo.
Questo condiziona Google in un certo qual modo, se non altro nella recezione dei nuovi articoli e nella conseguente indicizzazione, ma c’è anche da dire che data una struttura per cui:
- Primo obiettivo: indicizzazione home per keywords (2) principali.
- Secondo obiettivo: indicizzazione dei contenuti in grado di raccogliere il grosso del traffico (sempre nell’ordine di 100.000 / 1 Milione ricerche mese).
- Terzo obiettivo: indicizzazione contenuti Day by Day.
Possiamo tranquillamente affermare che i primi due obiettivi sono raggiunti, con il primo ovviamente in progress, ad ora siamo nella “top 30” su circa 41.600.000 risultati.
Nel terzo obiettivo, Google si sta dimostrando “pigro” nell’indicizzare i contenuti, ed è lì in realtà che risiedono i contenuti originali, quelli non scritti dall’AI, e in Google Search Console si possono ritrovare spesso nei contenuti non indicizzati, segno che l’origine dei testi non sta ad oggi rivestendo un’importanza primaria nella scelta di Google di indicizzare o meno un contenuto.
L’arco temporale su cui si sta svolgendo l’esperimento si divide in due fasi, la prima in cui alcuni contenuti per la “startup” del sito sono stati scritti di pugno, la seconda (dalle vacanze di Natale in poi) in cui la produzione di contenuto è stata appaltata interamente a ChatGPT.
Ricordo che il primo giorno della seconda fase ho messo online circa 30 articoli in un solo pomeriggio.
Quindi partendo da Gennaio ho affidato a Semrush il tracking dei progressi, impostando anche un trigger alert se il sito avesse scalato più di 5 posizioni sia in senso positivo che negativo.
Qui sotto uno dei primi alert, che mi avvisa del fatto che la home del sito, per le due principali parole chiave, ha scalato rispettivamente 61 posizioni per la keyword secondaria e 56 posizioni per quella principale (quella del principale competitor).
Il giorno dopo, vengo avvisato che c’è stato un balzello ulteriore, portandomi ancora più in alto.
Quello era il periodo in cui ho dato più continuità alla produzione di contenuto, e Google ovviamente l’ha apprezzato, successivamente ho allentato un po’ la presa per vedere le reazioni del motore di ricerca, complice anche l’aumento del carico di lavoro su diverse attività e numerose ore di formazione in azienda.
Google a quel punto decide che, come in un moderno Gioco dell’Oca, sulla keyword che sto insinuando al principale competitor, dovevo tornare da capo, con un push back di oltre 70 posizioni.
Mica male amico.
Di lì ho prodotto e pubblicato non più di 1 o 2 contenuti a settimana, tanto per mantenere vivo un minimo di ping al motore di ricerca ed evitare altri scossoni, e le cose sono riprese come in precedenza, con una scalata che per forza di cose ora si fa più lenta vuoi per la produzione minore di contenuti, vuoi perchè comunque ci si avvicina sempre più alla vetta e lì le cose si fanno più difficili.
Dato anche il fatto che la link building per questo sito esperimento è praticamente inesistente, ho solo inserito il sito in un paio di directory (SEO anni 90, lacrimuccia?) e linkato lo stesso da un paio di miei siti che sono lì fermi già da un po’.
Qui sotto uno degli ultimi alert che mi comunicano “ufficialmente” che piano piano il sito sta guadagnando terreno verso la vetta, i seguenti vedono l’alternanza di gain e perdite di posizione minime rispetto alle precedenti e mai in doppia cifra, la vetta è così.
Quindi ad oggi, posso affermare con relativa certezza che Google ancora non si accorge della provenienza dei testi, e che se su qualche giornale saltano fuori fantomatiche “app per smascherare” l’AI, siano solo hype momentanei senza capo nè coda: per poter verificare che un testo sia stato scritto da ChatGPT ad esempio, presumo che un qualsiasi tool, compreso Google, debba interfacciarsi con ChatGPT stessa via API e provare a indovinare il prompt che ha dato vita al contenuto per poi confrontarlo con quello in rete.
Possibilità che questo accada in breve tempo: zero.
Avete altro da aggiungere? Non ho voluto dilungarmi dando spazio solamente a dati e sperimentazioni, per cui attendo i vostri commenti.
Se invece volete saperne di più su come impiegare l’AI generativa in azienda, parliamone, possiamo sicuramente organizzare delle sessioni formative in tal senso.