220px-Dr._Strangelove_-_Group_Captain_Lionel_Mandrake

Google Penguin, come imparai a non preoccuparmi e ad amare Matt Cutts: unusual linking pattern

5 Flares 5 Flares ×

L’animaletto dell’anno in ambito SEO sembra essere diventato il pinguino, e non mi riferisco all’eterno nemico di Batman: parlo del nuovo update di Google che sta costellando i pensieri dei webmaster da qualche giorno, e che tormenta le notti insommi di molteplici esperti che non sempre usano tecniche pulitissime per promuovere un certo sito.

 Alcuni diritti riservati a xrayspx

Nell’ambito di quello che – forse con una qualche carenza di realismo, verrebbe da dire – viene definito un piccolo passo per un uomo, un balzo da gigante per l’umanità“(N. Armostrong)un ulteriore passo per ricompensare i siti di qualità“, Matt Cutts introduce il noto problema del webspam (e buonasera), con particolare riferimento a keyword stuffing (oddio, no…) e i “cari” vecchi schemi di link. Mentre una bellissima fanciulla passa sul ring, a questo punto, recando un cartello con su scritto “benvenuti nel 1999“, questo sostanziale amarcord del noto ingegnere di Google sembra introdurci nell’ennesimo manifesto di buoni propositi per il quale non appare scontato trovare una corrispondenza nella realtà. L’unica cosa davvero interessante, di fatto, viene riferita con il nome suggestico di “unusual linking pattern“, che descriverò a breve.

COSA SI E’ DETTO SUL PINGUINO FINORA?

Del resto si sono già sprecate le prime considerazioni ed interpretazioni/congetture sull’argomento, e riporto – senza commentare – le più stimolanti o clamorose di seguito (“clamorose” non vuole dire “veritiere“: per fortuna l’italiano è una lingua ricca di sfumature…):

  • Robin Good ha proposto un’analisi molto approfondita su un campione di siti penalizzati (presumibilmente) e graziati dal pinguino; di fatto essi “ricevono moltissimi  link con “frasi-chiave” specifiche nell’anchor text”. Verrebbe quasi di beatificare, in quest’ottica, chi ci parlò degli unrelated backlink a suo tempo (non ero d’accordo con quell’approccio e lo scrissi).
  • SEOBlog di Taverniti analizza l’articolo di Cutts invitando alla cautela assoluta, prima di azzardare relazioni di causa-effetto (come al solito) campate in aria.
  • Search Engine Watch arriva invece ad individuare cinque tipologie di profili di link a rischio.
  • Search Metrics, tanto per (non) cambiare, stila la solita lista dei vincenti / perdenti, riportando statistiche annesse al proprio indice di ricerca.
  • Ricordando che non c’è modo di individuare con certezza se un sito sia colpito da Penguin, Search Engine Land propone inoltre delle “cure” per una malattia che potrebbe essere, in molti casi, semplice ipocondrìa.
  • La mia preferita, infine, con un certo ironico nichilismo afferma – e in un certo senso sono d’accordo – che Google non esiste, se preferite “come imparai a non preoccuparmi di Google e delle cose che dice in giro“. Di fatto, sarcasmo a parte,  tutte queste informazioni diventano di fatto inutili per la maggioranza di noi, perchè fanno riferimento a casi diversi, mettono TUTTO nello stesso calderone e generano paranoie facendo ragionare poco sulla logica effettiva del proprio sito web.

Non finisce qui: dulcis in fundo, c’è chi ha proposto un tool per analizzare i backlink del proprio sito e capire se si è stati colpiti da Penguin, sulla base di un’analisi delle ancore testuali. Quale sia il motivo per metterle in ballo, non mi è chiaro per nulla. E poi, devo ammetterlo: ho poca voglia di fornire la lista dei miei backlink a degli sconosciuti, e dubito per tale motivo che proverò a fare il test sui miei siti, sperando che gli autori nel frattempo perdoneranno la mia diffidenza nei loro confronti. Nulla di personale, sia chiaro, ma io stesso evito di divulgare tutto quello che faccio sul blog, e sono del tutto estraneo al moralismo falsamente “open” di chi dice tutto, ogni volta, senza dire nulla.

UNUSUAL LINKING … CHI?!

Unusual linking pattern“, dicevamo: superato lo scoglio di passare in rassegna i principali commenti dei vari esperti, proviamo a fare tabula rasa e atteniamoci a quanto ci comunica Google in via ufficiale. I pattern inusuali del titolo, a quanto emerge, sembrano essere collegamenti a siti di natura apparentemente:

  • duplicata (etteparèva);
  • ridondante;
  • non utili ad un approfondimento del testo.

Questo, se ci pensate, si ricollega al concetto basilare del “link come citazione“, cioè: più ti citano, più sei accreditato e degno della prima pagina, abusato spesso e volentieri dalle tecniche di black hat - oltre che alla base dell’idea ingenua di “gonfiare” il PageRank mediante link dofollow, ad esempio. Se Google castiga i link “unusual” significa che, logicamente, sa anche cosa sia “usual” nel testo di una pagina, quindi sa che le pagine buone tendono a linkare contenuti in un “insieme di modi” accettabili, determinati ad es. ad un buono stile di scrittura (sto semplificando ma il nocciolo è questo, a quanto pare).

Annuncio: SupportHost.it, hosting per il tuo sito a partire da 29 € / anno

Questo perchè, come insegna l’information retrieval, il rank di un documento è stabilito non localmente o sulla base di parametri “secchi” (tipo “il numero di link che ci citano”, “la media pesata della qualità dei link che ti citano”), bensì in base ad una complessa analisi globale dei contenuti “simili” all’interno dell’indice (ad es. l’insieme dei portali che recensiscono hosting è plausibile che fornisca indicazioni qualitative a tutti i siti che presentano contenuti del genere).

Ma cosa ha scritto Cutts a riguardo?

  1. Search Engine Optimization non è il Male, se viene intesa come incremento della reperibilità di un sito web da parte degli utenti; la sua variante white hat che velocizza le pagine e tenta il consueto “create great content” (mi piace lasciarlo in inglese) il quale porta tanti backlink naturali (da Yahoo! Answers e/o da altri blog, ad es.).
  2. Chi fa webspam non beneficia gli utenti, ma li prende semplicemente in giro manipolando i risultati di Google ricorrendo a keyword stuffing e link schemes. Egli sarà punito dalla mano divina (risata malefica, a questo punto), anche se molti miscredenti continuano a non crederci.
  3. I “good guys” saranno premiati per la loro onestà (… presto); una promessa misticheggiante che ricorda un po’  il Salmo 37: “Beati i miti, perchè erediteranno la terra”.
  4. I siti passibili di penalizzazioni per il nuovo update sono quelli che violano le linee guida di qualità di Google: ma questo, in fondo, lo sappiamo da  anni. Dov’è la novità? Comportamente scorretti sono considerati, ricordiamo, non fare cloaking, non usare testi nascosti, evitare parole chiave in sovrabbondanza, evitare doorway, non diffondere virus, inserire affiliazioni pertinenti al il tuo target (esempio: non usare banner di macchine da cucire in un sito che parla di death metal melodico).
  5. A questo punto Cutts non può dirci di più per ovvie ragioni (“While we can’t divulge specific signals because we don’t want to give people a way to game our search results and worsen the experience for users“), pero’ ci propone due esempi negativi estremi. Nel primo ci mostra un caso di articolo che ripete continuamente la frase “no hands SEO” – guarda mamma, vado in bici “senza mani”! – dentro un testo grezzo e non formattato; nel secondo si fa riferimento ai meno eclatanti “unusual linking patterns” di cui sopra, ovvero link contenuti all’interno di un testo che siano scorrelati rispetto allo stesso. L’esempio è difficile da descrivere, ma si può riassumere in un caso limite che ricalco in italiano di seguito.

Quando ti alzi la mattina, non c’è nulla di meglio che una sana tisana verde; apri la finestra di casa tua e scopri che è una bella giornata! Cielo azzurro, aria fresca e pulita: ma chi te la fa fare di andare in ufficio? Non sarebbe meglio lavorare nel bosco con la tua fidata wireless? Del resto quella buona tisana ti ha avvisato che è ora di darci dentro, uomo o donna che tu sia.

Chiaro il concetto? Il punto è che i due link hanno ancore uguali o simili, e non sono utili rispetto al testo, quindi il tutto diventa deprecabile per questo motivo. Attenzione che non è dato sapere a cosa puntino quei link (pagine diverse, siti diversi, ecc.), ma sembrerebbe esistere una sorta di limite superiore (dettato, se non altro, dal buonsenso di chi scrive) al numero di link esterni in un’unità di testo; ed è qui escono fuori le novità reali, secondo me. Si tratterebbe di penalizzare il sito A che da’ link a casaccio – gli articoli di quel tipo sono frequenti nei portali di article marketing – e, probabilmente, il sito B che li riceve in quantità “eccessiva” – se uno ad esempio abusa di article marketing.

Pero’ se fosse vera la seconda ipotesi, un competitor cinico potrebbe facilmente massacrarci usando questa tecnica. Google lo sa, quindi prenderà in considerazione la cosa soltanto in certe circostanze: e infatti la modifica algoritmica tocca ufficialmente solo il “3.1% delle query in inglese, ad un livello che l’utente medio potrebbe notare“. Inoltre si fa riferimento a 3 query su 100 per tedesco, cinese e arabo – l’italiano non è menzionato, anche se Cutts scrive che si propagherà su tutte le lingue in contemporanea. È appena il caso di osservare che una percentuale di appena il 3% delle query mondiali è come un “sassolino nel lago”, che potrebbe non riguardare neanche di striscio molti di noi. Fine della predica, non c’è altro in quel post tanto linkato, discusso e (poco) letto in questi giorni.

Da informazioni così sintetiche, dunque, arrivare a determinare con allarmismo casistiche, casi limite, malattie ed addirittura cure mi sembra eccessivo, e dettato – lo scrivo senza peli sulla lingua – da mere esigenze di marketing. Come diamine è possibile – mi chiedo, in altri termini – che si sia arrivati a scrivere quello che ho letto sull’argomento? Prendete provvedimenti, cambiate link, controllate i backlink… ma perchè? Cosa c’entrano e in che misura sono coinvolte le àncore (l’esempio di Cutts, non a caso, è un’immagine non clickabile proprio per non dare troppo indizi)? Francamente non lo capisco, e pur senza mettere malafede ad ogni costo ho l’impressione che troppi di noi si stiano (pre)occupando del nulla, come già fatto per Panda un anno fa – invece di pensare al sano “good content“. Staremo a vedere, ma sono abbastanza sicuro che i margini di discussione siano quasi sempre semplici congetture.

(ultimo aggiornamento articolo: 7 maggio 2012)

Search engine optimization includes things as simple as keyword research to ensure that the right words are on the page, not just industry jargon that normal people will never type (M. Cutts)

Immagine dell’articolo tratta da Wikipedia

5 Flares Twitter 0 Facebook 0 Google+ 5 LinkedIn 0 5 Flares ×
  • Gabriele Rossini

    Il miglior articolo sui pinguini che abbiamo mai letto merita un +1, un Like, un Tweet e anche un Pin! :)

    Però un backlink, che è la forma più utile di condivisione dall’alba dei motori di ricerca, non te lo mando perché non so che Anchor Text hanno utilizzato gli altri utenti che ti hanno linkato e quindi non voglio correre il rischio di penalizzarti per Keyword che portano traffico a questo articolo. :) :)

    Comunque, tornando al lato utile dell’articolo, mi piacerebbe sapere cosa ne pensi del “Reverse SEO” e dei test che sono stati fatti per portare penalizzazioni lievi, quindi per singole parole chiave, anche su domini autorevoli.

    • http://salvatorecapolupo.it/ Salvatore Capolupo

      Ciao Gabriele, e grazie mille delle tue belle parole :-)

      Sul reverse SEO mi cogli vagamente impreparato, anche se devo riconoscere che l’idea di riuscire davvero a penalizzare domini grossi “giocherellando” con link e aggeggini annessi mi disturba alquanto, non posso credere che non abbiano preso contromisure perquesti casi… in linea di massima faccio dominare lo scetticismo sull’argomento reverse (engineering inclusa), più che altro mi chiedo come queste micro-penalizzazioni siano state provate, sarebbe interessante partire da questo a mio parere. A risentirci, Sal

  • http://twitter.com/benedettomotisi SEOJedi

    Ciao Salvatore,
    C’è poco da fare, io stimo sempre più la tua lucidità di pensiero.
    Non entro nel dettaglio del Penguin Update perché personalmente ho ancora troppi pochi dati (ne sto raccogliendo in vista di un webinar ad hoc il 24 maggio) ma condivido una parte in particolare del tuo post.

    Quando affermi che, in fondo, è da anni che sappiamo che basta seguire le linee guida di Google. In realtà, per certe SERP, puoi fare comunque i tuoi porci comodi, ma qua si apre un altro capitolo.

    IMHO, di Search Engine Land, mi è piaciuta l’idea di un “Google ciclico” che rompe una situazione iniziale — > calo di ranking — > buzz in rete con vespaio SEO, compreso di infoprodotti —> ripristino della situazione iniziale –> rewind.

    Ora, se il Panda e il Pinguino stanno assumendo le stesse mitologiche fattezze di Grifoni e Manticore non lo so, ma il modo di porsi mi pare uguale alla Games Workshop, la famosa ditta di wargames per anni monopolista del settore, non so se l’hai presente. Quelli di Warhammer.

    Da vecchio giocatore, notavo come lo schema adottato da GW per mantenere vivo il suo settore fosse una versione 1.0 di quello di Google: c’era il regolamento base con gli eserciti — > rottura della situazione iniziale nella quale si scoprivano buchi nel regolamento / la ditta faceva uscire una nuova versione — > buzz fra i giocatori con conseguente acquisto di nuove miniature di nuove unità — > rewind.

    Ora, le due situazioni mi sono sembrate un po’ simili. Ci sarà sempre una SERP dove, Panda o Pinguino che sia, finisce che un MFA guadagna posizioni; così come in Warhammer trovavi sempre l’unità stronza in ogni caso.

    Questo è un incentivo in più a studiare e analizzare sempre meglio le singole casistiche. Tutto il resto, è chiacchiere da SEOBar ;)

    • http://salvatorecapolupo.it/ Salvatore Capolupo

      sì capisco e condivido quello che intendi, è plausibile che si siano “buchi” che vengono colmati volta per volta.. esattamente come in un software qualunque o un videogame. Su Penguin c’è poco da sapere, secondo me, basta leggersi l’articolo di Cutts, neanche uno dei suoi migliori tra l’altro… il resto sono congetture e filosofie dei massimi sistemi.

      Diciamo che qui mi sono concetrato su un aspetto molto importante, cioè chiedersi: PERCHE’ da una paginetta tutto sommato scarna come quella di Cutts si arriva a pensare addirittura alla conformazione delle ancore? È un’enormità, non riesco a trovare una logica in questo ragionamento, anzi per la verità una l’ho trovata: MARKETING.

      Seomoz magari pone il discorso seriamente, altri come Search Metrics pubblicano statistiche tanto per darsi ragione da soli – la dico brutale, ma secondo me è così. Il punto è che questi hint si diffondo viralmente e danno adito ad ulteriori casini SEO che finisco per complicare le cose, tanto che molta gente non legge il WM blog ufficiale e da’ credito ciecamente ad uno di quelli linkati, sulla base della… simpatia. È chiaro che così non se ne esce…