domenica 18 luglio 2010

Hackerato il nuovo algoritmo “Caffeine” di Google

Inserendo “vatican” sulla stringa del motore di ricerca di Google, fino a qualche ora fà si otteneva il link www.pedofilo.com. Irraggiungibile, dopo l'intervento dei tecnici di Mountain Wiew,  l'item (il primo dei risultati) era legato al sito della Santa Sede (The Holy See). I responsabili del sito ufficiale del Vaticano avevano segnalato l'anomalia a Google, che ha lavorato per eliminarla, come ha fatto sapere il direttore della sala stampa vaticana, padre Federico Lombardi.

A quanto pare, non si tratta quasi certamente di un attacco hacker. Piuttosto di una certa conoscenza dei funzionamenti di Google da parte dei creatori della pagina incriminata, per far salire quel particolare sito nella rilevanza del termine di ricerca “Vatican”. A Google hanno comunque ritenuto opportuno esaminare tempestivamente la questione: "Stiamo valutando le cause, non si è trattato necessariamente di un hackeraggio", ha dichiarato l'azienda.


Al momento, il problema non riguarda soltanto la versione italiana del motore di ricerca, ma pedofilo.com, dominio intestato a un messicano che gestisce la società informatica Guionbajo nel Nuevo Leon, risulta al momento completamente inaccessibile. Va detto però, che al momento BigG non ha modificato la peculiare gerarchia dei risultati. Cercando negli archivi di Google, si tratterebbe comunque di un sito di informazione religiosa, niente a che vedere con la pedofilia, ma dal nome di dominio intenzionalmente fuorviante.


Dalle indagini sommarie che si possono fare su internet, pedofilo.com, il sito che Google ritiene con i suoi algoritmi più rappresentativo per la chiave di ricerca "vatican" è stato acquistato nell'aprile 2005 e sembra trasmettere ("is hosted") da Houston negli Stati Uniti. Riuscire a manipolare Google in questi termini è molto grave e il motore di ricerca risulterebbe davvero fragile dopo il lancio del suo nuovo algoritmo Caffeine.


“Caffeine” è un nuovo algoritmo, o meglio, un insieme di algoritmi che, a differenza della precedente famiglia di algoritmi, garantisce risultati ben del 50% più freschi e aggiornati. Il sistema usato dal celebre motore di ricerca per indicizzare la rete era un po’ datato e non riusciva a stare al passo con l’aggiornamento frenetico di nuove forme di comunicazione come blog, post e social network.

Google, in passato, organizzava le informazioni da analizzare per strati e le indicizzava in cicli temporali ben definiti. Per arrivare, però, agli strati più profondi bisognava aspettare un po’ prima di ritrovare i contenuti aggiornati nei risultati. Adesso le informazioni sono suddivise in porzioni più piccole e gli intervalli sono più brevi così da riuscire a stare al passo con il flusso generato dal web, quasi in tempo reale.


Google era stata colpita dal cosiddetto "Googlebombing", l'arte di linkare termini ben specifici con particolari siti web, a scopo di generare un ranking artificioso nelle classifiche di ricerca di Google. Il codice base che scandaglia i risultati dei crawler di BigG fu aggiornato nel 2007. Il nuovo algoritmo di analisi fu pensato in modo da "accorgersi" di eventuali tentativi di Googlebombing, facendosi più acuto ed eliminando alla radice il problema. A quanto pare gli hacker potrebbero non aver mollato la presa ed essersi inventati una nuova tecnologia.

Fonti:  La Repubblica, JacketTech, Punto Informatico
Tags: Attacchi Hacker

Nessun commento:

Posta un commento