Query the obscure Ottenere una migliore comprensione delle domande è di massima priorità nell’industria della ricerca.

Quando si tratta di ricerche comuni che si ripetono milioni di volte come “Britney Spears” o “Veicoli Ibridi”, restituire i risultati, o le pubblicità, più appropriate non è difficile. Ma cosa succede quando le richieste sono eccezionalmente rare e possono non essere ripetute più di una volta? Chiaramente, queste domande sono infinitamente più difficili da capire per il motore di ricerca.

Andrei Broder, Ricercatore Universitario e Vice Presidente di Search Technology and Computational Advertising, e un gruppo di ricercatori di Yahoo! hanno cominciato a studiare questo problema. Il loro lavoro è delineato nel Robust Classification of Rare Queries Using Web Knowledge, apparso nel SIGIR 2007.

Per affrontare la questione, il gruppo Yahoo! ha proposto una metodologia per l’uso dei risultati di ricerca, così come dell’informazione disponibile in rete, come fonte di conoscenza esterna. A questo punto hanno mandato domande rare ad un motore di ricerca ed hanno supposto che la maggior parte dei risultati più alti erano rilevanti per la ricerca. Categorizzare questi risultati ha permesso al gruppo di classificare la domanda originale con molta precisione.

I risultati hanno confermato definitivamente che utilizzare la rete come depositario della conoscenza del mondo apporta preziose informazioni sulla ricerca, e permette la sua corretta classificazione. “Abbiamo scoperto che la miglior fonte di informazione per capire cosa sono queste ricerche rare è guardare i risultati della ricerca,” spiega Broder. “Se guardi ogni pagina risultante come un voto sull’argomento della ricerca, scopri che la maggior parte tende ad essere corretta anche se poi le pagine individuali si sbagliano.”

- Leggi tutto l’articolo
- Scarica