[it] The dark side of Google

[English abstract: I read the book The dark side of Google, about some problematic issues of Google. It is interesting, although I have some remarks. ]

Ho letto The dark side of Google, cioè la versione liberamente scaricabile di Luci e Ombre di Google (che nella pagina in inglese viene presentato come Google’s Light and Shadow, opera italiana di autori anonimi.

Punti positivi:

  • la questione privacy (p. 60, ma permea più o meno tutto il libro)
  • la posizione sulla (non) neutralità della tecnologia (p. 76): dipende da coma la usi
  • la riflessione sul motore di ricerca come porta d’accesso alla conoscenza (p. 65): molto interessante, è più comodo usare un motore di ricerca piuttosto che altre risorse, questo modifica il nostro approccio all’informazione e alla conoscenza, quali saranno le conseguenze?
  • l’ammissione (finalmente!) che il mondo virtuale non è affatto virtuale: è digitale, ma reale quanto quello qui fuori (p. 74)
  • il discorso sulla proprietà intelletuale (p. 70), che non è più adatta ai nostri tempi
  • la questione della formazione, cioè della conoscenza per difendersi da abusi che potrebbero venire dall’uso improprio delle tecnologie (ma perché dev’essere “autoformazione”? le scuole fanno tutte così schifo?), p. 76

Punti negativi:

  • a volte c’è troppa ideologia, un po’ tendenziosa (p.es. a p. 55, primo paragrafo), peccato perché offusca i punti positivi di cui sopra
  • non viene rivelato alcun segreto
  • molte critiche potrebbero essere rivolte a qualsiasi azienda del mondo capitalista
  • qualche imprecisione

Forse l’eccesso di ideologia deriva da un equivoco: gli autori hanno una paura eccessiva di Google e affermano che Google millanta risultati democratici, trasparenti ecc. (p. 75). Onestamente, non mi pare proprio. Google è un’azienda che propone sul web un motore di ricerca, cioè nient’altro che un sistema di information retrieval applicato al web. I sistemi di information retrieval sono ben noti da molti anni, molto prima dei motori di ricerca. Essi usano un algoritmo di ranking, cioè il sistema con cui decidono in che ordine proporre i risultati, stimando la rilevanza che i risultati possono avere per la query posta. Nessuno pretende che le risposte a una query abbiano una qualche valenza filosofica, democratica o politica: è un sistema automatico. Vengono usati molti metodi per migliorare la stima della rilevanza, alcuni dei quali prevedono una profilazione dell’utente.
Tra l’altro, si capisce che Google e gli altri motori di ricerca tengano ben nascosto il loro algoritmo di ranking: è il loro segreto industriale, ciò intorno a cui ruota il loro business. E tra l’altro, speculazioni sul ranking esistono da tempo e il New York Times ha recentemente rivelato qualche dettaglio.
Possiamo anche non credere a queste cose e pensare che Google ci stia ingannando. Ma questa è un’altra questione.

Comunque, ho trovato interessanti gli approfondimenti Рtecnologici ma non troppo Рper affrontare alcuni temi su cui ̬ necessario riflettere. Peccato per alcune imprecisioni, a cominciare dalle spiegazioni sulla link popularity, che ostinatamente parlano di recensioni, quando ̬ un concetto basato sulle citazioni.
Mi piacerebbe che venissero approfonditi alcuni concetti: tutta la questione della fiducia nell’ambito dei social network, per esempio.

Tra i vari commenti, segnalo quello di Mauro Lupi, quello di Carlo Perassi e quello di fil.tro. Per un approfondimento sui cookies si veda Johnnie Maneiro.

Signals and classifiers: Google ranking secrets

[Italian abstract: un importante sguardo su Google, dall'interno, e su come viene definito l'algoritmo di ranking. Sto scrivendo Ho scritto un'esposizione più completa in italiano è sul blog colletivo Beanbol]

Very interesting article on the New York Times: Google Keeps Tweaking Its Search Engine, it will be quoted lot of times in next hours.

Saul Hansell spent some time with Amit Singhal, the master of the ranking algorithm of Google.

Hansell points out that Google gives a lot of good answers. At the same time, lot of users

click away from Google, disappointed that they couldn’t find the hotel, the recipe or the background of that hot guy. Google often finds what users want, but it doesn’t always.

So, there are lot of little changes on the ranking algorithm. We already know about intrinsic (on-page) and extrinsic (off-page) critera, the most famous is link popularity given by the PageRank. Mr. Singhal told the NYT that there are more than 200 signals. The algorithm then uses classifiers to categorize queries (product, information, company, person,…). The topicality is “a measure of how the topic of a page relates to the broad category of the user’s query”. A final check controls the diversity of results in the results page to ensure that results cover different perspectives. Special explanation are given on QDF, the query deserves freshness: Google looks at what are the hot topic on blogs and gives more fresh results on these.

Some comments by other bloggers.

SEOmoz has a very important comment. The ranking algorithm is different for some queries:

The short paragraph about the French Revolution, if accurate, gives some insight into the fact that the algorithm is not uniform – not even close. Individual queries get individual attention

Furthermore, he notes that these are

a lot of confirmation about what many have only theorized until now.

Data Mining has some doubts on the quality of research: the article speaks about tweaking Google, that sounds not really serious. Probably it is just a journalistic language. He points out that everything is based on ranking. I think that maybe we will see in next years the end of ranking based on one criteria.

Google Blogoscoped makes a summary of most important concepts: users expect more, balancing changes, how search problems are escalated, ensuring fresh pages don’t get lost, ranking pages through signals, classifiers and topicality, searchers often use ambiguous queries.

via Slashdot

Why do I blog this (©NN)?
Google’s secrets, this is very interesting for my PhD research, for my web promotion activities and for a general knowledge of online communication.


Universal search, by Google

[it-abstract: Google ha modificato, in modo forse non troppo appariscente ma decisamente radicale, il concetto di ricerca, unendo i vari servizi di ricerca in un unico centro]

Google 2.0: this are the words used by Danny Sullivan to talk about Google Universal Search. His post on Search Engine Land is the most complete I found on the topic.

“You almost need a search engine for all our search engines,” said Google’s Marissa Mayer

The idea behind universal search is to integrate every Google search product (images, video, blog,…) in the main search engine. The ranking algorithm is strongly affected (how to compare and unify different ranking results by video, image and web search?).

I’m particularly interested in what is happening to the results page. In Sullivan’s post you’ll find lot of screenshot.

Why do I blog this (©N. Nova)? Although many surfers won’t notice it, this is a major change in the search engines world that will affect my PhD thesis.

Paper on Web Tourism Communication

A paper I wrote with some collegues will be presented at the Research@EyeForTravel, Travel Distribution Europe 2007 Conference in London, the 23rd May.

Lorenzo Cantoni, Marco Faré, Davide Bolchini, Alessandro Inversini, Fabiana Giulieri, University of Lugano, Switzerland, European Cities and Web Tourism Communication, An Indicators-based Pilot Study.

Usages analysis of website in 3D

Reading a post on search and 3D (not really what I was searching for), I found another Google Blogoscoped post, on 3D visualization of log files analysis.

The analysis of a websites log files is a very important activity: it gives you lot of information on your visitors (as explained here, in Italian)
Is it really useful for a deep analysis? Probably not, but it could be a great way to show the results of the analysis to non technical people.

The new Poliform website

The new website of Poliform, Italian furniture manufacturer, is online: www.poliform.it.

The project started in December 2005. I was involved as webatelier.net program assistant. We did some analysis and wrote the information concept. After Poliform designed the layout and produced content and images, I supervised two students that did the coding (meanwhile, one of them graduated). We made some proposal for promotion, but I’m not sure on what they will do.

[tags]poliform[/tags]

1. Google, 2. Yahoo!, 3. Microsoft

ComScore and Nielsen//NetRatings numbers of February 2007 say that more than half of searcher are done on Google:

  1. Google: comScore 55.8% / Nielsen 48.1%
  2. Yahoo!: comScore 20.7% / Nielsen 28.1%
  3. Microsoft: comScore 9.6% / Nielsen 10.5%

Ask is 4. for comScore (5.0%), 5. for Nielsen (2.0%, 4. is AOL with 5.1%)

source and details: SearchEngineWatch Blog

[tags]google, comscore, nielsen netratings, yahoo!, microsoft, ask, share, search engines[/tags]

Folksonomies’ cons

Some time ago I blogged about a study on a taxonomy for tagging systems.

A presentation by Emanuele Quintarelli (in his Box’s box on his blog) shows some deepenings on folksonomies properties.

I’d like to focus on cons: lack of precision, no hierarchy, low findability quotient, do not scale well.

Emanuele thinks that we need an evolution of tagging systems, in particular in the field of UI and classification.

Faceted system and tags’ hierarchy may help.

[tags]folksonomies, taxonomies, faceted systems[/tags]

Tons of search engines

How many search engines do you know?

Johnny, of the TSW blog recently added to my aggregator, suggests 400. First of all, what is a search engine? In my opinion, the definition that Johnny seems to prefere is a bit too precise to reach 400: in the comments, Federico explains the 3 steps: spidering, indexing, responding (that is actually the definition of web information retrieval system.

If you consider the most general definition (a search engine is a website that help you finding other websites), I really don’t know how many they are.

For sure, everytime I find a list of search engines, I find some new. And interesting. For example:

[tags]search engines, search engine[/tags]

[it] "Voglio essere primo su Google" ha sempre meno senso

Spesso, parlando di web marketing, ci si sente dire: “Vorrei apparire per primo su Google”. Intanto, per quali keywords? Comunque sia, questa richiesta ha sempre meno senso: Google sta dando una spinta notevole alla ricerca personalizzata.

Cosa significa? Significa che il comportamento di un utente sui vari servizi di Google influenza i risultati che gli vengono proposti. Ovvero: persone diverse avranno risultati diversi anche cercando le stesse keywords. Questo perché il loro storico di ricerche è diverso (Search History), i blog che leggono (con Google Reader) sono diversi, le loro pagine personalizzate contengono widgets diversi.

For the search marketing industry, it was cataclysmic

Questo secondo Search Engine Land, che propone tre consigli per garantirsi comunque un buon ranking:

  1. Ottimizza per i servizi di Google
  2. Ottimizza per la Social Search
  3. Ottimizza per i Social Network 

[tags]google, ricerca personalizzata, web marketing, webmarketing, web promotion, online marketing[/tags]

USI-COM: students are part of the institution

Yesterday, for the first time in his short history (AFAIK), the faculty Board of the School of Communication Sciences of the University of Lugano was open to one student democratically chosen among all the students. I asked for this more than 5 years ago, when I was student. Good news: we too – PhD students – have our representative in the Board.

I’m reading L’universo, a newpaper written by students and published by the Corriere del Ticino, but they say nothin about this. I’ll search better.

[tags]University of lugano, università della svizzera italiana[/tags]