Le défi des entités nommées accéléré par l’achat de MetaWeb par Google

L'achat de MetaWeb par GoogleLe sujet des entités nommées est au centre du débat sur le Web sémantique. L’achat de MetaWeb par Google relance l’enjeu qui consiste à associer une entité à une référence.

Il y aura peut-être des implications pour le référencement, mais elles seront largement bénéfiques.

L’achat de MetaWeb par Google

Google devient plus perfectionnés par rapport à la compréhension des entités nommées avec l’acquisition de la société MetaWeb qui a construit un système d’indexation intégrant le concept d’entité nommée.

C’est par le biais de l’insatiable Bill Slawski que j’apprends la nouvelle aujourd’hui.

Qu’est ce qu’une entité nommée ?

Tout simplement, une entité nommée peut être une personne, un endroit ou autre chose qui sera associée à un numéro d’identification unique. L’entité peut intégrer un mot ou un groupe de mots.
C’est un peu comme une classification des ouvrages dans une librairie ou n’importe quelle base de données. L’intérêt est évidemment au niveau de l’indexation et de l’identification qui pourront être mieux ciblés par ce biais.
En associant une entité avec un numéro, la recherche d’information peut se révéler plus efficace. C’est par exemple très utile lorsqu’un même terme relève plusieurs significations. De même, les noms propres sont bien mieux traités grâce au système des entités nommées et Bill Slawski cite une étude Microsoft faisant ressortir que 20 à 30% des requêtes sont des entités nominales et 71% des requêtes contient une entité nominale.

Pour en savoir plus sur les entités nommées, je renvoie vers la présentation de Jean Véronis lors de SEO Campus 2010.

Entités nommées par Jean Véronis

MetaWeb

La société MetaWeb a été rachetée par Google récemment comme évoquent les posts du blog Google et celui de MetaWeb.

La technologie de MetaWeb peut se découvrir au sein de FreeBase qui rassemble plus de 12 millions d’éléments et que Google souhaite préserver à la disposition de tous.

Voici une vidéo (en anglais) qui introduit le principe de la technologie MetaWeb

vidéo sur la technologie MetaWeb

Quel est le potentiel ?

En fait, cela dépend des possibilités d’intégration dans l’algorithme du moteur de recherche Google.
L’impact peut être relativement important car le problème des termes qui représentent plusieurs significations fait partie des challenges les plus importants pour la recherche d’information.
Dans tous les cas, c’est une prise de partie franche de la part de Google puisque le Web sémantique est toujours en manque d’une norme d’étiquetage définie.

Encore une fois, la raison du plus fort fera peut-être pencher la balance; tout en sachant que la technologie MetaWeb fait l’objet de plusieurs brevets. Le concept Open Source me semble plus approprié afin de légitimer la propagation du système.

Pour le référencement, ça serait très utile de savoir sur quoi compter pour valoriser ce type d’éléments car les diverses tentatives de standard sont plutôt improbables jusqu’à présent.
A défaut de système universel, on pourra au moins savoir comment s’adresser au leader des moteurs de recherche.