{"id":748,"date":"2010-06-09T11:55:24","date_gmt":"2010-06-09T09:55:24","guid":{"rendered":"http:\/\/www.laurentbourrelly.com\/blog\/?p=748"},"modified":"2010-06-09T11:55:24","modified_gmt":"2010-06-09T09:55:24","slug":"et-si-on-parlait-dexalead","status":"publish","type":"post","link":"https:\/\/www.laurentbourrelly.com\/blog\/748.php","title":{"rendered":"Et si on parlait d\u2019Exalead ?"},"content":{"rendered":"<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/moteur-recherche.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft size-thumbnail wp-image-749\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/moteur-recherche-150x150.png\" alt=\"Le moteur de recherche\" width=\"120\" height=\"120\" \/><\/a>Parmi les fleurons de la haute technologie fran\u00e7aise, on peut citer <a href=\"http:\/\/www.exalead.com\/\">Exalead<\/a> en bonne place. Les solutions propos\u00e9es par l\u2019\u00e9diteur de logiciels sont pointues et elles paraissent performantes.<br \/>\nD\u2019un point de vue r\u00e9f\u00e9renceur, j\u2019aime bien suivre les \u00e9volutions du moteur de recherche Exalead puisqu&rsquo;il a toujours focalis\u00e9 sur la s\u00e9mantique.<\/p>\n<p>C\u2019est par le biais d\u2019un article pr\u00e9sentant le bilan de <a href=\"http:\/\/www.quaero.org\/\">Quaero<\/a>, le soi-disant moteur de recherche europ\u00e9en, que je suis retomb\u00e9 sur Exalead puisqu\u2019il fait partie des principaux partenaires.<br \/>\n<!--more--><\/p>\n<h1>Exalead<\/h1>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/Exalead.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-750\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/Exalead.png\" alt=\"Le moteur de recherche Exalead\" width=\"294\" height=\"112\" \/><\/a><br \/>\nPour rappel, Exalead \u00e9dite des logiciels B2B bas\u00e9 sur une technologie de recherche qui essaye de se d\u00e9marquer des t\u00e9nors du march\u00e9. Depuis le d\u00e9but, on sentait que le moteur fran\u00e7ais s\u2019embarquait sur une tangente int\u00e9ressante en prenant une approche s\u00e9mantique. A la base, il s\u2019agit d\u2019extraire des mots cl\u00e9s associ\u00e9s \u00e0 un document, permettant de d\u00e9terminer au mieux le v\u00e9ritable sens d\u2019un texte. Aujourd\u2019hui, je reste dubitatif sur le r\u00e9el succ\u00e8s; m\u00eame si personne ne peut nier que c\u2019est tr\u00e8s int\u00e9ressant. Au niveau des chiffres, l\u2019index contient 16 milliards de pages Web et 1 milliard d\u2019images.<br \/>\nLe mieux est d\u2019essayer par soi-m\u00eame en regardant ce que ressort le moteur pour les Termes associ\u00e9s. Parfois c\u2019est pertinent, mais souvent c\u2019est totalement \u00e0 c\u00f4t\u00e9 de la plaque.<\/p>\n<p>A vrai dire, le <a href=\"http:\/\/www.exalead.com\/search\/\">moteur de recherche d&rsquo;Exalead<\/a> est toujours rest\u00e9 plut\u00f4t confidentiel. Je ne sais pas si vous le voyez passer comme referer dans vos stats, mais ce n\u2019est pas courant.<br \/>\nQuoi que la v\u00e9ritable concurrence s\u2019est toujours situ\u00e9e au niveau des autres \u00e9diteurs de logiciels similaires, plut\u00f4t qu\u2019au niveau des principaux moteurs qui ont des mod\u00e8les \u00e9conomiques bien diff\u00e9rents.<\/p>\n<h2>Les progr\u00e8s de la recherche d\u2019information<\/h2>\n<p>Malgr\u00e9 les avanc\u00e9es \u00e9videntes dans le domaine de la recherche d\u2019information, dont celles de Google sont les plus en vues, il demeure un gros souci sur le plan fondamental : le moteur de recherche est idiot.<\/p>\n<p>Je veux dire par l\u00e0 qu\u2019il ne comprend toujours pas bien le contenu qu\u2019il indexe.<\/p>\n<p>Il est possible de disserter pendant longtemps sur les progr\u00e8s et le futur de la recherche d&rsquo;information comme nous \u00e9tions plusieurs \u00e0 discuter lors du <a href=\"https:\/\/www.laurentbourrelly.com\/blog\/531.php\">billet synchronis\u00e9<\/a>. Certains th\u00e9or\u00e8mes sont vraiment int\u00e9ressants avec le Latent Semantic Indexing (LSI) en t\u00eate, puisqu\u2019il fait toujours couler beaucoup d\u2019encre num\u00e9rique parmi les r\u00e9f\u00e9renceurs et autres observateurs du secteur de la recherche d\u2019information. Le dernier article que j\u2019ai lu sur le <a href=\"http:\/\/bravenewworld.fr\/referencement-seo\/latent-semantic-indexing-lsi-637\/\">LSI<\/a> par l\u2019ami Didier Sampaolo est tr\u00e8s int\u00e9ressant; on sent bien que c\u2019est tr\u00e8s tentant d\u2019y succomber de mani\u00e8re applicative. Pour ma part, je l\u2019utilise seulement pour la th\u00e9orie, mais un prochain article viendra expliquer tout cela en d\u00e9tails.<\/p>\n<p>Donc, pour l\u2019instant nous avons droit \u00e0 aux pr\u00e9liminaires de la s\u00e9mantique appliqu\u00e9e \u00e0 la recherche d\u2019information, mais les principaux moteurs ne sont pas aussi sophistiqu\u00e9s qu\u2019on voudrait bien le croire si on s\u2019interroge sur la compr\u00e9hension du sens des documents qu\u2019ils indexent.<\/p>\n<h3>Quaero<\/h3>\n<p><a href=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/quaero.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-751\" src=\"https:\/\/www.laurentbourrelly.com\/blog\/wp-content\/uploads\/2010\/06\/quaero.jpg\" alt=\"Le moteur de recherche Quaero\" width=\"456\" height=\"139\" \/><\/a><br \/>\nLes observateurs du secteur de la recherche d\u2019information se rappellent sans doute l\u2019annonce de lancement du projet Quaero par Jacques Chirac. A l\u2019\u00e9poque, il s\u2019agissait de s\u2019attaquer frontalement \u00e0 l&rsquo;h\u00e9g\u00e9monie de Google par le biais d\u2019un moteur de recherche europ\u00e9en.<\/p>\n<p>Depuis plus rien jusqu\u2019\u00e0 l\u2019annonce du <a href=\"http:\/\/blog.exalead.fr\/2010\/05\/31\/quaero-le-resultat-de-2-ans-de-collaboration\/\">bilan des deux ans<\/a>.<\/p>\n<p>Au premier abord, tout cela para\u00eet prometteur : 300 millions d\u2019euros de budget sur cinq ans pour 300 chercheurs qui ont publi\u00e9 230 publications scientifiques et 20 demandes de brevets. J\u2019en sais fichtre rien si c\u2019est beaucoup ou peu avec tous ces sous et ces savants, mais 20 brevets semble d\u00e9j\u00e0 \u00eatre un bilan int\u00e9ressant. Cela aboutirait sur un moteur de recherche qui analyse automatiquement les contenus vid\u00e9o. Le programme inclut \u00e9galement la traduction instantan\u00e9e, une t\u00e9l\u00e9vision personnalisable et d\u2019autres petites choses comme la recherche par similarit\u00e9\/caract\u00e9ristique colorim\u00e9trique et le r\u00e9sum\u00e9 automatique de morceaux de musique. Bref, on sent bien que l\u2019accent est mis sur l\u2019indexation du contenu multim\u00e9dia, mais silence radio sur une \u00e9ventuelle concurrence avec Google.<\/p>\n<p>Le r\u00e9sultat est assez sympathique lorsqu\u2019on regarde l\u2019indexation des <a href=\"http:\/\/www.elysee.fr\/president\/mediatheque\/videos\/videotheque.10.html\">vid\u00e9os sur le site Elysee.fr<\/a> avec tout le contenu audio qui est transform\u00e9 en texte.<\/p>\n<p>Apr\u00e8s, je me perds dans qui fait quoi dans ce projet car les <a href=\"http:\/\/www.quaero.org\/modules\/movie\/scenes\/home\/index.php?fuseAction=article&amp;rubric=presentation&amp;article=partenaires\">partenaires de Quaero<\/a> pr\u00e9servent apparemment la primeur et la propri\u00e9t\u00e9 de leurs d\u00e9couvertes, donc pas \u00e9vident de savoir si c\u2019est Quaero ou Exalead qui a install\u00e9 le moteur sur le site de l\u2019Elys\u00e9e ou ailleurs, \u00e9tant donn\u00e9 que les deux ont l\u2019air de se f\u00e9liciter des r\u00e9sultats.<\/p>\n<h4>Conclusion<\/h4>\n<p>Au travers de l\u2019exemple Exalead et Quaero, on peut sentir que les choses bougent. Bien entendu, ils ne sont pas les seuls \u00e0 bosser sur le futur de la recherche d\u2019information. Les moyens de soci\u00e9t\u00e9s priv\u00e9es comme Google et Microsoft sont gigantesques et d\u2019autres sont \u00e9galement sur les rails pour nous sortir le moteur du futur.<br \/>\nMon propos n\u2019\u00e9tait pas de faire un \u00e9tat des lieux complet ou partir dans des explications pseudo techniques, mais plut\u00f4t de montrer qu\u2019il se passe des choses en France. Hormis Exalead et Quaero, il y a des recherches int\u00e9ressantes dans plusieurs universit\u00e9s fran\u00e7aises, mais on dirait tout de m\u00eame que l\u2019essentiel reste la garde des chercheurs de la Sillicon Valley.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Parmi les fleurons de la haute technologie fran\u00e7aise, on peut citer Exalead en bonne place. Les solutions propos\u00e9es par l\u2019\u00e9diteur de logiciels sont pointues et elles paraissent performantes. D\u2019un point de vue r\u00e9f\u00e9renceur, j\u2019aime bien suivre les \u00e9volutions du moteur de recherche Exalead puisqu&rsquo;il a toujours focalis\u00e9 sur la s\u00e9mantique. C\u2019est par le biais d\u2019un [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"site-sidebar-layout":"default","site-content-layout":"","ast-site-content-layout":"default","site-content-style":"default","site-sidebar-style":"default","ast-global-header-display":"","ast-banner-title-visibility":"","ast-main-header-display":"","ast-hfb-above-header-display":"","ast-hfb-below-header-display":"","ast-hfb-mobile-header-display":"","site-post-title":"","ast-breadcrumbs-content":"","ast-featured-img":"","footer-sml-layout":"","ast-disable-related-posts":"","theme-transparent-header-meta":"","adv-header-id-meta":"","stick-header-meta":"","header-above-stick-meta":"","header-main-stick-meta":"","header-below-stick-meta":"","astra-migrate-meta-layouts":"default","ast-page-background-enabled":"default","ast-page-background-meta":{"desktop":{"background-color":"var(--ast-global-color-4)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"ast-content-background-meta":{"desktop":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"tablet":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""},"mobile":{"background-color":"var(--ast-global-color-5)","background-image":"","background-repeat":"repeat","background-position":"center center","background-size":"auto","background-attachment":"scroll","background-type":"","background-media":"","overlay-type":"","overlay-color":"","overlay-opacity":"","overlay-gradient":""}},"footnotes":""},"categories":[8],"tags":[175,202,313,389],"class_list":["post-748","post","type-post","status-publish","format-standard","hentry","category-moteurs-de-recherche","tag-exalead","tag-google","tag-microsoft","tag-quaero"],"_links":{"self":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/748","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/comments?post=748"}],"version-history":[{"count":0,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/posts\/748\/revisions"}],"wp:attachment":[{"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/media?parent=748"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/categories?post=748"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.laurentbourrelly.com\/blog\/wp-json\/wp\/v2\/tags?post=748"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}