Chercher le sens

Publié le 29 Juin 2007

Hakia fait partie de cette nouvelle race de moteurs de recherche assez fous pour défier Google et assez ambitieux pour dire le faire en s'appuyant sur une technologie supérieure.

La motivation est simple: la "cherche" est notre principale forme d'accès à l'information ET la source de revenus la plus sûre (sous forme de publicité). Il est également clair que le système poussé par Google au maximum est bête puisqu'il se fonde essentiellement sur les mots se trouvant sur une page et les liens y conduisant, indépendamment de ce qui y est vraiment dit.

Une poignée de start-ups estiment le moment venu de relever le gant dans l'espoir de ramasser la mise. Elles sont convaincues que l'indexation des mots clés (keywords) ne permet pas d'aller plus loin d'où le recours à des technologies capables de comprendre le sens des phrases.

Financée par des capitaux extérieurs aux États-Unis (et largement européens) mais basée à New York, Hakia s'appuie sur le concept de "recherche sémantique" ou semantic search, c'est-à-dire sur le "sens des concepts" explique son fondateur dans un article publiée le 29 mai par Read/Write Web. Il est censé "émuler la "compréhension"". La pierre angulaire consiste ici à bien comprendre les langages, pas seulement à trouver et à indexer l'information.

En fait aujourd'hui il est pratiquement impossible de battre Google, notamment sur les questions les plus simples. Mais l'argument, bien trouvé, des fondateurs de Hakia consiste à dire qu'ils sont les meilleurs pour répondre aux questions les plus compliquées ou, en tous cas les moins courantes: celles qui figurent dans la longue traîne des recherches et que Google sert mal.

"Sans qu'il soit nécessaire d'avoir recours aux statistiques, les recherches dans la longue traîne peuvent être instantanément analysées par des algorithmes sémantiques et fournir des résultats contenant le contexte pertinent," affirme le Dr Riza Berkan, patron et fondateur de Hakia.

Plus qu'indexer, il s'agit donc d'analyser. Cela se traduit notamment par le fait que dans les réponses, ce ne sont pas les mots de la question qui sont soulignés mais des morceaux de phrase.

Beaucoup se demandent si Hakia peut battre Google. C'est manifestement un peu tôt pour poser la question en ces termes. Il est déjà surprenant de constater qu'il donne des résultats presque aussi bons, parfois meilleurs, alors qu'il n'en est encore qu'à une phase de tests publics.

Comparez par exemple avec la phrase "Qui est le président de la République?" Et ne perdez pas le Lab de vue, c'est de là que les nouveautés sortiront.

Hakia faisait partie de la poignée de compagnie présentées à La Baule les 28 et 29 juin dans le cadre du California Tech Showcase 2007 .

Mais Hakia n'est pas seul. Je parlerai bientôt de PowerSet dont j'ai vu une démo.

Commenter cet article