|
 |
|
Pourquoi choisir plutôt qu'un des moteurs de recherche* traditionnels sur Internet ?
Une interview de Jacqueline Reigner, Docteur ès sciences, directrice de Sémafor Conseil SA (Lausanne, Suisse). |
Quelle est la différence entre et les moteurs traditionnels sur Internet ?
Jacqueline Reigner : Les moteurs de recherche traditionnels permettent de retrouver des informations associées à des mots. Ils bénéficient auprès du public qui les utilise chaque jour, d'une image forte liée également à une activité commerciale et publicitaire soutenue.
est quant à lui, un puissant outil de recherche d'informations et d'exploitation des résultats.
Quelle est la base technologique d'un système de recherche ?
Jacqueline Reigner : Les moteurs de recherche traditionnels proposent une boîte noire - de volume et de durée limités - posée dans le réseau d'entreprise sans indication quant à la composition et au contenu. Les données d'entreprise sont-elles uniquement stockées dans la boîte noire ou sont-elles transférées vers un serveur à l'étranger, sans aucune garantie de confidentialité?
En revanche est une application implémentée sur un des serveurs d'entreprise, sans limite de volume ni de durée d'utilisation. La confidentialité est assurée sous le contrôle de l'entreprise.
Comment se fait la recherche d'information ?
Jacqueline Reigner : Les moteurs de recherche traditionnels recherchent des mots (chaînes de caractères), 10 au maximum selon un algorithme booléen. Une suggestion est faite en cas de faute de frappe.
En utilisant , il est aisé de faire une recherche évoluée en langage naturel non limité et même sans contrainte orthographique. Un jeu d'algorithmes prend en charge la question et génère un graphe d'hypothèses qui sont autant de variations de la requête initiale avec pour objectif de balayer à coup sûr l'ensemble du sujet. Une technologie brevetée de calcul de signatures de documents donne un niveau de pertinence supérieur au résultat.
Est-ce qu'il est nécessaire d'indexer les données source ?
Jacqueline Reigner : Oui, les moteurs de recherche traditionnels utilisent des données indexées.
propose les deux possibilités: indexer les données avec la technologie de signatures ou au contraire se connecter à des sources d'informations qui ont leur propre interface de recherche. Cette connexion s'effectue à l'aide d'un connecteur générique, par l'écriture d'un script, qui émule l'interrogation d'une source d'information spécifique. L'ajout d'une nouvelle application au système de recherche se fait simplement par la rédaction d'un script supplémentaire. De cette façon il est possible de construire un système de recherche fédéré sur un ensemble de sources.
Et quel est le résultat d'une recherche ?
Jacqueline Reigner : Une liste simple classée avec extrait des premières lignes de texte est le résultat des moteurs de recherche traditionnels.
Alors que propose la réconciliation des résultats affichés selon l'ordre de pertinence et enrichis d'un abrégé des 3 à 4 phrases les plus significatives. Les doublons sont signalés. De plus une aide à la recherche, les thèmes liés, la clusterisation et le "more like this" enrichissent les résultats afin de faciliter la préparation d'un dossier complet.
(*) Moteurs Internet de type Yahoo, Google, MSN, etc.
|