|
La majeure partie des outils exploitant des données textuelles utilise une représentation des documents reposant sur le modèle booléen. A chaque texte est associée une matrice listant les termes (les mots outils tels que les conjonctions sont éliminés) et leur position dans le texte. Chaque terme est donc banalisé au sein de la matrice, le seul vrai critère étant «absent» ou «présent». Les expressions et la terminologie d’un métier, pourtant essentielles dans le monde de l’entreprise, sont rarement pris en compte ou seulement comme des chaînes de caractères sans valeur sémantique particulière.
L’index d’AMI va bien au-delà d’un simple index booléen. Chaque document fait l’objet d’une analyse spécifique qui permet d‘identifier les éléments essentiels du texte et que l’on appelle la signature du document. De la même manière que le ferait un documentaliste avec un surligneur à couleur variable, AMI identifie et organise les termes d’un document en fonction de leur niveau d’importance.
Ainsi, grâce à cette indexation par signature, qui est complétée par un index booléen positionnel, il est possible de :
| • |
Rechercher à partir d’une question avec un très haut niveau de pertinence. |
| |
| • |
Partager des informations : le document peut devenir la question donc permet de retrouver toutes informations importantes qui y sont associées. |
| |
| • |
Organiser un ensemble de documents en qualifiant leur contenu : clusters, classements, catégories, etc. |
| |
| • |
Rapprocher des informations et si besoin est, les dédoublonner en fonction de leur contenu. |
| |
| • |
Extraire les phrases clefs d’un texte (citations) |
D’un fonctionnement entièrement automatique (voir l’interview de E. Fourboul), la technologie de signature de documents repose sur des brevets originaux déposés par AMI Software et qui démontre son savoir-faire et son avance technologique.
Plus d'information sur la signature de documents.
|