Xerox crée un moteur de recherche nouvelle génération


Puissant logiciel d'analyse textuelle, FactSpotter effectue des recherches intelligentes et permet d'affiner les résultats grâce à une compréhension poussée du contexte dans lesquels les mots sont utilisés.

Grenoble, juin 20, 2007 - Les chercheurs de Xerox viennent de développer un logiciel d’extraction d’informations de nouvelle génération suffisamment puissant pour parcourir et passer au crible la plupart des sources de données électroniques, quels que soient la langue, l’emplacement, le format ou le type de document. Ce nouvel outil d’analyse textuelle est calqué sur les processus d’information du cerveau humain et sur notre façon de penser, de nous exprimer et de poser des questions. Il fonctionne de façon intuitive, garantissant ainsi la pertinence des résultats.

Développé au Centre de Recherches Européen de Xerox (XRCE) de Grenoble, FactSpotter combine un puissant moteur linguistique capable d’analyser à la fois la sémantique et la syntaxe des mots ou des groupes de mots recherchés, tout en conservant une interface simple et accessible à tous.

Disponible d’ici 2008, FactSpotter sera intégré à la gamme Xerox Litigation Services proposée par Xerox Global Services (XGS) destinée aux services juridiques et plus particulièrement à la partie « e-discovery » (reconnaissance électronique). Cette technologie de document intelligent vient compléter le portefeuille de solutions innovantes de gestion documentaire proposé par XGS aux entreprises ayant une utilisation intensive de documents.

Grâce au logiciel FactSpotter, qui permet de réduire considérablement les délais de recherche tout en optimisant la pertinence des résultats, Xerox entend dynamiser la productivité des entreprises exploitant d’importantes quantités de données, notamment dans les domaines de la reconnaissance électronique légale, de la gestion des risques, de la recherche pharmaceutique, de l’intelligence concurrentielle, de la sécurité ou encore de la répression des fraudes.

« Aujourd’hui, les salariés recherchent des données, des informations ou des connaissances spécifiques liées à leur entreprise afin de pouvoir fournir un travail de qualité. Pour ce faire, ils ont besoin d’outils efficaces leur permettant de trouver plus facilement la bonne information parmi l’immense quantité de données aujourd’hui disponible. Répondant à ce besoin, FactSpotter permet d’améliorer la cohérence et la pertinence des résultats et d’étendre la zone de recherche, optimisant ainsi la productivité des salariés », déclare Mike Maziarka, Directeur Dynamic Content Software et Image Scanning Trends Consulting Services chez InfoTrends.

Pour chaque requête, les moteurs de recherche traditionnels fournissent généralement une longue liste de documents assez conséquents mais ne comportant cependant que le terme recherché (un document de 20 pages ne contenant qu’une seule occurrence du terme « Tour Eiffel », par exemple). Contrairement à cela, le logiciel d’analyse textuelle de Xerox procède à une recherche intelligente et sélective et ne liste que les parties de documents contenant l’information recherchée. Mieux encore, ces parties ne doivent pas nécessairement contenir le terme exact de la demande, le logiciel pouvant également rechercher des mots ayant le même sens. FactSpotter est par exemple à même de déduire que « le plus haut monument de Paris » fait référence à la Tour Eiffel.

« Ce moteur linguistique de nouvelle génération est bien plus puissant que les programmes actuels de recherche par mot clé et d’analyse de données qui, en général, ne retrouvent que 40 % des documents pertinents », déclare Frédérique Segond, Responsable analyse syntaxique et sémantique au XRCE. « L’outil que nous avons développé est plus précis car il analyse les documents de façon très poussée. Grâce à sa « compréhension » du contexte, il fournit ainsi la bonne information et indique même où se trouve la réponse dans le document. »

Ce nouveau logiciel va bien au-delà des simples moteurs de recherche déjà existants. Ces derniers imposent en effet de fractionner les requêtes selon la logique informatique en isolant les mots et ne fournissent que des résultats reprenant des groupes de mots. A l’opposé, et grâce à son interface inédite, FactSpotter permet aux utilisateurs d’effectuer leurs recherches en langage naturel.

D’autre part, le logiciel tient d’abord compte du contexte général du document avant de rechercher un groupe de mots similaires. Il introduit ainsi le concept de « relation », en procédant à une recherche dans et à travers les phrases ou les paragraphes. Enfin, il est capable de reconnaître les concepts abstraits que peuvent induire certains termes (« personne » ou « bâtiment », par exemple) et de déceler tous les mots s’y rapportant.

Ces fonctionnalités avancées permettent au nouveau logiciel de Xerox de détecter en seulement quelques secondes des informations très difficiles à trouver avec une méthode classique. FactSpotter est d’ailleurs particulièrement indiqué pour répondre aux problématiques de certains secteurs d’activités tels que la justice. Lors d’un procès, par exemple, cette méthode de reconnaissance électronique pourrait permettre de trouver rapidement des faits précis parmi des centaines (voire des millions) de documents différents. Ce moteur de recherche nouvelle génération devrait également se révéler particulièrement précieux dans d’autres situations exigeant une recherche d’informations au sein d’une base de données volumineuse, à savoir la gestion des risques, les recherches gouvernementales et d’entreprise, la lutte contre les stupéfiants et la répression des fraudes.

A propos de Xerox Europe :

Xerox Europe, filiale européenne de Xerox Corporation, commercialise une gamme complète de produits, solutions et services, ainsi que les consommables, matériels et logiciels associés. Ces offres s'articulent autour de trois axes : l’impression bureautique petits et grands volumes, l’impression de production et les environnements arts graphiques, et les services incluant le conseil, la conception et la gestion des systèmes documentaires jusqu’aux solutions d’externalisation complètes.
Xerox Europe possède également des unités assurant la production et la logistique en Irlande, au Royaume-Uni et aux Pays-Bas, ainsi qu’un centre de recherche et de développement (Xerox Research Centre Europe) à Grenoble. Pour plus d’informations : www.xerox.fr
XEROX® est une marque de Xerox Corporation. Toutes les autres marques ou noms de produits cités non Xerox sont les marques ou les marques déposées de leurs propriétaires respectifs.

A propos de Xerox Global Services

Xerox Global Services, l'une des trois principales entités du groupe Xerox, propose une gamme complète de services de conseil, d'intégration de systèmes et de gestion externalisée des documents. XGS travaille en collaboration avec ses clients pour optimiser leurs processus à forte composante documentaire tels que le traitement des courriers clients et des factures, la gestion des documents de formation et des dossiers clients. N°1 mondial des services documentaires, Xerox Global Services accompagne ses clients dans l’optimisation des processus métier et la réduction significative des coûts. XGS intervient dans tous les secteurs d'activités, quelle que soit la taille des entreprises.

Pour de plus amples informations :

XRCE
Irene Maxwell
Tél. : 04 76 61 50 83
E-mail: Irene.Maxwell@xerox.com

Service Presse : EuroTandem
Aurélia Renaud / Céline Maguet
E-mail : a.renaud@eurotandem.fr / c.maguet@eurotandem.fr
Tél. : 01 55 30 71 04 / 01 55 30 71 01