Infodoc en ligne

cahier-crayon

Dossier moteurs de recherche d’entreprise 5/6

6 Commentaires

Après avoir vu à quoi peut servir un moteur de recherche d’entreprise, voyons comment choisir le bon outil, avec une série de questions à se poser avant de choisir un outil. Avec des focus sur des fonctionnalités particulières.

Troisième partie – Moteur de recherche d’entreprise, comment choisir ?

Il existe des dizaines de moteurs de recherche d’entreprise. A première vue ce n’est pas toujours facile de déterminer l’outil qui nous conviendra le mieux. C’est pourtant un choix important à faire si on veut que l’outil soit utilisé. Et ce, d’autant plus que l’on acquiert généralement un moteur de recherche pour plusieurs années.

Les questions à se poser avant de choisir un moteur de recherche

Voici un éventail des questions à se poser avant de choisir un moteur de recherche d’entreprise et des points à examiner. Bien sûr, ces éléments sont génériques. Ils peuvent être complétés ou adaptés suivant le contexte.

questions

L’identification des besoins

La première chose à faire est de se poser les questions : Qu’est-ce que je veux faire avec un moteur de recherche d’entreprise ? Pourquoi en ai-je besoin ? (Il faut d’ailleurs se poser ces questions pour toute mise en place d’un nouvel outil informatique.)

Les scenarii d’utilisation dans la partie précédente peuvent aider à clarifier certains besoins.

Impliquer les futurs utilisateurs en leur demandant de formaliser leurs besoins, comment ils voudraient pouvoir avoir accès à l’information peut être très intéressant. Cela peut permettre de mettre à jour des besoins auxquels personne n’avait pensé. Et les impliquer les rendra plus intéressés lorsque l’outil sera disponible.

Une fois que l’on a cerné ses besoins, cela aide à choisir le type d’outil que l’on souhaite et les fonctionnalités nécessaires. Ce n’est pas la peine d’acheter un outil qui permet de créer des applications de recherche si on a seulement besoin de retrouver des documents dans un serveur de fichiers.

Faire l’inventaire des informations à indexer

Il s’agit principalement de :

  • Savoir où les informations sont stockées : sur des serveurs de fichiers, dans des bases de données, dans des applications métiers, sur le web…
  • Déterminer leur volumétrie. Combien de giga ou de terra octets ces informations représentent-elles ? Dans certains cas, cela peut avoir un impact sur le prix de la solution. C’est également utile pour déterminer les caractéristiques techniques de l’infrastructure de recherche à mettre en place.
  • Connaître les caractéristiques de ces informations. Quels sont les formats (.doc, .htm, .ppt, .pptx, .docx, .xls, .xlsx, .odt, .psd, .indd, .ai…) ? Suivant les formats, les moteurs de recherche peuvent en indexer le contenu. Pour les documents bureautiques ou html, les moteurs de recherche peuvent généralement en indexer le contenu plein texte. Pour d’autres formats propriétaires, comme ceux de la suite Adobe Créative par exemple, c’est plus compliqué et les moteurs de recherche ne peuvent généralement pas indexer le contenu du document. Dans ce cas, il faut se tourner vers les métadonnées. Quelles sont les métadonnées disponibles ? Est-il pertinent de toutes les indexer ?
  • Se poser la question de la structuration des données et informations. Cela joue-t-il un rôle dans la recherche ? Les données sont-elles à mettre en relation les unes avec les autres ? Sont-elles à enrichir ? Si oui, existe-t-il déjà un ou plusieurs vocabulaires d’autorité ? Comment est-il possible de les intégrer dans l’outil ?

 Le multilinguisme

Si les informations à indexer sont en différentes langues, il est intéressant de voir comment le moteur traite la question du multilinguisme.

Le moteur de recherche est-il capable de différencier les langues des documents (dans le contenu ou les métadonnées) ? La plupart des moteurs de recherche d’entreprise en sont capables.

La langue du document peut-elle être un critère de recherche ?

Pour une requête en français, le moteur de recherche est-il capable de faire remonter des informations correspondantes en anglais par exemple ?

Les connecteurs disponibles

Pour rappel, les connecteurs permettent au moteur de recherche de se brancher sur les différentes sources d’information à indexer. Les éditeurs disposent généralement d’un catalogue standard de connecteurs pour les sources les plus courantes (serveurs de fichiers, SharePoint, Lotus Note…). Plus le catalogue de connecteurs est étendu, plus il y a de chances pour que ceux correspondants à vos applications soient disponibles. Il faut néanmoins s’assurer que ces connecteurs peuvent gérer les spécificités de votre système d’information. Sinon, l’éditeur pourra probablement développer des connecteurs sur-mesure mais cela risque d’être du temps et du budget supplémentaires.

Les différentes possibilités de recherche

Les moteurs de recherche d’entreprise présentent tous les mêmes fonctionnalités principales au niveau de la recherche. Certaines sont néanmoins plus mises en avant que d’autres selon les outils. En ce qui concerne la recherche et l’affinage des résultats, un certain nombre de points peuvent être pris en compte.

Les possibilités de recherche avancées. Quelles sont-elles ? Y-a-t-il un formulaire pour guider la recherche avancée ? Le moteur de recherche prend-t-il en compte les opérateurs de recherche avancée classiques comme les opérateurs booléens (ET, OU, SAUF) ou de proximité (NEAR), la troncature, les parenthèses pour construire des équations de recherche ? Lesquelles de ces possibilités sont à privilégier, selon les utilisateurs (voir paragraphe suivant) ?

Il y a aussi ce que j’appelle les facilitateurs de requêtes. Ce sont des fonctionnalités qui facilitent l’écriture de la requête par l’utilisateur : insensibilité à la casse, aux accents, aux pluriels, élimination des mots vides, correction orthographique, lemmatisation (action de regrouper les différentes formes que peut prendre un mot : nom, pluriel, verbe conjugué, infinitif…), auto-complétion…

autocompletion googleCapture d’écran du moteur de recherche Google avec la fonctionnalité d’auto-complétion

La navigation par facettes. Une facette permet à l’utilisateur d’affiner successivement sa recherche en lui permettant de sélectionner directement sur la page de résultats du moteur des sous-catégories plus précises. Ces facettes peuvent être construites grâce à l’analyse des métadonnées ou bien par analyse sémantique ou extraction d’entités nommées. L’analyse sémantique permet d’extraire des concepts évoqués dans les documents. L’extraction d’entités nommées permet d’extraire des résultats les noms propres y figurant. Cette extraction peut être personnalisée selon les contextes.

facettes_exaleadLe moteur de recherche Exalead a été l’un des premiers moteurs web à proposer une navigation par facettes à ses utilisateurs.

Les utilisateurs de l’outil

computer-25131Qui seront les utilisateurs finaux de l’outil ? Sont-ils des professionnels de la recherche d’information ou des novices ? Les fonctionnalités à privilégier ne sont pas les mêmes dans les deux cas. Si les utilisateurs sont des professionnels de la recherche d’information, ils peuvent utiliser des fonctions de recherche avancée directement dans la barre de recherche. S’il s’agit d’utilisateurs novices, on privilégiera plutôt des modes de recherche guidée avec formulaires, des fonctions visuelles comme les facettes et surtout la plus grande simplicité d’utilisation et la similarité avec les moteurs de recherche web.

La gestion de la sécurité

Tous les utilisateurs n’ont pas les mêmes droits d’accès selon les sources de données ou les types d’information. Les moteurs de recherche d’entreprise intègrent une reconnaissance des utilisateurs par identifiant et mot de passe ce qui permet ensuite de déterminer à quelles informations ils auront le droit d’accéder ou non.

Le moteur de recherche doit être capable de prendre en compte les différents droits des utilisateurs pour chaque source indexée et de les unifier pour un même utilisateur.

Il y a deux méthodes pour assurer la sécurité des accès :

  • Soit le moteur récupère les droits de l’annuaire de l’entreprise
  • Soit il gère le schéma de contrôle en interne.

L’une ou l’autre est à privilégier suivant le contexte d’utilisation.

En ce qui concerne la visibilité des documents selon les droits des utilisateurs, deux possibilités existent. Soit, quand il fait une recherche, l’utilisateur ne voit que les documents auxquels il a accès. Soit, il voit également les documents auxquels il n’a pas accès dans la liste des résultats mais n’a pas de possibilités d’y accéder. Cette deuxième solution peut présenter l’avantage d’élargir la circulation de l’information dans l’entreprise. Des droits d’accès ont été définis à l’arrivée du salarié dans l’entreprise, celui-ci a évolué dans son poste mais personne n’a pensé à modifier ses droits d’accès aux informations. Le fait que le salarié puisse voir ces informations et savoir qu’elles existent peut lui permettre de demander à ce qu’on lui élargisse ses droits d’accès.

Quelles que soit les solutions choisies pour la gestion de la sécurité, il ne faudra pas oublier de faire des tests avec les profils de différents utilisateurs pour s’assurer que tout fonctionne correctement avant le déploiement complet de l’outil. Vérifier régulièrement que les droits d’accès sont toujours bien paramétrés peut aussi être nécessaire. Il peut arriver que cela bouge.

Les possibilités de personnalisation

Les éditeurs de solutions de recherche proposent des outils standardisés, avec plus ou moins de possibilités de personnalisation. Il convient d’abord de s’assurer que l’outil choisi pourra s’intégrer dans le système d’information de l’entreprise.

Quelles sont les possibilités de personnalisation de l’outil ? Elles sont à examiner aussi bien au niveau de l’apparence de l’outil, de l’ergonomie, de l’apparence graphique, que des possibilités d’administration et d’ajout d’applications.

A suivre…

About these ads

6 réflexions sur “Dossier moteurs de recherche d’entreprise 5/6

  1. Bonjour, quelques compléments à votre dossier :
    – Connecteur : une entreprise a souvent des applications développées en interne pour lesquelles il n’y a pas de connecteur. Le moteur de recherche doit donc proposer un ‘kit de développement’ afin de faire son propre connecteur. Etudier la difficulté de mise en place de son propre connecteur, voir également les partenaires capables de travailler sur ces connecteurs
    – Droits d’accès : les applications à connecter n’ont pas forcément le même annuaire. L’outil peut prévoir du mapping, entre comptes, une connexion à un système SSO. Attention, le fait d’afficher la liste des résultats auxquels on n’a pas droit peut être problématique : connaître l’existence même du document (son titre) peut être préjudiciable…
    – Choix : De manière générale, un choix d’outil repose sur 3 axes : fonctionnel (fonctionnalités à pondérer suivant les besoins exprimés par la MOA), techniques (intégration dans le SI, "scalabilité", interface avec, langages, standards…), généralités (nombre d’installations, principe de facturation, CA sur ce produit, existence d’un Service Desk, taille de l’équipe de développement, club utilisateurs, existence de forums, roadmap produit, documentation…).

    Je conseille de faire un POC (Proof Of Concept) sur la short list des éditeurs avec un scénario précis (partir d’un corpus documentaire et/ou d’une application source donnée) pour mieux évaluer les systèmes proposés.
    De même, il est indispensable d’avoir des références client fournies par l’éditeur pour avoir un ‘vrai’ retour terrain

  2. Article intéressant et bien construit. Dommage qu’il soit truffé de fautes d’orthographe…

  3. Pingback: DIM = gestion de l'information numérique | Annotary

  4. Pingback: Dossier moteurs de recherche d'entreprise 5/6 |...

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s