Infodoc en ligne

cahier-crayon

Dossier moteur de recherche d’entreprise 2/6

Poster un commentaire

Voici la deuxième partie de mon dossier sur les moteurs de recherche d’entreprise. L’article de la semaine dernière présentait ce qu’est un moteur de recherche et son fonctionnement général.

Cette semaine, nous aborderons les différences entre la recherche d’information sur le web et la recherche d’information en entreprise. Cette dernière présente des spécificités qui font que la recherche en entreprise est plus complexe que celle sur le web.

Comme toujours, n’hésitez pas à commenter si vous avez des choses à dire sur le sujet.

Bonne lecture.

Première partie – Un moteur de recherche d’entreprise, qu’est-ce que c’est ? (suite)

Moteur de recherche web ou entreprise : quelles différences ?

Les paragraphes suivant s’inspirent notamment de l’article d’Eric Debonne, Moteur de recherche Internet versus Entreprise.

Volumétrie et sélection de l’information

Même si les volumes d’information produits par les entreprises ont une croissance exponentielle, ils sont encore loin d’atteindre ceux du web.

Sur la toile, les moteurs de recherche procèdent à une sélection des pages qu’ils indexent, alors que dans l’entreprise tous les documents doivent être indexés. A part quelques documents exclus pour des raisons de confidentialité ou des documents privés par exemple, les utilisateurs doivent pouvoir retrouver tout document intégré dans le système d’information via le moteur de recherche.

Sécurité et droit d’accès

Sur le web, les documents sont publics et tout document indexé peut être consulté par n’importe quel internaute. Dans l’entreprise, l’accès aux documents est soumis à des droits. Le moteur de recherche doit intégrer ces règles de sécurité afin de ne pas permettre à un utilisateur d’accéder à un document qu’il n’a pas le droit de consulter.

Hétérogénéité de l’information

Les documents indexés sur le web sont généralement au format HTML ou à la rigueur dans des formats bureautiques classiques (format traitement de texte, PDF…). Dans l’entreprise, le moteur de recherche doit être capable d’indexer de nombreux formats différents, dont certains provenant d’applications métier spécifiques.ID-10033758

Métadonnées

Sur le web, les moteurs de recherche accordent peu d’importance aux métadonnées et privilégient plutôt le contenu des pages. Or, dans l’entreprise ces métadonnées sont porteuses d’informations essentielles (auteur, date de création, type de document, langue…). Il est important que le moteur les indexe et les traite pour faciliter la recherche de l’utilisateur. De plus, dans le cas de certains formats de documents pour lesquels l’outil ne peut pas indexer le contenu (fichiers son ou vidéo, formats propriétaires fermés), les métadonnées sont les seuls éléments sur lesquels l’outil peut s’appuyer lors d’une recherche.

Pertinence de la recherche

Sur le web, la pertinence des documents est en grande partie fondée sur les liens qui pointent vers une page. Ce système ne peut pas être reproduit en entreprise pour la bonne et simple raison que les documents de l’entreprise ne sont pas reliés entre eux par des liens hypertexte. Le calcul de la pertinence d’un document sera plutôt basé sur les occurrences de mots, leur place et leur poids dans le document. Par ailleurs, dans l’entreprise, l’administrateur de l’outil de recherche peut influer manuellement sur la pertinence en donnant plus d’importance à certains critères afin d’offrir aux utilisateurs des résultats plus pertinents selon le contexte.

Avec cette comparaison, on voit bien que la recherche sur le web et la recherche en entreprise, bien qu’ayant des points communs, ont des problématiques différentes.

Si, pour le web, tout le monde voit clairement quels peuvent être les avantages d’un moteur de recherche pour trouver des informations, cette utilité apparaît moins clairement pour les moteurs d’entreprise.

Pourquoi utiliser un moteur de recherche dans le système d’information de l’entreprise ? C’est à cette question que la deuxième partie de ce dossier va s’efforcer de répondre.

A suivre la semaine prochaine…

About these ads

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s