David Gracia : comparatif des options de recherche (Yahoo, Bing, Viewzy, 2009)

download David Gracia : comparatif des options de recherche (Yahoo, Bing, Viewzy, 2009)

If you can't read please download the document

description

Comparatif des optons de recherche avancées disponibles sur Yahoo, Bing (avant la fusion donc) et Viewzy ainsi que des résultats proposés lors d'une recherche sur des mots clés généralistes.

Transcript of David Gracia : comparatif des options de recherche (Yahoo, Bing, Viewzy, 2009)

DAVID GRACIA

Comparatif de 3 moteurs de recherche.

Le foisonnement informationnel que l'on connat aujourd'hui, a permis de nombreux moteurs de recherche d'apparatre. Ceux-ci ont des fonctions qui peuvent varier selon le but qui leur est assign : moteurs de recherche grand public, qui tendent une prise en main directe mais qui de plus en plus propose, des options de recherches avances, afin de satisfaire des utilisateurs toujours plus exigeants. Des moteurs de recherches plus spcialiss ont fait leur apparition. On doit leur dveloppement l'mergence de base de donnes, rfrenant tous les types de documents dans un domaine particulier. Ces moteurs de recherches disposent gnralement d'options de recherche avance trs pointues, afin de garantir une slection optimale de l'information. Pour autant, nombre d'entre eux sont austres et difficile utiliser dans un premier temps.

Notre comparatif se concentrera sur la premire catgorie de moteur de recherche car en tant que rfrenceur stagiaire, nous jugeons plus pertinent d'orienter l'tude dans ce domaine. Notre choix s'est orient naturellement vers Yahoo et Bing de Microsoft. Nous complterons ce choix par le moteur de recherche Viewzi. Il est en effet intressant de voir comment se dveloppe les nouveaux moteur de recherche face aux gants du web, mais il est surtout ncessaire de comparer un moteur de recherche classique dans sa prsentation, son ergonomie, et une interface plus stylise, novatrice, en soulignant ce que cela apporte (ou pas...) l'utilisateur.

Il tait une fois...

Difficile d'aborder un comparatif sans quelques lignes de prsentation des diffrents protagonistes :

Premier challenger, Yahoo : ce dernier est l'origine un annuaire web qui utilisait la technologie d'un autre moteur de recherche, le discret Google. En forte croissance, Yahoo dcide en 2004 de dvelopper sa propre technologie de recherche web. Erreur fatale ? Si l'on veut, car c'est surtout le choix de privilgier les sites payants leur indexation dans les pages de rsultats qui a entran le dclin (relatif) de Yahoo. Au mme moment, un certain Google choisissait de considrer les liens externes pointant un site comme un vote, en basant le classement de ses pages de rsultats sur ce principe.

Notre second candidat n'est autre que l'ancien MSN search, d'une petite et pauvre socit nomm Microsoft. Le moteur de recherche Bing a vu donc le jour en 2004 sous le nom de MSN Search. Son papa, dsireux de contre-attaquer, suite au succs de Google et de Yahoo, se lance dans le march trs concurrentiel des moteurs de recherche. C'est en cet t 2009 que Microsoft lance une seconde offensive cense dstabiliser Google : MSN Search devient Bing.

Dernier candidat et beaucoup moins connu, Viewzi fait parti de ces mta-moteurs de recherche qui propose de multiples prsentations visuelles des rsultats : cartes, photos de pages web, graphiques, le tout en mettant l'interactivit au cur du projet. Sa dernire interface date de 2008.

Critres

Notre analyse abordera dans un premier temps des critres classiques : options de recherches, composition de la recherche avance, prcision des critres de recherches, oprateur de recherche...Une deuxime partie voquera la pertinence des rsultats envoys par les moteurs, les logiques qui prsident au classement des informations. Un lien sera fait avec la premire partie dans le cadre d'une approche pratique : comment se droule une recherche, quelle sont les possibilits qui me sont offerte l'affichage des rsultats ?. Plus nous progresserons dans l'tude, plus nous envisagerons l'usage des moteurs de recherches sous l'angle de la pratique.

Des moteurs toutes options...

Yahoo nous propose des options de recherche simple proche de Google, on peut ainsi choisir le type de document recherch, en cliquant sur les options situes en haut de la barre de requtes : images, vidos, golocalisation, actualits, mais aussi shopping. Pour autant l'option Plus ( droite de l'option shopping ) nous plonge vers une page de recherche beaucoup plus affine. Elle nous permet d'avoir accs la recherche avance. Fait original, cette recherche avance se divise en 4 pages : web, images, vido, actualit. La recherche avance Yahoo prend ainsi en compte la spcificit des documents recherchs pour dfinir ses critres. Sur cette mme pages Plus, nous trouvons galement un encart guide et aide avec les questions et les rponses des internautes.

Que nous propose Bing ? L'interface de Bing est, au niveau des options de recherche simple, la copie conforme de celle de Yahoo, elle mme copie conforme de celle de Google... allez savoir pourquoi... Les options sont toujours situes au dessus de la barre de requtes. On retrouve les mmes catgories : images, vido, actualits, shoppings et la dsormais fameuse et explicite option, Plus. Pour autant, Microsoft ayant dploy des trsors d'ingniosit pour se diffrencier de ses concurrents, Bing nous propose une option carte qui, comme son nom l'indique, permet d'afficher... des cartes pour golocaliser, ce qui, dans le cadre d'une requte de type mtadonnes est bien videmment trs pertinent... L'accs la recherche avance passe par la formulation d'une requte. La page de rsultats, proposant cot du nombre de page index pour cette requte, l'option avanc.

La page d'accueil de Viewzi ne propose qu'une seule possibilit : crire sa requte de recherche et... chercher ! La page de rsultats ainsi gnr permet, le long d'un bandeau d'options tout en image, de modifier la prsentation des rsultats : texte, capture d'cran des sites, cartographie chronologique des rsultats Google, nuage de tags illustr par des photos. A ces options s'ajoutent quelques possibilits de recherche : choix du format (photo vido), options actualits, every day shopping (oh ! voici les sempiternelles options de recherche classique qui rapparaisse !), mais aussi songs, album, gossip celebrity. Le site nous permet galement de choisir le moteur de recherche source (google ou ask... le choix est difficile, non ?)

Pour les options de recherche avance, nos trois moteurs de recherche se diffrencient plus fortement :

Nous l'avons voqu, Yahoo propose des options de recherche avance en rapport avec le format du document recherch. La recherche avance web permet de composer avec les oprateurs de recherche boolens ( et, ou, sauf) mais galement avec l'option expression exacte. La recherche avance, permet de slectionner les informations selon leur date de parution (option mise jour), selon le domaine d'o elles proviennent (.com, .gov...), le format des fichiers (pdf, word...), le pays d'origine et la langue des documents. La recherche avance d'image permet, en dehors des options avances prcdemment cites, de prciser la taille des fichiers mais galement des filtres de couleurs (Noir et blanc, couleur, de toutes les couleurs). La recherche de vido avance renvoie au site Yahoo vido : elle vise plus conserver des internautes autour de sites labelliss Yahoo, que d'apporter un plus aux options de recherches. Enfin la recherche avance d'actualits apporte quand elle un vrai plus : elle permet de dfinir une limite d'anciennet et de nouveaut des informations au jour prs. Elle permet galement de spcifier la source interroger ( je recherche tous les articles ayant pour mot cl politique paru dans le Figaro ou Libration par exemple.)Bien qu'incomplte, la recherche avance de Yahoo a le mrite d'exister. Ce n'est pas vraiment le cas pour notre trs cher Bing de Microsoft. L'option recherche avance se rsume la possibilit d'utiliser les oprateurs de recherche et ou sauf ainsi que expression exacte correspondant aux guillemets. On peut la manire de Yahoo prciser le domaine privilgi, le pays la rgion et la langue des documents... voil, c'est tout. Ajoutons tout de mme, l'affichage sur la gauche des rsultats, de propositions de termes associs notre recherche (pour la requte mtadonne, j'ai ainsi droit une dmonstration de la pertinence de cet outil: il me propose les termes lecture des mtadonnes... Le moins que l'on puisse dire c'est que Bing, l'image de Microsoft, ne prend pas de risque dans ses suggestions.

Pour viewzy, le constat est le mme : en dehors des options dj mentionnes, il n'y a pas de relle possibilit de recherche avance.

Conclusion du premier round : Yahoo sort vainqueur par KO. Microsoft semble avoir privilgi la simplicit et le minimalisme, ce qui, une priode o les sources d'information ne cessent de s'amplifier, au moment o les internautes sont de plus en plus exigeants et prcis dans leur requte, semble tre une stratgie d'arrire garde. Viewzy a quant lui choisi la dimension interactive et visuelle, au dpend de la recherche avance.

La recherche d'information.

La fonction premire d'un moteur de recherche est d'apporter des sources d'informations pertinentes pour une requte donne. Pour autant, cette pertinence dpend galement de nos attentes, de notre posture de recherche : recherche d'informations gnrales sur un thme, recherche d'articles spcifiques, slection de sources pour une veille...

Attardons nous dans un premier temps sur une requte gnrique, avec pour but d'acqurir une vue d'ensemble du sujet.

Prenons le terme politique : lorsque je tape cette requte sur Yahoo, j'ai immdiatement un ensemble de termes associs qui me sont proposs. Ces derniers apparaissent en dessous de la barre de requtes. Je choisi de les ignorer. Au niveau des rsultats, l'article sur la politique de wikipdia arrive premier. Vient ensuite, la page politique du Figaro, la page des vidos ayant pour thme la politique sur le site de l'INA, le site Yahoo actualits, puis le site politique.com, un peu plus bas politique.net et d'autres sites de grands quotidiens ou mensuels de la presse franaise. L'ensemble des rsultats semble pertinent si l'on s'en tient ma posture de recherche (dfinitions, informations gnrales.). A noter cependant que le classement de ces rsultats est un peu timide : Yahoo privilgie les sites de confiance, en plaant en premier Wikipdia, puis des sites de grands quotidiens et des sites dont le nom de domaine contient le mot cl de la requte. Il n'oublie pas non plus de faire sa publicit en plaant Yahoo actualits, dans cette page.

Pour Bing, la posture est identique : on retrouve premier les sites politique.com et politique.net, puis wikipdia. Petite diffrence, Bing semble privilgier des pages profondes des sites politique.com et ..net (page forum du site politique.com et page encyclopdie du site politique.net) au dpend d'une pluralit de rsultats. Ce choix entraine la disparition des sites des grands hebdomadaires franais. Le moteur de recherche n'oublie pas, comme Yahoo, de placer dans la page de rsultat son site, MSN Actualits. Si, comme prcdemment, notre recherche trouve largement de quoi alimenter son questionnement initial, on peut dplorer une plus grande pauvret de rsultats, et ce, suite au choix du moteur de privilgier des pages profondes de sites classs en premire position. A noter que les deux moteurs proposent des possibilits pour affiner la recherche: Bing et Yahoo vous soumettent un choix de mots cls annexes, Yahoo propose sur le cot gauche, un ensemble de liens vers des sites... dj prsent dans la page de rsultats, Bing propose sur son cot droit... des liens sponsoriss.

Qu'en est il de Viewzi ? Oh surprise ! Le premier rsultat n'est autre que... Wikipdia ! Le deuxime ? Wikipdia bien sr ! La suite ? Bien ! Troisime du classement... vous l'avez devinez ? Non, l c'est dur quand mme. Le site en question est un portail communautaire extrmement reconnu pour la qualit de ses informations politiques. Alors ? Mais oui ! Il s'agit de... M Y S P A C E. Voici donc que notre petit moteur de recherche se trouve recal ds le troisime rsultat. Certes, la suite est moins catastrophique : frenchpolitique.blogspot arrive quatrime ce qui, pour un moteur de recherche en anglais, semble faire preuve de pertinence. Pour autant cette pertinence disparat ds le sixime rsultat, o est index la page Privacy Policy de ...Facebook. Viewzi permet prsenter les rsultats de diffrentes faons : capture d'cran des sites en question, format classique en texte (o le classement n'est pas tout fait identique, mais o la pertinence semble encore une fois laisse de cot.), classement en Google timeline... Qu'est ce que c'est ? Il s'agit d'une interface graphique, qui classe les rsultats de Google sur la requte politique, selon une frise chronologique (certainement en fonction de l'ordre d'apparition de ces pages). Chaque page est reprsente par un petit rectangle bleu, o apparat son intitul. Visuellement sympathique, ergonomiquement discutable (les pages parues rcemment se marchent les unes sur les autres, se masquent mutuellement), cette option a pour l'instant tout du gadget. Le classement par photo tags cloud (nuage de liens photos) propose de reprsenter l'environnement smantique du mot accompagn de photos. L encore, c'est jolie, mais la pertinence des mots connexes laisse dubitatif : politques (bon l d'accord...), Ottawa (certes c'est un moteur canadien.) 2009 ( il prend pas beaucoup de risque l...) et bluesfest. Lorsque l'on clique sur le mot, un nouveau nuage de tags illustrs fait son apparition, on me propose des thmes connexes comme concert, national capital rock. Voil un bel exemple de srendipit.

Bien, un premire conclusion s'impose. Les moteurs de recherche sont frileux par nature : lorsqu'une requte aussi gnrique que politique est lance, ces derniers proposent une ensemble de sites de confiance qui les assurent d'une certaine pertinence, sans pour autant l'tre vritablement.. A ce petit jeu, la premire page de rsultats de Yahoo, est la moins incomplte, en proposant le nombre le plus important de source : encyclopdie, sites spcialiss, presse...Bing fait un aveux de faiblesse en choisissant les doublons de pages d'un mme site. Enfin que dire de Viewzi ?, le site peut cacher son manque de pertinence, grce sa Google timeline qui affiche les rsultats de ce dernier (et encore Google n'est pas non plus trs aventureux.). Mais que dire de ses propres rsultats : ils sont une simple agrgation des sites les plus connu du web (wikipdia, facebook, Myspace,) sur lequel on a lanc la requte de l'internaute. C'est loin d'tre satisfaisant pour un mtamoteur.

Bien passons maintenant la deuxime tape : une recherche prcise ayant pour but la constitution d'une collection d'article. Prenons donc un thme de recherche plus spcifique, sans pour autant tre trop ambitieux : nous allons chercher des documents ayant pour thme la politique trangre de la France.

Commenons par lancer une recherche simple sur Yahoo : premier rsultat... un lien sponsoris nous invitant nous rendre chez Amazon...bon passons. Deuxime rsultat, un article du site LCI sur les explications de Nicolas Sarkozy propos du retour de la France dans l'Otan : le rsultat colle au thme, mais l encore, tout dpend de la posture initiale de ma recherche : ici je recherche des articles de fond, d'analyse, toutes priodes confondues, et non un article de presse relatant des faits trs prcis. Le troisime rsultat est une page s'intitulant La politique trangre de la France issu du site France diplomatie. L'article est dans le thme, il est suffisamment long, mais il y a quelques rserves. Rserves qui illustrent la faon dont les moteurs de recherche classe les rsultats selon les requtes. Si le site France Diplomatie est si bien class, c'est avant tout car c'est un site institutionnel, donc un site de confiance, issu du ministre des affaires trangres. Sans remettre en question l'objectivit de l'article, il semble vident que la source n'est pas privilgier lorsque l'on recherche un article d'analyse et de critique. La suite des rsultats obit cette logique : deux rfrences de wikipdia (pas un mal en sois, mais encore une fois, tout dpend de la posture de recherche), nouvelle rfrence amazon, puis des sites d'homme ou de partis politiques. Il nous faut donc passer par la recherche avance. Je reviens donc sur le haut de ma page, et clique sur Options, la droite du rectangle de recherche, puis recherche avance. Trs rapidement deux options me semble pertinentes pour ma recherche : l'option Site/Domaine qui me permet d'liminer les sources en .gov. Ensuite, l'option format de fichier : elle permet de privilgier le format PDF et d'liminer ainsi un nombre important de page web et d'intermdiaire. Quel rsultats ? Je trouve un ensemble d'article en PDF me parlant de la politique trangre de la France... sous la monarchie. Cela cadre avec mon objectif premier, cela me permet de me constituer une collection d'articles, mais des limites subsistent : la grande majorit des articles provient d'un seul site, or il est ncessaire de multiplier les sources. Pour cela, je suis oblig de rentrer profondment dans les pages de rsultats, largement colonis par le site en question. Je trouve malgr tout quelques rsultats intressants (La politique chinoise de la France; Nouvelle Politique trangre; Quelle marge de manuvre pour la politique trangre franaise...). Grce la recherche avance, je peux donc me constituer sur Yahoo, une collection d'article satisfaisante, sur un sujet plus prcis (mais encore largement vasif).

Comment se droule la mme recherche sur Bing ? La requte offre un ensemble de rsultats bien diffrents, preuve de la difficult de faire une recherche exhaustive sur Internet. Hormis wikipdia, toute les sources rfrences sont diffrentes de celle cites par Yahoo. A noter que Bing confirme sa volont de privilgier les pages profondes des sites les mieux classs, au dpend de la pluralit des sources ( deux occurrences de wikipdia, deux occurrences de la documentation franaise, deux pour ambafrance.). Enfin, la grande majorit des sites sont des sites institutionnels. Essayons, comme pour la recherche Yahoo, d'accder directement des fichiers PDF excluant les sites gouvernementaux. Je remonte au dbut de ma page de rsultat, et clique sur le lien Avanc droite, cot du nombre de rsultats proposs. Comme pour Yahoo, vous pouvez limiter la recherche certains noms de domaine (il ne s'agit plus de les cocher ici, mais de les mentionner dans une barre de requtes). Pour le format ? Bing ne propose rien, rendant ainsi la recherche plus difficile. On peut certes taper sois mme Politique trangre de la France PDF et obtenir des rsultats relativement satisfaisant, permettant de constituer une collection d'article pertinente, sans mme rencontrer le problme de pollution que l'on a connu avec Yahoo, mais encore faut il y penser, car le site ne le propose pas de lui mme.

Enfin viewzi, recal ds la premire tape, a bien du mal franchir la deuxime. Lanons une recherche en format texte, avec la mme requte que prcdemment. Le premier rsultat est prometteur, puisqu'il s'agit d'un article issu du site Openlibrary, intitul la politique trangre de la France. Mais ce rsultat cache un peu la misre qui suit, non pas qu'il n'y ait absence totale de pertinence, (wikipdia est prsent, british library direct est galement prsent), car c'est surtout le manque de cohrence des rsultats qui blesse. Encore une fois, on a plus affaire une agrgation de sites populaires, sur lequel on a lanc la requte de l'internaute, qu' un expos plus moins cohrent de pages disponible sur cette thmatique (bien qu'aucun de moteur de recherche n'est atteint cette cohrence). On passe ainsi de wikipdia You tube puis de You tube abebooks. Aucune option de recherche avance n'tant prsente, il faut prciser sois mme sa requte pour obtenir des PDF. Paradoxalement, le rsultat est moins catastrophique que lors de notre premire recherche. Le meta moteur viewzi, semble plus l'aise lorsque les requtes sont affines.

Conclusion :

Nos trois moteurs proposent des fonctions de recherche relativement similaires. Pour autant Yahoo se dmarque par une prcision plus importante, sans pour autant atteindre des sommets. Nos trois concurrents sont des moteurs gnralistes, qui balayent une ensemble de pages trs important, ce qui peut expliquer certaines difficults obtenir des rsultats satisfaisants, lorsque l'on recherche des lments spcifiques et spcialises. Pour autant cela n' excuse pas la quasi absence d'option de recherche avance chez Bing. Le meta moteur Viewzi a, quant lui, clairement fait des choix ax sur le ludique. Pour autant, il s'agirait de ne pas oublier la fonction premire d'un moteur de recherches. L'usage de bases de donnes thmatiques, de moteurs de recherche ddis, est largement conseill, lorsque l'on se lance dans une recherche spcialise sur Internet.