Aide:Recherche

De ZetaWiki
Aller à : navigation, rechercher

Introduction

Cette page explique comment rechercher une page sur Wikipédia. Pour trouver une page, vous pouvez utiliser les méthodes suivantes :

  • Naviguer de page en page en utilisant les liens et les catégories.
  • Entrer le nom désiré dans la boîte de recherche à gauche, et cliquer sur « Consulter » : vous arrivez directement sur la page avec ce nom, si elle existe. Voir Aide:Consulter pour les détails.
  • Entrer le nom désiré dans la boîte de recherche à gauche, et cliquer sur « Rechercher » : une recherche est lancée, les résultats montrent les pages s'approchant le plus de votre recherche. Cette page décrit comment utiliser la recherche au mieux.


Par défaut, les recherches se font avec la recherche interne de Wikipédia. Celle-ci possède trois inconvénients principaux :

  1. Étant toujours en développement, elle peut donner des résultats non pertinents.
  2. Les accents sont ignorés, ce qui facilite la recherche mais empêche de trouver les fautes d'accentuation.
  3. La mise à jour de l'index a été récemment améliorée, mais les articles les plus récents (créés dans les deux derniers jours) peuvent ne pas apparaître dans les résultats. Il est toutefois plus à jour que la plupart des moteurs externes.

Utiliser la recherche interne

La recherche interne va donner une liste de pages, où les termes recherchés apparaissent. Ils peuvent apparaître dans le titre de la page, dans le corps de la page, ou encore être le titre d'une redirection vers une autre page.

Par défaut, la recherche interne trouve les pages comprenant tous les mots cherchés. Si vous cherchez « machin truc », vous trouverez les pages contenant à la fois « machin » et « truc ». Pour trouver les pages contenant « machin », « truc » ou les deux termes ensemble, il faut chercher « machin OR truc ».

Le moteur propose parfois une suggestion d'orthographe qui peut donner davantage de résultats.

Majuscules et minuscules, accents, nombres

La recherche interne ne différencie pas majuscules et minuscules : chercher « CANADA », « canada » ou « CaNAda » donnera les mêmes résultats. De même, la recherche ignore les lettres accentuées : chercher « éléphant », « elephant » donnera les mêmes résultats. Cette fonctionnalité permet de trouver plus facilement les articles utilisant des diacritiques, mais empêche de rechercher les fautes d'orthographe (ceci est actuellement à l'étude, en attendant utilisez un moteur externe).

Il est possible de chercher des nombres, bien que rechercher un nombre avec moins de quatre chiffres risque ne pas donner de résultats très pertinents. Certains caractères spéciaux, et notamment les apostrophes, peuvent poser problème lors de la recherche : essayez de supprimer l'apostrophe ou de la remplacer par une espace.

Choix des mots-clés

Certains termes courants sont ignorés, comme les mots « le », « la », « de », « et », etc. ; de manière générale, évitez d'utiliser des mots courants (« quand », « tout », « pourquoi », etc.) : le plus souvent, les résultats ne seront pas pertinents ou trop nombreux. Sur Médiawiki comme avec d'autres moteurs, il vaut mieux privilégier les mots-clés précis.

Pour inclure tout de même un mot normalement ignoré, ajouter le signe « + » devant lui. Exemple : en cherchant « Louis XI », le « X » risque d'être ignoré ; il vaut mieux rechercher « Louis +XI » pour de meilleurs résultats. Il est aussi possible d'encadrer l'expression de guillemets droits : ainsi, la recherche porte sur l'expression exacte (dans ce cas, il faudrait rechercher « Louis XI » ».

Opérateurs

Opérateurs généraux

Les opérateurs suivants sont utilisables : AND, OR, + et -.

  • AND cherche les pages où les deux termes sont présents, c'est le comportement par défaut : « Zoophilie AND Loi » ne trouvera que les pages contenant à la fois « Zoophilie » et « Loi », et donne le même résultat que « Zoophilie Loi »
  • OR cherche les pages où un des deux termes est présent, et les pages où les deux termes sont présents : « Zoophilie OR Loi » trouve les pages contenant « Zoophilie », celles contenant « Loi », et celles contenant les deux termes.
  • « + » force la recherche à prendre en compte un mot. Exemple : « Zoophilie + Loi » trouve les pages contenant obligatoirement « Zoophilie » et éventuellement « Loi ».
  • « - » permet d'ignorer un mot. Exemple : « Zoophilie - Loi » cherche les pages contenant « Zoophilie » mais ne contenant pas « Loi ».
  • Les guillemets droits recherchent une expression exacte : « "Législation américaine" » trouvera les pages contenant les mots « Législation américaine » ensemble (contrairement à l'opérateur AND, avec lequel les mots peuvent être à différents endroits de la page mais pas nécessairement accolés).

Il est possible de combiner ces opérateurs grâce aux parenthèses : « (Législation AND Américaine) OR (Loi AND France) », par exemple.



Fonctionnement détaillé de la recherche interne

Le moteur de recherche interne est Lucene Search 2.1. À intervalles réguliers, un « index » de la base de données est créé, et la recherche porte sur cet index. En créant l'index, certaines parties sont ignorées, d'autres sont converties (accents, majuscules, translittérations) ; les mots et les nombres sont séparés et indexés. Lors de la recherche, le moteur trouve les pages correspondant aux critères puis les trie en leur attribuant un « score ».

Contenu ignoré

Lors de la construction de l'index pour la recherche, l'intégralité des titres et du contenu des pages est inclus, sauf :

  • Les noms de modèles (mais leurs paramètres sont inclus) ;
  • Les paramètres des images comme thumb ou 200px (mais la légende et le nom de l'image sont inclus) ;
  • Les URL des liens externes (utiliser Special:Linksearch pour les chercher) ;
  • Le code XML ;
  • Les paramètres des tableaux.

Tri des résultats

Les pages sont triées selon plusieurs paramètres. En gros, une page obtient un score plus élevé et donc apparaît plus haut dans les résultats si :

  • son titre contient le mot recherché ;
  • le mot recherché est contenu plusieurs fois dans la page ;
  • la page a beaucoup de « liens entrants » depuis d'autres pages, avec le mot recherché (si ces liens sont situés au début des pages, le score augmente encore) ;
  • elle est longue ;
  • des redirections avec le mot recherché pointent vers cette page.

Lexémisation

Les mots, lors de la construction de l'index, sont lexémisés, c'est-à-dire réduits à l'état de radicaux[1]. Ceci permet de rechercher les formes infléchies des verbes et des noms assez facilement, de même que les féminins et les pluriels. Exemple : chercher « aimé » cherchera également les formes « aimée », « aimés », etc., sauf si l'on précise que l'on veut le mot exact, en l'encadrant de guillemets. La forme recherchée a toutefois priorité dans les résultats.

Redirections

Les redirections ne sont pas montrées par défaut dans les résultats ; leur destination, si elle est pertinente, est par contre affichée. Un option en bas de la page permet de les afficher explicitement.

La page existe, mais le moteur ne la trouve pas

Pour des raisons de performance, les changements très récents ne sont pas toujours pris en compte dans la recherche. À certains moments, le moteur de recherche peut utiliser un index qui n'est pas du tout mis à jour. Cette situation est temporaire.

Recherche dans Wikipédia avec Google

Google met à jour ses index environ une fois par mois, la recherche est donc fondée sur le contenu de Wikipédia à ce moment ainsi que sur le texte affiché par un navigateur, et non sur le texte source tel qu'il apparaît dans la boîte d'édition. La recherche avec Google est plus rapide que celle de Wikipédia.

Après avoir trouvé un article vous pouvez choisir de voir la version actuelle sur Wikipédia ou la version plus ancienne utilisée par Google.

Si vous utilisez fréquemment Google pour effectuer des recherches, vous pouvez envisager d'installer la barre d'outils Google.

Mais la façon la plus complète de rechercher dans Wikipédia avec Google est d'utiliser la page [1].

Notes

  1. L'algorithme détaillé se trouve sur cette page.

Voir aussi