Vous pouvez imprimer cette page pour un usage personnel. Pour un usage collectif, merci de demander une autorisation à l'auteur.

les outils de recherche sur Internet et sur le Web

<< 1. qu’est-ce qu’Internet ?3. formuler une requête >>

Les problèmes de la recherche de documents sur le web

Le web est enorme

La difficulté provient en partie de la taille du Web et du nombre considérable de documents qui s’y trouvent hébergés, répartis sur de nombreux sites. Il est impossible de connaître le nombe exact de ces sites et de ces documents, qui augmentent de façon exponentielle. Voici quelques chiffres valables en sept. 2005.

Nombre de sites Web : 70 millions.

Nombre de "pages" Web : 20 milliards.

Le Web n’est pas une bibliothèque !

Le Web invisible

Ces ressources constituent de ce qui est parfois appelé le Web invisible ou Web profond. Il s’agit surtout de ressources provenant de bases de données, accessibles à travers une passerelle. Une étude de la firme BrightPlanet a évalué que le Web profond pouvait contenir 500 fois plus de ressources que le Web indexé par les moteurs de recherche.

Searching on the Internet today can be compared to dragging a net across the surface of the ocean. While a great deal may be caught in the net, there is still a wealth of information that is deep, and therefore, missed. The reason is simple: most of the Web’s information is buried far down on dynamically generated sites, and standard search engines never find it. brightplanet.com >>

Le contenu de cette importante source d’informations qu’est le Web est donc d’un volume considérable, mais mal organisé et difficile d’accès. Heureusement nous disposons d’outils spécialisés pour y effectuer nos recherches.

les moteurs de recherche

Caractéristiques

Copernic AgentUn moteur de recherche du Web est un logiciel permettant de retrouver des ressources (pages Web, forums d’utilisateurs, images, vidéo...) associées à des mots-clés. Il est possible d’installer de tels logiciels sur son ordinateur (je recommande par exemple Copernic Agent >>).

GoogleCertains sites Web offrent un moteur de recherche comme principale fonctionnalité ; on appelle alors “moteur de recherche” le site lui-même. L’exemple le plus connu de ce type de site-moteur de recherche est Google >>.

Personnalisation

Vous pouvez personnaliser (customize) un certain nombre de paramètres de l’interface du moteur de recherche que vous utilisez.

Par exemple en allant dans les Préférences de Google, vous pouvez :

allthewebLe moteur de recherche AlltheWeb permet une personnalisation avancée, mais n’offre pas le choix de la langue de l’interface, contrairement à Google (seulement l’anglais). Vous pouvez personnaliser vos raccourcis clavier et même demander un affichage utilisant votre propre feuille de style (si vous savez comment écrire une feuille de style CSS).

sélection de moteurs de recherche

Voici une petite sélection de moteurs de recherche que vous pouvez tester afin d’estimer leur degré d’utilité par rapport au type de recherche que vous effectuez le plus souvent. Ils sont classés en ordre alphabétique.

AOL >>

Ce moteur offre des fonctionnalités pratiques d’affinage par mots-clés et de zoom par catégorie : sur la base des mots rentrés dans la boite de requête, l’internaute se voit proposer plusieurs catégories et sous-catégories. Sur l’exemple ci-dessous on voit qu’à un recherche demandée sur le mot didactique le moteur AOL propose de zoomer sur des concepts proches : Didactique des langues, etc.

google scholarGoogle Scholar >>

Ce moteur est en version de test à la fin de 2004. Il vise plus spécialement les publications scientifiques et universitaires. A essayer absolument ! Voici un extrait de la documentation officielle du site (en anglais uniquement).

Google Scholar enables you to search specifically for scholarly literature, including peer-reviewed papers, theses, books, preprints, abstracts and technical reports from all broad areas of research. Use Google Scholar to find articles from a wide variety of academic publishers, professional societies, preprint repositories and universities, as well as scholarly articles available across the web.

KartooKartOO >>

Métamoteur de recherche cartographique. KartOO présente les résultats sous forme d’une carte reliant entre eux les concepts voisins de votre thématique de recherche. Un très bel outil qui permet de visualiser rapidement les sites contenant des documents en lien avec votre thème de recherche. KartOO dispose d’une aide en ligne très bien faite.

MSN SearchMSN Search >> & MSN Search France >>

Lancé le 11 novembre 2004 en version beta. A son lancement, le moteur de Microsoft comprend un index de plus de 5 milliards de documents. On peut choisir parmi 12 langues de recherche.

yahooYahoo! >>

La nouvelle version de Yahoo! Recherche propose toute une palette d’outils et de services afin de vous aider à trouver tout ce que vous cherchez, plus facilement et plus rapidement que jamais.

Les annuaires

Caractéristiques

Comment ça marche

Voici un exemple de résultat d’une requête de recherche faite sur Jane Austen dans l’annuaire Yahoo! >> en anglais. Passez la souris sur les zones encadrées en rouge de l’image pour plus d’information.

Passez la souris sur les zones encadrées de rouge pour plus d’information

Moteur ou annuaire ?

Il y a quelques années, certains sites étaient spécialisés en tant que moteur de recherche Web et d’autres en tant qu’annuaire ou répertoire (directory). Maintenant, les sites de moteurs de recherche les plus connus offrent les deux types de fonctionnement (et même davantage). Par exemple Google était un moteur de recherche et Yahoo était un annuaire : l’un et l’autre site offrent maintenant les deux modes de fonctionnement.

Les annuaires spécialisés ou thématiques

En dehors des grands annuaires de recherche sur le Web comme Google ou Yahoo! on trouve des annuaires spécialisés dans des domaines précis. Pour des recherches dans le domaine des lettres et langues, voici une petite liste d’annuaires utiles. Ils sont parfois appelés signets.

Les signets de la BNF >>

Les Signets de la Bibliothèque nationale de France proposent une sélection commentée de ressources accessibles par Internet, choisies par les bibliothécaires de la BnF, qui les classent et tiennent à jour leur description. Ce site de la BNF est un point d’entrée remarquablement bien fait pour toute recherche sur le Web.

Les sites conseillés par le SCD de Rennes 2 >>

Sélection de sites réalisée par les responsables du Service Commun de la Documentation de Rennes 2.

Infomine >>

Annuaire anglophone spécialisé dans les ressources Web de type universitaire. Les résultats offrent une garantie de sérieux. Voir en particulier les sections suivantes :

Cultural Diversity & Ethnic Resources >>

Social Sciences & Humanities  >>

Vous trouverez ci-dessous une sélection de sites portails, ou sites de liens pour la littérature, l’histoire ou la civilisation allemande, anglaise et espagnole. Merci de me signaler l’existence d’autres sites portails pour la littérature ou la civilisation de ces langues ou pays ou d’autres langues ou pays.

Littérature allemande

Voice of the shuttle >>

Monde anglo-saxon

Le projet Albion >>

Portail de Ressources Electroniques pour Anglicistes. Dernière mise à jour: 18 mars 2003.

Littératures de langue anglaise

Voice of the shuttle >>

Made by the U.California, Santa Barbara, English Department. Alan Liu’s superb collection of electronic resources for the humanities.

University of Arkansas at Little Rock >>

U of Arkansas at Little Rock English Dept. website lists search engines and indexes to literature.  Scroll down to Literature Sites on Web for links to teaching literature, film and media, etc. Also look at Reference links for on-line dictionary,  MLA style guide, biography search engine, science fiction study guides, and more. Other sections of this site include Resources for Writers,  Women Writers.

Literary Resources on the Net >>
by Jack Lynch of Rutgers

Irish Studies (le projet Albion) >>

Espagne & Espagnol

Littératures de langue espagnole

Literatura en Internet ¿Qué encontramos en la WWW? >>

Enlaces de Literatura Española anterior a 1939 >>

Les groupes de discussion

En dehors des moteurs de recherche et des annuaires, les groupes de discussion peuvent s’avérer une source utile d’information pour votre recherche.

Certains groupes ou forums de discussion ne font pas partie de la catégorie "Groupes de discussion" sur les forums Usenet. Vous pouvez les découvrir par une recherche par mots clés sur un moteur de recherche sur le Web. Par exemple: Jane Austen Forum >>.

Iconographie

Dans le cadre d’une recherche en vue d’un mémoire ou d’une thèse dans le domaine de la civilisation, on procédera à une recherche de documents iconographiques en sélectionnant le mode Image des moteurs de recherche.

Exemple de sujets de mémoires de maitrises soutenus à Rennes 2.

William Blake’s The Marriage of Heaven & Hell, an imaginative war for freedom.
Allo, D. 2001.

image image image

L’affiche républicaine durant la Guerre d’Espagne : éléments d’une rhétorique de l’image politique espagnole.
Ayrault, Patricia. 1987.

image image image

<< 1. qu’est-ce qu’Internet ?3. formuler une requête >>