Méthodologie. Pratique élémentaire de la recherche Internet, à l'usage des russisants

Les pages pointées par les hyperliens ci-dessous s'ouvriront dans une autre fenêtre de votre navigateur.

A. Quelques outils indispensables

Nous exploiterons autant que possible les ressources du "Web 2.0.": des interfaces simples permettent des créer très facilement des espaces individuels sur Internet, de rationaliser la consultation des sites pertinents ainsi que d'intégrer des résaux d'utilisateurs partageant des intérêts communs.
Ce site individuel est destiné à recevoir vos notes, et permet une efficace veille informationnelle : des flux RSS vous tiennent au courant des renouvellements de sites que vous souahitez suivre, sites d'information générale, ou messages de blogs spécialisés etc. Vous ajoutez et nommez comme bon vous semble les modules et onglets désirés. À titre d'exemple, utilisons le système:

www.netvibes.com

Exercez-vous à installer les modules de flux qui vous intéressent; supprimez les modules ("boîtes") vous sont proposées par défaut (ce système gratuit est financé par la réclame).

La technique d'importation et de création des flux RSS  est bien expliquée ici

http://freebeez2zero.blogspot.com/2007/08/enregistrer-des-flux-rss-dans-netvibes.html
Malheureusement, comme de nombreux agrégateurs de flux, netvibes rencontre quelques difficultés avec certains codages des caractères  russes...

les flux RSS peuvent également être captés par des applications lancées à l'extérieur du navigateur (les logiciels clients dédiés au RSS possèdent de nombreuses fonctionnalités spécifiques), ou par courrier électronique, ou encore par un paramétrage du navigateur internet lui-même, sans parler des lecteurs mobiles. Le point sur les programmes utilisables  (en anglais): Wendy Boswell.
www.snips.com

Nota Bene:  les matériaux déposés sont soit accessibles à tout internaute, soit privés : option disponible pour chaque fichier téléchargé. En tout état de cause, seuls les documents libres de droits peuvent être déposés. Pour les documents sous régime de copyright relevant d'un usage strictement personnel, vous pouvez  vous les adresser vous-même à votre propre adresse électronique (il est donc recommandé de disposer d'un hébergeur de courriel mettant à disposition un espace important).


Les procédures existantes sont décrites sur le site participatif Русский язык: наши университеты . Pour un usage rapide, il suffit d'utiliser un translittérateur en ligne:

www.translit.ru

Il est indispensable d'adapter les règles de translittération à l'usage voulu, en utilisant le menu déroulant de droite. La variante СЭВ se rapproche le plus de l'usage académique, mais remplace les "v" suscrits par "h". On peut aussi s'inscrire et construire son propre jeu de correspondances. 

B. Circonscrire le thème de la recherche et le formuler en fonction des outils utilisés.

Prenez le temps d'inscrire des formulations de requête en russe et en français dans un module "note" de votre portail personnel, dans notre exemple: netvibes. En attendant les développements du web sémantique qui permettra aux moteurs de recherche de chercher sur demande les occurrences des termes proches (synonymes, hyperonymes etc.), indiquez ceux-ci vous-mêmes. D'autre part, plus la formulation sera précise, plus la recherche sera pertinente.

Dans l'idéal, la formulation d'une requête implique un premier travail de consultation d'encyclopédies.

On dit souvent d'utiliser des "mots-clés". De fait, c'est une notion utilisée dans les sciences de la documentation et  par les créateurs de bases de données. Mais ces mots-clés sont souvent ambigus; même complétés par d'autres, ils ne permettent pas de bien circonscrire la recherche: je vous conseille plutôt de les inscrire en style dit "télégraphique". Il s'agira ensuite d'adapter le libellé de la requête à chaque système de recherche utilisé.


C. Moteurs de recherche.


Un réflexe à ne pas prendre - ou à perdre : utiliser le rectangle du moteur de recherche par défaut proposé par votre ordinateur (il s'agit souvent de Google ou de MSN). Voyez le chapitre 5 de la page Introduction élémentaire à Internet .

Deux principes pour une recherche scrupuleuse et efficace:

1. Utiliser la fonction "recherche avancée" (расширенный поиск) lorsqu'elle existe ;
2.  Utiliser le moteur le plus approprié à sa recherche.

Pour une requête en langue russe, les sites suivants semblent être les plus performants actuellement. Ils écarteront maints sites en langue russe de domaines non russes, mais ne confonderont pas les mots друг et другой!

Яндекс : près de 50% des recherches sur runet ; c'est le "Google russe" avec de nombreuses fonctionnalités en ligne: dictionnaires, notamment ;

Рамблер : tient compte des signes de ponctuation dans les requêtes entre guillemets ;

Turtle : l'option Поиск по фрагментам permet de trouver des textes similaires à celui que l'on introduit - utile contre le plagiat! Certaines requêtes renvoient hélas un message d'erreur.

Mail.ru : pas de recherches avancées, mais des outils utiles sur ce site très utilisé en Russie: dicitionnaires, forums des utilisateurs de mail.ru etc.

Nigma : en plus des réponses est proposé un utile classement thématique des pages trouvées; utilise également - sur demande - les résulats de 7 autres moteurs.

Aport : L'un des premiers moteurs russes ; pas de recherche avancée ; cède la main à d'autres moteurs en fin de page ;

Webalta : ne possède pas de recherche avancée ; suggère des mots clefs durant la frappe ;

Qwika : recherche dans l'encyclopédie participative Wikipedia ;

Gogo.ru : pas de recherche avancée, mais option permettant de visualiser une grande portion de chaque page trouvée ;

VisualWorld : avec représentation graphique des champs associatifs ;

Вершки Рунета : à partir des pages d'accueil; recherche avancée accessible après une première requête; possibilité d'une visualisation en nuages ;

C. Autres outils de recherche

- Les méta-moteurs (метапоисковые машины / системы) pallient les lacunes des moteurs de recherche pris isolément; les algoritmes de ces derniers filtrent certaines informations au détriment d'autres, augmentant la part invisible d'Internet au fur et à mesure que se multiplient les pages web. Les métamoteurs diffusent une seule requête dans plusieurs moteurs, et comblent donc les lacunes des uns par les trouvailles des autres. 

Les métamoteurs russes Metabot.ru et Следопыт (projet interrompu) permettent d'effectuer cette recherche sur les sites russes. Certains métamoteurs internationaux gèrent correctement les caractères cyrilliques russes: la recherche est alors élargie à la toile russophone, tous noms d'hôte confondus: .ru (Russie), .ca (Canada), .fr (France) etc. Polymeta et Clusty proposent un classement thématique des URL trouvées, le second  donnant en outre un aperçu  de chaque page répertoriée; Ixquick et Mamma donnent moins de détails pour chaque URL.

- Certains protocoles permettent également d'accéder à des fichiers se trouvant sur des serveurs de particuliers. Toutefois, certains des fichiers disponibles enfreignent la législation sur les droits d'auteur. La pérennité de ces moteurs paraît dépendre autant de l'usage qu'on en fait que de leur stratégie: personnellement, je recherche ceux qui sont actifs quasiment à chaque requête.  

Tels sont les moteurs de recherche des ressources FTP: ces fichiers sont téléchargeables au moyen d'un programme (ou "client") FTP. Il faut connaître l'adresse du serveur et un mot de passe. Pour le segment russe  de la Toile ou "runet" qui n'est bien entendu qu'une partie des sites russophones, le moteur de recherche dédié est Filesearch.ru. Il ne peut pas concurrencer le moteur international ftpsearch. On testera également les moteurs FTP présentés sur ce site académique français. Certains sont inaccessibles, car ils nécessitent un mot de passe.

Il faut également mentionner le peer-to-peer, permettant l'échange de fichiers de poste ("peer") à post. Il existe de nombreux logiciels ("clients") et systèmes; le fonctionnement et l'usage, un peu délicat, de ces procédés est décrit schématiquement sur cette page.

Nota bene. Ce système a la réputation de diffuser souvent des fichiers non libres de droit (il s'agit de l'accusation jadis faite aux bandes audio et video enregistrées!), ce qui le ferait tomber sous le coup de la loi Création et internet (HADOPI) Toutefois, un usage raisonnable à nos fins purement académiques s'assimile à des actions banales qui ne contreviennent pas à la loi: de même qu'on peut prêter un disque ou un livre, ces systèmes permettent la circulation de fichiers. On rappele en outre l'existence de l'exception pédagogique pour la diffusion à cercle restreint de matériaux destinés à l'étude.
Enfin, à chacun de trouver les forums de discussion, les portails et annuaires spécialisés. On trouvera certaines ressources sur  Русский язык: наши университеты.

C. Conservez les adresses des pages  pertinentes:

- Dans netvibes: soit en copiant-collant les URL à partir de la barre d'adresse de votre navigateur dans un module "note", soit en créant un module "Bookmark" ("signet").

- Il est aussi possible de créer des carnets d'adresses Internet personnels en-ligne ; ces services ne font pas double emploi avec netvibes (qui est plutôt une sorte de calepin en ligne doublé d'un lecteur de flux RSS): en plus de conserver l'information à l'abris des aléas du poste sur lequel on se trouve, ils permettent d'organiser à sa guise les URL souhaitées. Les plus connus sont intégrables à Firefox ou Internet Explorer.

Par exemple:

del.icio.us

A suivre...

R. Camus. Page modifiée le 1 juin 2009