Aide:Archives/Assistant d'importation de pages

De Wikimedica

L'importation automatisée de page (dont le nom technique est l'extension ContentImporter) permet à un éditeur de Wikimedica d'aller récupérer une page d'une source externe (généralement d'un autre wiki ou d'un contenu en libre accès), de la traduire et de la mettre au format de Wikimedica, le tout de manière accélérée à l'aide d'une extension développée dans ce but.

Avertissements

L'importation de pages coûte de l'argent au projet![note 1]
Assurez-vous de bien lire cette page et de bien comprendre comment fonctionne l'outil avant de vous en servir.
  1. La technologie fait une bonne partie du travail d'importation, mais le résultat final n'est souvent pas parfait et demande très souvent une seconde révision par l'éditeur (pour révision linguistique, notamment).
  2. L'outil d'importation n'ajoute pas de données sémantiques.
  3. L'outil utilise le wikicode dans son interface, prenez la peine de tenter de comprendre son fonctionnement et vous verrez que c'est plutôt simple.[note 2]
  4. Vous êtes automatiquement ajoutés à la liste de suivi de la page importée.
  5. Pour le moment, deux personnes ne peuvent pas utiliser l'outil simultanément si elles importent depuis la même source / catégorie.
  6. Assurez-vous d'avoir un minimum de compréhension du fonctionnement de l'ontologie et de la structure de Wikimedica avant de commencer à importer des pages de sources externes.

Accès

L'outil se trouve dans les pages spéciales, sous la rubrique « Outils pour les pages » et se nomme « Importer à partir d'une source ». L'outil n'est évidemment disponible qu'aux utilisateurs enregistrés.

Principe de fonctionnement

Comprendre le fonctionnement de l'outil d'importation vous permettra de mieux comprendre ce qui s'est passé en cas de pépin et de mieux aider les développeurs à régler les bogues. Cette section vous explique les différentes étapes réalisées par la machine avant d'en arriver au résultat final.

Le script de l'outil d'importation se divise en deux étapes principales : la récupération et la sauvegarde d'une page.

Récupération

L'outil d'importation :

  1. récupère une page à importer depuis la source ;
  2. vérifie si la page n'a pas déjà été importée (exemple), si elle a été sautée (exemple) ou si son importation a été reportée (exemple) ;
  3. récupère l'ID Wikidata ;
  4. traduit le titre de la page en français[note 3] ;
  5. tente de détecter la classe ontologique de la page source ;
  6. remanie le texte de la page source pour le mettre aux standards éditoriaux de Wikimedica ;
  7. remanie les sections de la page source pour les faire correspondre à celles de la classe ontologique choisie sur Wikimedica ;
  8. affiche le résultat des étapes 1 à 7 à l'écran (voir section interface).

C'est habituellement à l'étape 8 que les éditeurs modifient le contenu, le type de structure ontologique (page de type « maladie » ou de type « médicament ») , ajoute des redirections, renomme la page de manière appropriée, etc. Lorsque l'éditeur est satisfait du résultat, il sélectionne sauvegarder (voir section Sauvegarde).

Sauvegarde

Lorsque l'éditeur sauvegarde la page, l'outil d'importation :

  1. traduit le contenu de la page ;
  2. sauvegarde la page sur Wikimedica ;
  3. sauvegarde les redirections vers la page (si l'éditeur en a spécifié) ;
  4. ajoute la page à la liste des pages importées ;
  5. récupère une nouvelle page (retour à la section « Récupération » ci-haut).

Interface

Pour mieux comprendre le contenu de cette section, il est conseillé de se rendre sur l'outil d'importation.

L'interface de l'outil débute par le choix de la source d'importation. Il est également possible de spécifier une catégorie (par exemple, Signs and symptoms) afin de cibler une catégorie de pages. Vous trouverez les différentes catégories disponibles sur la source même.

Une fois la source choisie, l'interface suivante s'affiche :

Boutons
  • Rafraîchir: refait un rendu de la prévisualisation de la page destination (ATTENTION, si vous avez fait des changements dans la zone Destination, vous allez les perdre!)
  • Reporter: reporte l'importation de la page à plus tard.
  • Sauter: quand la page ne sera pas importée (contenu non pertinent seulement).
  • Ajouter: traduction et importation de la page dans Wikimedica.

Zone source

  • Catégorie: si une catégorie a été spécifiée dans le menu précédent.
  • Titre: le titre source de la page, un titre spécifique peut également être récupéré depuis cet espace.
  • Source: le wikicode de la page source, utile pour comparer et dépister les erreurs de conversion.

Zone destination

  • Avertissement: si la page existe déjà sur Wikimedica.
  • Titre: le titre traduit de la page; attention, vous devez vous assurer que le titre est conforme aux Wikimedica:Conventions.
  • Redirections: permet de créer des redirections vers la page à ajouter (par exemple pour la page Anisocorie, Anisocorie (signe clinique) ).
  • Wikidata ID: l'identificateur Wikidata associé à la page.
  • Classe ontologique: une liste des classes ontologiques disponibles pour l'importation avec l'une d'entres-elle choisie par le système (ATTENTION, le système se trompe souvent!)
  • Améliorations: les améliorations à apporter à la page une fois qu'elle aura été importée.
  • Destination: un aperçu du wikicode de la page de destination.

Prévisualisation

  • Permet la prévisualisation de la page une fois importée sur Wikimedica.
  • Le texte anglais est utilisé, la page ne sera traduite que lors de l'ajout.[note 4]

La classe « concept »

Le concept est la classe ontologique source et définit une base de caractéristiques que toutes les autres classes ontologiques doivent posséder (comme une spécialité, un Wikidata ID, etc.) Dans l'outil d'importation, le concept peut être choisi comme classe si le contenu de la page à importer est pertinent, mais ne semble pas cadrer avec aucune classe ontologique définie dans la liste des classes ontologiques. Cependant, dans de très rares cas vous aurez à vous servir de cette classe.

Attention, l'outil ne supporte pas toutes les classes ontologiques. Si une classe existe dans l'ontologie mais pas dans l'outil et qu'une page à importer correspond à cette classe, il faut la sauter et y revenir lorsque la bonne classe aura été ajoutée à l'outil.

Dans de très rares cas vous allez avoir à vous servir de la classe Concept.

Procédure

Procédure détaillée

  1. Rendez-vous sur l'outil d'importation, choisissez la source et entrez la catégorie désirée. Le système récupérera ensuite une page à importer.
  2. Analysez la page (Quel est son niveau de qualité? Est-ce une maladie? Un médicament? Une page d'information patient? Une technique? Un symptôme?):
    1. Si le système vous informe qu'il existe déjà une page avec ce nom sur Wikimedica :
      • Ouvrir la page du même nom sur Wikimedica et comparez-la avec la page que vous désirez importer d'une autre source. Il vous faut ensuite analyser la qualité des deux pages.
        • La page de Wikimedica est définitivement mieux : sauter la page.
        • La page à importer est mieux que celle sur Wikimedica : continuer l'importation.[note 5]
    2. Si le système vous informe que Wikipédia semble avoir une page de plus grande taille :
      • Ouvrir la page du même nom sur Wikimedica et comparez-la avec la page que vous désirez importer d'une autre source. Il vous faut ensuite analyser la qualité des deux pages.
        • La page de la source est définitivement mieux : importer la page.
        • La page de Wikipédia est mieux, cliquer sur le lien dans l'avertissement pour ouvrir l'outil d'importation sur la page de Wikipédia. Il faudra ensuite sauter la page de la source en cours.
    3. Est-ce du contenu pertinent à importer sur Wikimedica?
      • Oui : poursuivre.
      • Non : sauter la page.
    4. Est-ce que la classe de la page à importer est disponible sur l'outil d'importation?
      • Oui : poursuivre.
      • Non : reporter l'importation de la page,
  3. Assurez-vous que le titre de la page cible est conforme aux conventions.
  4. Ajoutez des redirections si pertinent. Posez-vous les questions : est-ce que les utilisateurs de Wikimedica seraient susceptibles d'utiliser un autre nom pour en arriver à la page ? Par exemple, maladie de Behçet et Behçet (maladie) ou encore le nom commercial d'un médicament et son nom générique.
  5. Vérifiez la classe ontologique suggérée par le système.
    • Aucune classe ne semble s'appliquer au contenu de la page source : il est préférable de reporter (ou choisir concept).
    • Le système s'est trompé de classe : choisir la bonne et appuyer sur le bouton Rafraîchir.
    • Le système a choisi la bonne classe : poursuivre.
  6. Choisissez les améliorations à faire sur la page une fois qu'elle sera importée.
    • Si le système n'a pas entièrement réussi à associer les sections de la page source avec celles de la classe ontologique : structure de la classe.
    • Si la page manque de liens, ajoutez des liens.
    • Si la page manque de références, ajoutez des références.
    • Si vous avez choisi une classe complexe (comme maladie, médicament, situation clinique), vous devrez assurément indiquer qu'il faudra ajouter des balises sémantiques.
  7. Analysez rapidement l'aperçu wikicode et le rendu de la page.
    • Ajoutez des informations au modèle « Information » (voir information concept pour un exemple):
      • des spécialités;
      • un acronyme;
      • d'autres noms;
      • si le Wikidata ID est spécifié, n'ajoutez pas de terme anglais (ceci sera fait automatiquement).
  8. Ajoutez la page.
  9. Allez voir la page une fois importée sur Wikimedica.
    • Ajoutez des images / vidéos, etc.
    • Il se peut que Google Translate ait brisé certains éléments de la page en la traduisant, tentez au maximum de corriger ces erreurs.
      • Si vous n'y parvenez pas, avertissez un éditeur plus expérimenté.
      • Si vous remarquez que certaines erreurs se répètent d'une importation à l'autre, avertissez Antoine Mercier-Linteau afin d'ajouter une règle de compensation au système.
      • Ne passez pas trop de temps à réviser la page, assurez-vous seulement qu'elle fonctionne et qu'elle est utilisable. D'autres éditeurs en feront une révision plus complète ultérieurement.

Procédure simplifiée d'importation pour une page en particulier

Si vous avez un intérêt particulier pour un sujet (ex. péricardite) et que vous désirez importer une page sur ce sujet sur Wikimedica sans nécessairement faire le tri de toutes les pages précédentes dans la même catégorie, cette section est pour vous. Voici la procédure à suivre.

  1. Ouvrir la page web de la source à importer dans un onglet différent de votre navigateur.
    1. S'il s'agit de Wikidoc ou de WikEM, cliquer sur une catégorie de pages (ex: neurology)
    2. Choisir une page (lien en bleu) utile à importer sur Wikimedica et garder le nom en note dans la langue d'origine (ne pas traduire).
  2. Revenez maintenant sur Wikimedica.
    1. Cliquer sur Pages spéciales dans le menu de la colonne à gauche.
    2. Cliquer sur Importer à partir d'une source dans la section « Outils pour les pages ».
    3. Dans l'outil d'importation, choisir la source (ex. Wikidoc, WikEM, etc.).
    4. Inscrire le nom de la catégorie (ex: neurology).
    5. Inscrire le nom de la page à importer (ex. anosognosia).
      • Voir l'étape 1.2 ci-haut.
    6. Cliquer sur Récupérer le titre
    7. Dans le rectangle de droite, s'assurer que la traduction du titre est bonne. La modifier au besoin.
    8. Ajouter des noms alternatifs si nécessaire.
    9. Cocher la bonne classe ontologique (ex: signe clinique) puis rafraîchir.
    10. Vérifier que l'outil d'importation a importé tout le contenu de la page source. Modifier au besoin le wikicode de la colonne de droite.
    11. Cliquez sur Ajouter.
    12. Un message indique que la page est importée. Cliquer sur le titre de la page en bleu.
    13. Faire une lecture rapide pour modifier les erreurs de traduction.

Notes

  1. La traduction passe par Google Translate, un service payant aux entreprises.
  2. L'utilisation du wikicode n'est pas un choix mais une contrainte de ressources. Développer l'extension avec l'éditeur visuel aurait demandé beaucoup plus d'efforts.
  3. la traduction du texte se fait ultérieurement pour ne pas engendrer des coûts supplémentaires
  4. Ceci de manière à économiser sur les frais de traduction, car une page peut être appelée à être rafraîchie (avec une classe différente par exemple) ou modifiée avant d'être importée.
  5. Si une importation est faite par dessus une page existante sur Wikimedica, aucune information n'est perdue et tout peut être récupéré depuis l'historique.