Service Web
Objectifs
Dans un premier temps, le webservice (WS) doit permettre d'extraire des informations textuelles d'un MediaWiki (MW) pour en intégrer tout ou partie dans un site tiers. Les données extraites pourront être traitées spécifiquement sur ces plateformes web (création de graphiques, schémas ou autres ...).
Ensuite, pour compléter et enrichir le contenu disponible sur le MW, le WS devra permettre le moissonnage de données issues de sources externes (GRIN, MANSFELD, PROTA4U etc.).
Exporter du contenu
L'export de contenu textuel doit répondre à ces deux objectifs :
- afficher le texte de la plateforme sur un site web distant, en choisissant d'afficher tout ou seulement une sous-partie de ce texte.
- proposer une structure des données exportées pour permettre des traitements equivalents à ceux que l'ont pourrait faire avec des données issues d'une base de données
Comment ?
1) Explorer les possibilités présentes dans MediaWiki pour l'export des pages.
2) Travailler sur la standardisation de la structure des pages du MW.
3) Proposer des structures particulières pour certains types de données (ex: phénologie, taxobox).
4) Développer un webservice basé sur le principe REST permettant d'obtenir un XML descriptif d'une page (utilisant la structure commune).
5) Utiliser le WS pour afficher tout ou partie des données présentes sur le Wiki dans des sites externes.
6) Exporter ces contenus via le web service.
- permettre d'exporter toutes les données d'une page.
- permettre l'export d'un type de données précis (caractérisée par les tags qui l'entourent ?).
7) Récupérer les contenus (XML ?) issus du webservice pour les afficher sous forme de graphique/schéma.
Enrichir le mediawiki
Importer des contenus depuis des sites externes peut répondre à deux besoins :
- fournir à des groupes pré-existants des informations utiles pour donner un intérêt commun, pour susciter la participation;
- compléter les informations déjà saisies avec des données issues de bases de référence, internationnales, fiables et reconnues.
Comment ?
1) Déterminer quelle est la structure commune aux sites web de référence (probablement la structure HTML).
2) Découvrir des structures de données spécifiques aux bases GRIN, MANSFELD, GBIFF, ...
3) Enrichir le webservice pour permettre l'import de données vers le MediaWiki.
4) Définir quelles sont les données d'intérêt issues des bases de données et les importer dans le médiawiki.
Choix technologique
Le choix technologique n'as pas encore été arrêté, mais je travaille actuellement pour me perfectionner dans les technologies web, principalement en PHP ; JQUERY et sur le principe REST.
Actuellement (début avril) nous orientons donc sur un WS écris en PHP, répondant a des requêtes GET et POST de type REST, transmettant des informations encodées en JSON.
A terme, le WS devra être capable de reconnaître des requêtes issues à la fois d'une source partiellement contrôlée (le MW) et de sources Out of Control (OoC) (les sites tiers) ; mais aussi de reconnaître les informations pertinentes, de les récupérer, de les formater, et de les renvoyer de façon standardisées à l'émetteur de la requête.