Transférer le contenu de MediaWiki vers Git.

Je travaille sur du contenu provenant d’un wiki MediaWiki (le moteur de Wikipedia).
Je souhaite transformer le texte des articles, vers d’autre format. Comme il y a beaucoup d’accès en lecture, j’ai envie d’avoir une copie du wiki en local. Quitte à l’avoir en local autant que ce soit dans un format structuré qui me permette de suivre les évolutions des articles, de revenir à une date précise au besoin… et git semble tout à fait correspondre à ce type de besoin.

MediaWiki vers Git

Comme souvent quand on a ce genre d’idées avec des outils open source, on n’est pas le seul. D’autres l’ont déjà fait avant moi. Voici la liste des projets que j’ai identifiés.

Levitation
Code: http://github.com/scy/levitation

Plus d’informations avec l’annonce du projet sur le blog ainsi que cette ancienne version de la FAQ

levitation-perl (perl)
Code: http://github.com/sbober/levitation-perl

Cet article de blog parle de ce projet (l’auteur a également fait des modifications à ce projet que l’on retrouve dans ce fork).

git-mediawiki (ruby)
Code: http://github.com/singpolyma/git-mediawiki

mw-to-git (perl)
Code: http://github.com/git/git/tree/pu/contrib/mw-to-git
(dossier contrib du projet officiel git)

Plus d’explications sur ce wiki. Il s’agit d’un projet d’étudiants dont l’énoncé est disponible (en français).

autres références

http://en.wikipedia.org/wiki/User:Singpolyma/git-mediawiki

http://article.gmane.org/gmane.comp.version-control.git/167560

Mon choix
Je n’ai pas encore fait l’évaluation des différents outils, mais voici mes critères.

  • Simplicité du programme.
  • Organisation des fichiers après le checkout d’une version donnée (arborescence, présence des méta-informations…)
  • Possibilité de s’abonner aux dernières modifications (via RSS par exemple) pour mettre à jour le dépôt git.

Quelques tests nécessaires en perspective…

Une réflexion au sujet de « Transférer le contenu de MediaWiki vers Git. »

  1. Ping : Jmini Dev

Laisser un commentaire