== Respect du texte original ==
* respect de l'orthographe, y compris des erreurs typographiques et de ce que nous percevons comme des fautes d'orthographe (Wikisource autorise la correction des fautes d'orthographe, en particulier des coquilles d'imprimeur, mais cela peut avoir des conséquences imprévues).
* respect du formatage des caractères (italique, gras).
* Utilisation de la norme [[Unicode: Utilisation de la norme|Unicode]] pour les textes qui comportent des signes diacritiques ou qui sont écrits dans des alphabets non latins.
* remplacement du s long (ſ) par un s normal
* respect du estset allemand ß
'''Attention'''. Toute modification d'un texte peut donner lieu à droit d'auteur. Cela est vrai pour une traduction ou pour une modernisation. Par exemple, le texte original de Rabelais est libre, mais son texte modernisé il y a moins de 70 ans ne l'est pas. Un nouveau formatage du texte, une nouvelle pagination, une nouvelle organisation des notes, la mise à jour des noms scientifiques, etc., constituent autant de modifications donnant lieu à droits d'auteur. Quand vous scannez un texte ancien, vous pouvez donc partir d'une réédition récente pour obtenir un bon OCR, mais il faut impérativement le vérifier en totalité sur la base de la version originale.
== Formatage des pages ==
== Divers ==
En introduction, il convient de préciser sur quelle édition on a travaillé, quelle est la source du document numérisé, et à quel niveau de fiabilité on est arrivé. Ce dernier point est délicat, car il résulte d'un compromis. La recherche des dernières erreurs demande un temps infini, mais à l'inverse, un texte non fiable ne sera pas utilisable, ou demandera à l'utilisateur de le recorriger. Wikisource distingue les correcteurs et les validateurs. Un texte n'est considéré comme validé que s'il a été revu par un validateur différent du correcteur.
Quant on trouve un OCR d'une qualité suffisante pour en permettre la lecture, il vaut mieux travailler en deux temps. Mettez-le d'abord en ligne entièrement, en l'organisant en pages et en sections et en le formatant à minima. Le lecteur pourra en profiter immédiatement. Vous aurez ensuite le temps de le toiletter, en précisant le statut de chaque page dans sa page de discussion.
== Aspects techniques ==