FreeBook : Modèle et macro Word eBook pour les liseuses électroniques

 

Documentation : FreeBook.html

http://patrice.dargenton.free.fr/CodesSources/FreeBook.html

www.vbfrance.com/code.aspx?ID=53282

Par Patrice Dargenton : patrice.dargenton@free.fr

http://patrice.dargenton.free.fr/index.html

http://patrice.dargenton.free.fr/CodesSources/index.html

Version 1.01 du 13/06/2011

Mise à jour de la doc.: 18/06/2011

 

Des millions de livres peuvent être téléchargés gratuitement et légalement sur le net.

En ce qui concerne la légalité, tout ce qui date de plus de 70 ans est dors et déjà du domaine public (libre de droit, donc gratuit) : ne payez jamais ce genre de bouquin ! certains marboulins n'hésitent pas à vous y inciter, en contre partie d'une soi-disant "valeur ajoutée", cet article montre que vous pouvez très bien faire mieux vous-même (surtout si un livre ancien a été numérisé par des bénévoles, il ne manquerait plus que ça que de faire payer le bénévolat des autres !). Pour les livres récents, partez du principe que le téléchargement des oeuvres est du piratage à priori : à moins que l'auteur n'ait explicitement cédé tous ses droits, si on vous propose de télécharger des livres, ne croyez pas à priori aux messages plus ou moins équivoques vous incitant à le faire (le fait de payer ne garanti pas contre le piratage). Et si l'auteur a cédé tous ses droits, ce n'est pas très clair si les traductions sont elles libres de droits ou pas (je pense que non, mais je n'ai pas encore vu l'information exacte à ce sujet). Or pourquoi pirater, et ainsi nuire au développement de la culture, alors que vous pouvez acheter tous ces livres d'occasion pour un prix souvent dérisoire sur un site tel que Priceminister, par exemple ? Le livre d'occasion ne nuit pas à production culturelle, car seuls les livres de poche sont très bon marché, et il existe un délai de parution plus élevé pour le livre de poche, que pour le livre en édition standard ("de luxe") : ainsi, tout le monde s'y retrouve, et la promotion de l'auteur est assurée.

En ce qui concerne l'aspect technique maintenant, si vous avez une liseuse électronique (tablette de lecture avec un écran de type encre électronique : e-ink), alors le confort de lecture est absolument similaire à celui d'une surface papier imprimé, et l'appareil ne consomme de courant que lorsqu'on "tourne les pages" avec un bouton. Le seul point qui peut poser problème est le format du fichier, d'où ma contribution sur VBFrance : En partant du principe que le format universel le plus simple qui existe actuellement pour les liseuses est le format pdf, il reste que la taille de la page pdf doit être adaptée à la taille de l'appareil, et c'est bien là où le bât blesse. Je vous propose un modèle de document Word, ainsi qu'une macro Word pour convertir tout document Word dans un document au format A5 (deux fois plus petit que le format A4 standard), qui pourra ensuite être très facilement imprimé au format pdf via un utilitaire gratuit tel que CutePdf par exemple.

 

Cette macro Word donnera satisfaction dans 90% des cas, ce qui permet déjà de lire des tas de bouquins facilement, voici les fonctionnalités prises en charge :

 

 

Fonctionnalités

- Ajustement des tableaux à la largeur de la page (ou bien réduction de la taille des colonnes et la marge à gauche proportionnellement à la réduction de la largeur de la page, selon le choix de l'utilisateur, pour l'ensemble des tableaux) ;

- Ajustement des images (ajustement proportionnel, ou bien ajustement à la largeur ou hauteur max. de la page, selon le choix de l'utilisateur, pour l'ensemble des images) ;

- Ajustement des images dans les tableaux, une fois le tableau ajusté dans la page ;

- Conversion des images flottantes en images en ligne (c.à.d. dans le "flux" des caractères, afin de faciliter le redimensionnement automatique du document) ;

- Conversion des images EMF complexes (Enhanced MetaFile) en WMF (Windows MetaFile), les images trop complexes pouvant faire planter la liseuse (le Zinky reader en tout cas) !

- Suppression des sections et des colonnes (une seule section et une seule colonne, avec une mise en page adaptée au format eBook) ;

- Suppression des TextBox ou zones de texte, et récupération du texte dans le flux du document ;

- Réduction des retraits intempestifs (adaptation à la marge eBook normale) ;

- Recopie des propriétés du document d'origine dans le document eBook (avec possibilité de rendre anonyme l'eBook, en effaçant par exemple le champ invisible LastAuthor).

 

 

Limitations

- Les caractères de grande taille (par exemple en provenance d'une présentation PowerPoint) et en vidéo inverse peuvent rendre la page difficile à lire sur la liseuse ;

- La gestion des retraits est imparfaite (si le retrait est trop grand au départ, il restera trop grand) ;

- Les documents trop complexes (par exemple issu d'un copié/collé pdf ou d'une conversion Pdf2Doc imparfaite) peuvent rendre la page difficile à lire aussi.

 

Conclusion : la programmation Word est assez complexe, il est difficile d'écrire du code qui fonctionne à 100%, tant les cas particuliers sont nombreux, mais on arrive cependant à s'en sortir assez bien dans 90% des cas, si les documents d'origine sont assez simples, ou bien convertis au format Word.

 

 

Table des matières

Fonctionnalités. 1

Limitations. 2

La problématique. 2

Exemple de fabrication d'un eBook. 3

Mode d'emploi 4

Notes. 4

Gestion des retraits. 4

Document anonyme. 4

Agrandir un Pdf 4

Projets. 5

Spécification d'une tablette idéale. 5

Tablette à encore électronique. 5

Tablette LCD multimédia. 5

Liens. 5

Licences, droit d'auteur, copyleft 5

Formats de livre électronique. 5

Liseuses électroniques. 6

Bibliothèques de livres électroniques. 6

Critique. 6

Critique du livre "Richard Stallman et la révolution du logiciel libre - Une biographie autorisée" 6

 

 

La problématique

Malheureusement, la plupart des articles publiés sur le net sont au format pdf A4. Or celui-ci n'est pas facilement exploitable pour un changement de taille au format A5 (sans lequel la taille des caractères sera tout simplement illisible sur la liseuse, même en zoomant un peu grâce à la possibilité de faire pivoter en mode portrait/paysage avec défilement vertical) : Le copié/collé, lorsqu'il est possible, provoquera des coupures à chaque ligne (ce qui ne gène qu'un peu la lecture), mais vous fera perdre toutes les images, schémas, diagrammes... (ce qui gène beaucoup la lecture, selon les cas) : vous serez sans doute amené alors à trouver une autre méthode pour récupérer le contenu, et selon cette méthode, vous conserverez ou pas les images, la mise en forme, les notes de bas de pages, certains caractères plus ou moins spéciaux ou pas... cela peut devenir franchement galère. Dommage que très peu de personnes publiant sur le web ont une considération pour le changement de taille (reflow) de la publication qu'ils proposent. Mais cela va changer, car la lecture sur les appareils mobiles (dont le téléphone portable), pose exactement le même problème, avec une taille de page encore plus petite. Beaucoup d'acteurs du domaine travaillent sur un format de fichier permettant de redimensionner à la volée un document publié sur le net. Il était temps tout de même, on a perdu rien de moins que 10 ans depuis l'apparition de la technologie d'encre électronique, alors même que le MP3 à 20 ans ! Des milliards de documents ont été imprimés pour rien, simplement pour être lus une fois ! La forêt de la planète a été gaspillée de x% pour rien. Il est vrai cependant que l'enjeu des droits est effectivement énorme, d'où la réticence des acteurs, et il n'y a pas seulement le livre ordinaire, il y a aussi le livre multimédia pour les écrans LCD, les appareils connectés, ainsi que le livre interactif en Html5 de Google.

 

 

Exemple de fabrication d'un eBook

 

Voici un exemple de fabrication d'un eBook à partir du livre "Richard Stallman et la révolution du logiciel libre - Une biographie autorisée". Il est en libre téléchargement (selon la volonté de l'apôtre du "tout libre", Richard Stallman, dont le livre explique le pourquoi de cette philosophie) sur le site :

http://forge.framabook.org/stallman/

Manque de pot, aucun des quatre formats proposés (Pdf, Latex, ePub, Html) n'est exploitable dans le monde Windows, mais ce n'est pas un hasard, c'est une question d'autre planète : les aficionados du libre se refusent à utiliser tout ce qui pourrait restreindre leur liberté d'utilisation...

En effet, le format Pdf peut être copié/collé, mais chaque fin de ligne (sur la largeur du document d'origine) sera coupée par un saut de ligne dans l'eBook, ce qui est un peut gênant. De plus, toutes les lettres ff ou fi seront transformées en "." (??? peut être par l'utilisation d'un caractère spécial), ce qui est plus gênant.

Le format Html peut être copié/collé, mais il utilise une pagination Javascript qui est sympathique pour une lecture sur un navigateur, mais pas du tout adaptée pour convertir rapidement l'ensemble des chapitres dans un document final.

Mais tout bon geek (informaticien) ne doit pas s'arrêter à cette première barrière : en téléchargeant le logiciel gratuit Stanza de Lexcycle LLC, on peut exporter une version au format Word depuis le format ePub. Cependant, le convertisseur ne distingue plus clairement les notes de bas de page du texte principal, et les lignes sont coupées, ce qui est gênant, et surtout curieux, pour un export Word. En choisissant un autre format, on s'aperçoit que l'export au format html est très bon, car cette fois, le copié/collé fonctionne bien, à tel point que les césures des mots sont gérés avec des "traits d'union conditionnels", ce qui permet de changer la largeur d'une page en assurant la césure dynamique des mots (par contre, le regroupement des notes de bas de page en fin de chapitre est moins pratique qu'en fin de chaque page, comme dans Word).

 

Conversion ePub : Stanza de Lexcycle LLC :

www.01net.com/telecharger/windows/Utilitaire/manipulation_de_fichier/fiches/45840.html

 

Voici le résultat via ePub, puis html, puis Word, et enfin via la macro FreeBook, qui est assez bon (dommage que les styles "Titre 1" ne sont pas utilisés, donc pas de table des matières) :

Stallman_eBook.pdf

(voir aussi ma critique de ce livre en fin de ce document)

 

Conclusion : le format doc aurait pu être élu comme 5ème format de référence chez FramaBook : il suffisait d'utiliser à la place le format odt de libre office, ainsi la morale aurait été sauve (cela vaut quand même mieux que de faire lire un livre dans un format dégradé, ce qui arrivera forcément pour la plupart des lecteurs).

 

Voici le résultat avec un autre exemple :

Crime_et_chatiment_eBook.pdf

D'après :

http://classiques.uqac.ca/classiques/dostoievski/crime_et_chatiment/crime_et_chatiment.html

 

Voici les résultats avec divers documents, parmi mes publications, qui étaient déjà au format Word :

Icohd93_eBook.pdf (images normales), Rfia94_eBook.pdf (images agrandies, sinon les formules sont illisibles)

Voici ma thèse au format eBook, le document pdf produit est de bonne qualité, malgré la complexité du document (tableaux, images, tableaux avec images en plusieurs colonnes, ...). L'option choisie pour les tableaux est de ne pas les agrandir (réduire seulement ceux qui dépassent la nouvelle largeur de la page) :

These_eBook.pdf

Voici ce document même au format eBook :

FreeBook_eBook.pdf

 

 

Mode d'emploi

Je n'ai pas trouvé comment récupérer par le code le chemin des modèles de Word, il faut donc le modifier dans le code source de la macro selon votre cas, où bien alors utiliser le même que moi :

C:\ModelesMSWord\FreeBook.dot

(Pour changer le dossier dans Word : Outils : Options... : Dossiers par défaut : Modèles utilisateur)

Si vous voulez rendre votre document anonyme, remplacer aussi les champs suivant dans la macro (Auteur, LastAuthor, Société), ces 3 champs seront effacés dans le document de destination (et aussi dans celui d'origine si vous le sauver à la fin, voir aussi la rubrique Document anonyme ci-dessous) :

Const sAuteurARemplacer1$ = "Patrice"

Const sAuteurARemplacer2$ = "?"

Const sAuteurARemplacer3$ = "ORS Production" (champ société)

Ensuite copiez la macro dans Word et lancez McFreeBook sur un document à convertir.

 

 

Notes

 

Gestion des retraits

- Il y a une réduction proportionnelle des retraits à gauche selon la réduction de la largeur de la page par rapport à celle du document d'origine ;

- En plus et après la réduction proportionnelle des retraits à gauche, on vérifie les retraits de 1ère ligne (si le retrait dépasse 0.5 cm alors on le remet à 0.5 cm), et on corrige aussi les éventuels retraits négatifs.

 

Document anonyme

Le moyen le plus efficace de rendre un document Word anonyme est de l'enregistrer au format html, puis d'examiner (dans le code source html) les tags figurant dans la section html <o:DocumentProperties> qui se trouve immédiatement après les tags meta au tout début du fichier html : il suffit de supprimer les lignes indiscrètes, puis de rouvrir le html corrigé dans Word, puis de réenregistrer le document au format Word (vous pouvez alors vérifier que ces champs ont bel et bien disparus en refaisant une vérification du code html). Le champ LastAuthor est indiscret, car on ne peut pas le visualiser directement dans Word, il trace donc l'auteur du document à son insu.

Pour faire un pdf anonyme via CutePdf, il faut songer que CutePdf inclut le nom du compte utilisateur Windows dans le champ Auteur du pdf généré : la solution est donc d'imprimer depuis un compte dont le nom est neutre (par exemple "Invité").

 

Agrandir un Pdf

Si le fichier pdf est au format paysage A4, contenant deux pages A5, il est possible de le lire sur la liseuse Zinky en mode zoom (rotation paysage / double portrait), à condition d'agrandir le pdf : pour cela, il faut tourner le pdf à 90% dans Acrobat Reader, puis réimprimer le pdf via CutePdf avec, le cas échéant, un léger agrandissement (via les options d'impression avancées de l'imprimante PostScript CutePdf Writer : Mise à l'échelle).

 

 

Projets

- Il faudrait faire des statistiques sur les tailles des caractères utilisés, pour bien gérer une réduction proportionnelle de tous les caractères, sur la base de la taille de caractère la plus fréquente comme taille par défaut (fixée à 12 en Times New Roman dans le document eBook).

 

 

Spécification d'une tablette idéale

Tablette à encore électronique

L'idéal serait une tablette comme le Zinky, mais au format A4, avec les 3 bugs corrigés ! Il faudrait utiliser plutôt le nom du fichier pour l'intitulé du document (en gérant les accents), au lieu d'utiliser les propriétés du document (option à ajouter dans les réglages).

 

Tablette LCD multimédia

- Prise de notes (sur la page, avec un stylet) pour la relecture de document en vue de les corriger ;

- Apprentissage des langues : synthèse vocale pour la prononciation (et reconnaissance vocale pour la vérification de la prononciation), dictionnaires, traducteur, encyclopédie, ...

- La connexion internet est un plus, mais tout dépend du prix et de la qualité de l'affichage : mieux vaudrait une parfaite qualité d'affichage via une encre électronique pour la lecture, avec une qualité multimédia moyenne (plutôt que l'inverse). Et si la tablette propose le Wifi, alors d'accord pour la gratuité, mais ne pas obliger à s'abonner en 3G alors que cette option est purement occasionnelle dans le cas du livre électronique : l'objectif principal reste le remplacement de la lecture (et donc de l'impression de document via un ordinateur), et non le divertissement multimédia.

 

 

Liens

 

- Papier électronique (e-paper et E Ink)

  http://fr.wikipedia.org/wiki/Papier_%C3%A9lectronique

 

CutePdf : Imprimer en pdf (gratuit)

  www.01net.com/telecharger/windows/Bureautique/editeur_de_texte/fiches/27030.html

 

- Pdf2Doc (il y a une version gratuite, qui peut rendre service dans certains cas, mais la conversion pdf n'est pas la panacée)

  www.anypdftools.com

 

Licences, droit d'auteur, copyleft

- Droit d'auteur

  http://fr.wikipedia.org/wiki/Droit_d%27auteur

  http://fr.wikipedia.org/wiki/Copyright

 

- GFDL : Licence de documentation libre GNU

  http://fr.wikipedia.org/wiki/Licence_de_documentation_libre_GNU

 

- GNU GPL : Licence publique générale GNU (copyright et copyleft)

  http://fr.wikipedia.org/wiki/Licence_publique_g%C3%A9n%C3%A9rale_GNU

 

Lesser GNU Public Licence (LGPL, Licence publique générale limitée GNU)

  http://fr.wikipedia.org/wiki/Licence_publique_g%C3%A9n%C3%A9rale_limit%C3%A9e_GNU

 

Formats de livre électronique

- Le livre interactif en page web Html5

  20 choses à savoir sur les navigateurs et Internet

  Un guide amusant créé par Google sur ce que vous avez toujours voulu savoir à propos des navigateurs et d'Internet (sans oser le demander).

  www.20thingsilearned.com/fr-FR

  Apparemment on ne peut pas imprimer le livre au format A5 pour le lire sur une liseuse pdf, est-ce que cela aurait été oublié dans ce format de livre électronique ? (qui par ailleurs semble prometteur)

 

ePub : voir la rubrique "Exemple de fabrication d'un eBook".

 

okawix de Wikisource : voir ci-dessous.

 

Liseuses électroniques

- Le Zinky Reader (épuisé : 80 euros en décembre 2009 !) par ZeBook (www.zebook.com)

  www.ebouquin.fr/2009/12/01/test-zinky-une-bibliotheque-pour-moins-de-100-euros

  Un très bon appareil, avec très peu de défauts (seulement trois bugs : il ne mémorise pas toujours bien la dernière page lue, certaines images complexes font planter la liseuse, et les accents ne sont pas décodés dans les noms des documents ; par ailleurs il manque un peu de réactivité : parfois, il tarde à passer à la page suivante, puis saute deux pages d'un coup, si on a ré-appuyé sur le bouton).

 

Bibliothèques de livres électroniques

- Liste de bibliothèques eBook

  www.01net.com/editorial/363922/sept-sites-pour-telecharger-gratuitement-des-livres

 

Wikisource, la bibliothèque libre : Puisez dans ses 67 905 textes, passés dans le domaine public ou publiés sous licence libre

  http://fr.wikisource.org

  A priori, il n'y a pas de possibilité d'exporter un livre en entier d'un coup, ce qui est un comble !

  Il y a bien une page : "Consultation hors-ligne de Wikisource", mais on ne peut que télécharger des fichiers du type .okawix : ce sont des archives 7z de fichiers .zeno... que personne ne sait comment lire !!!

  http://fr.wikisource.org/wiki/Aide:Aide_au_lecteur#Consultation_hors-ligne_de_Wikisource

 

 

Critique

 

Critique du livre "Richard Stallman et la révolution du logiciel libre - Une biographie autorisée"

Si pour vous, comme pour moi, la nuance entre logiciel libre et Open Source ("code source libre") est floue, vous trouverez le pourquoi du comment dans cette biographie. Car le concept qui distingue les deux est fondamental, il s'agit de la liberté. Non seulement elle s'applique aux codes sources des logiciels, mais également aux documentations jointes à ces logiciels : imaginez que vous travaillez plusieurs mois à la rédaction d'un tel document, pour votre plus grand plaisir d'ailleurs, et que son copyright est détenu par l'entreprise qui vous emploie ; en cas de faillite de cette entreprise, vous vous verrez alors privé de la possibilité de récupérer votre travail, par exemple pour faire une autre documentation similaire dans un projet libre cette fois, il vous faudra entièrement refaire le travail de mémoire, et votre travail original restera sur une étagère, totalement inutilisable : la seule façon d'éviter une telle frustration est de changer radicalement de système : vous devez penser à préserver votre liberté avant même de commencer à faire quoi que ce soit : la liberté, c'est renoncer à un "plaisir" qui serait privatif, en sachant qu'il existe d'autres "plaisirs" qui eux ne la compromettent pas. Pourquoi alors ne pas consacrer entièrement son temps à des causes sans risque, non privatives ? Avec le temps et les efforts de millier de personnes qui pensent comme vous, vous retrouverez alors l'équivalent, et même mieux que ce qui existe dans l'ancien monde privateur : tel est la philosophie du monde libre. Il ne suffit pas d' "ouvrir" le code source, si vous n'avez pas ensuite la liberté de disposer du travail comme bon vous semble. Cette liberté ne signifie pas l'anarchie, bien au contraire, elle suit le principe du droit d'auteur, en y incluant la règle de la préservation de cette liberté, en cas de réutilisation du travail, il s'agit donc bien d'un principe de droit et de légalité.

Pourtant la position de R.M. Stallman sur la loi française Hadopi est critiquable : il dénonce totalement le fait d'empêcher de (d' "oser") partager librement tous les contenus numériques et audiovisuels ! On pourrait envisager le principe du partage libre pour la musique (c'est effectivement une tendance de fond), car certains musiciens peuvent vivrent uniquement de leurs concerts, mais pour les livres et le cinéma, comment transposer ce principe ? Lire un livre dans un stade de 50 000 personnes n'a tout simplement pas de sens, même si un écrivain peut faire payer ses interviews. Pour le cinéma, les films en salle ont effectivement une certaine valeur ajoutée par rapport aux DVD et Blu-ray, mais cela ne compenserait pas les frais de production.

Bref, en attendant un modèle d'économie numérique qui va bien, je ne voie pas comment on pourrait s'affranchir dès maintenant de la loi, simplement par refus idéologique du principe privateur de liberté : le fait de militer pour l'émergence d'un nouveau modèle (fut-il meilleur) ne vous exonère pas de respecter le modèle actuel (fut-il frustrant), c'est une question d'éthique du changement, dont on peut se rendre compte par exemple avec les impôts : si vous militez politiquement pour moins d'impôt, vous serez bien obligé d'attendre les décrets d'application d'une nouvelle loi avant de réduire votre contribution, sinon si tout le monde anticipait les choses selon leur vision d'un monde juste, plus personne ne payeraient les impôts, et le déficit serait tel que jamais votre nouveau monde juste ne verrait le jour. L'éthique du changement doit respecter la liberté envers autrui : comportez-vous envers votre prochain comme vous voudriez qu'il se comporte envers vous-même : si vous étiez auteur, vous aimeriez vivre et même bien vivre de vos revenus, vous aimeriez que chacun paie vos oeuvres... (en attendant un éventuel monde meilleur)

Mais sur le fond, Stallman a certainement raison : le futur verra probablement l'émergence puis la domination d'autres modèles économiques, modèles dans lesquels par exemple la (coûteuse) publicité sera remplacée par les recommandations des uns et des autres au sein d'un réseau social : si vous enlevez tous les frais qui ne servent à rien, et que la diffusion elle même est à coût nul, alors le prix véritable peut suivre des modèles très différents, dans lequel une capacité d'influence reste importante, sans pour autant être forcément monnayable comme avant...

Le meilleur système de recommandation actuel est celui d'Amazon, avec ses conseils personnalisés : c'est le seul qui ne soit pas un simple gadget (tous les nouveaux livres et auteurs de science-fiction que j'ai découvert depuis 3 ans m'ont été recommandés de cette façon), mais ce n'est pas un réseau social, les liens entre les votants sont implicites, on ne peut pas s'y faire des amis. Le jour ou il sera adapté à Facebook, alors le fameux réseau social commencera a devenir vraiment utile, et non plus un simple divertissement sympathique (il faudra peut être aussi compter avec Netflix).