Re: [ostorybook-dev] SHEF: le retour

[ Thread Index | Date Index | More lists.tuxfamily.org/ostorybook-dev Archives ]


Bonsoir à tous les deux,

Je viens de faire l'essai d'un fichier .odt en .html. J'ai suivi la démarche indiquée et j'ai pu ouvrir le fichier avec le navigateur.

Version de Libreoffice : 7.0.6.2

Firefox : 91.0.2 (64 bits)

C'est un doc que j’utilise pour mon prochain roman.


Merci pour la chasse au gaspi !( très bien trouvé)



Le 25/09/2021 à 15:49, oStorybook a écrit :
Je continue à faire la chasse au gaspi (analyser les API pour en
déterminer l'origine, savoir s'il existe une version plus récente,
déterminer s'il n'y a pas doublon, éliminer celles qui ne seraient plus
utiles). Et je suis revenu sur SHEF.

SHEF utilise 2 API: jtidy-8.0 et novaworx-syntax-0.0.7.

JTidy est un parser HTML utilisé psurtout comme beautifier (faire une
"jolie" mise en forme du code). Le parser utilisé par ailleurs (en
particulier les récentes fonctions d'importation) est Jsoup. La dernière
version stable de JTidy est la 1.0.2 du 16/12/2019 (sur github), mais
les versions récentes concernent surtout le HTML5 qui n'a aucune utilité
dans le cas de oStorybook. Avec les développements de l'importation j'ai
mis à jour la version de Jsoup (1.14.2). Donc la première manip serait
de remplacer JTidy par Jsoup (249K économisé).

Novaworx, souvenez-vous je l'avais déjà évoqué. J'ai réussi à retrouver
des informations dans les archives du Web. Ce projet semble s'apparenter
à une IDE, et il a disparu vers 2007-2009 (voir bien avant). Novaworx,
en tout cas l'extrait utilisé, s'occupe de la coloration syntaxique du
HTML. Dans le SHEF que j'ai redéveloppé c'est RSyntaxTextArea que j'ai
utilisé (plus simple). La contre partie est qu'on passe de 219Ko à
presque 1,2Mo. Donc pour l'économie on repassera. J'envisage 3 pistes:
- virer la coloration syntaxique, c'est juste cosmétique et la très
grande majorité des auteurs ne sait même pas ce que c'est que le HTML.
- redévelopper le novaworx (puisque j'ai les sources de 2003, et c'est
sous GPL)
- réduire RSyntaxTextArea pour ne conserver que la partie utile (le
HTML), le code est beaucoup moins évident à comprendre et je ne suis
certain d'y arriver.

Une alternative consisterait à rendre Novaworx ou RSyntaxTextArea
optionnel (si la library est présente on l'utilise, sinon on utilise un
JTextArea tout simple, donc sans coloration).
On peut faire l'impasse en ce qui me concerne. J'utilise par ailleurs très peu le format .HTML. C'est peut-être que j'ignore toutes les potentialités de ce format.

Qu'en pensez-vous?

PS: j'ai oublié de vous le dire, pour l'importation ODT j'ai découvert
un énorme bug dans LibreOffice. Faites l'expérience: créez un fichier
ODT quelconque (pas trop volumineux mais avec plusieurs niveaux de
titre, des listes, du texte), puis enregistrez-le au format natif (ODT).
redémarrez LibreOffice (pour être sur de partir de rien), ouvrez votre
fichier puis enregistrez-le au format HTML. Quittez LibreOffice, puis
ouvrez-le fichier HTML avec votre navigateur. Moi ça ne marche pas, sauf
bidouilles infâmes. Pourquoi? LibreOffice ne crée pas un HTML mais un
XHTML, du coup le navigateur se basant sur le nom du fichier ne
l’interprète pas comme il faut.



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/