Re: [ostorybook-dev] SHEF: le retour |
[ Thread Index | Date Index | More lists.tuxfamily.org/ostorybook-dev Archives ]
Bonsoir à tous les deux,
Je viens de faire l'essai d'un fichier .odt en .html. J'ai suivi
la démarche indiquée et j'ai pu ouvrir le fichier avec le
navigateur.
Version de Libreoffice : 7.0.6.2
Firefox : 91.0.2 (64 bits)
C'est un doc que j’utilise pour mon prochain roman.
On peut faire l'impasse en ce qui me concerne. J'utilise par ailleurs très peu le format .HTML. C'est peut-être que j'ignore toutes les potentialités de ce format.Je continue à faire la chasse au gaspi (analyser les API pour en déterminer l'origine, savoir s'il existe une version plus récente, déterminer s'il n'y a pas doublon, éliminer celles qui ne seraient plus utiles). Et je suis revenu sur SHEF. SHEF utilise 2 API: jtidy-8.0 et novaworx-syntax-0.0.7. JTidy est un parser HTML utilisé psurtout comme beautifier (faire une "jolie" mise en forme du code). Le parser utilisé par ailleurs (en particulier les récentes fonctions d'importation) est Jsoup. La dernière version stable de JTidy est la 1.0.2 du 16/12/2019 (sur github), mais les versions récentes concernent surtout le HTML5 qui n'a aucune utilité dans le cas de oStorybook. Avec les développements de l'importation j'ai mis à jour la version de Jsoup (1.14.2). Donc la première manip serait de remplacer JTidy par Jsoup (249K économisé). Novaworx, souvenez-vous je l'avais déjà évoqué. J'ai réussi à retrouver des informations dans les archives du Web. Ce projet semble s'apparenter à une IDE, et il a disparu vers 2007-2009 (voir bien avant). Novaworx, en tout cas l'extrait utilisé, s'occupe de la coloration syntaxique du HTML. Dans le SHEF que j'ai redéveloppé c'est RSyntaxTextArea que j'ai utilisé (plus simple). La contre partie est qu'on passe de 219Ko à presque 1,2Mo. Donc pour l'économie on repassera. J'envisage 3 pistes: - virer la coloration syntaxique, c'est juste cosmétique et la très grande majorité des auteurs ne sait même pas ce que c'est que le HTML. - redévelopper le novaworx (puisque j'ai les sources de 2003, et c'est sous GPL) - réduire RSyntaxTextArea pour ne conserver que la partie utile (le HTML), le code est beaucoup moins évident à comprendre et je ne suis certain d'y arriver. Une alternative consisterait à rendre Novaworx ou RSyntaxTextArea optionnel (si la library est présente on l'utilise, sinon on utilise un JTextArea tout simple, donc sans coloration).
Qu'en pensez-vous? PS: j'ai oublié de vous le dire, pour l'importation ODT j'ai découvert un énorme bug dans LibreOffice. Faites l'expérience: créez un fichier ODT quelconque (pas trop volumineux mais avec plusieurs niveaux de titre, des listes, du texte), puis enregistrez-le au format natif (ODT). redémarrez LibreOffice (pour être sur de partir de rien), ouvrez votre fichier puis enregistrez-le au format HTML. Quittez LibreOffice, puis ouvrez-le fichier HTML avec votre navigateur. Moi ça ne marche pas, sauf bidouilles infâmes. Pourquoi? LibreOffice ne crée pas un HTML mais un XHTML, du coup le navigateur se basant sur le nom du fichier ne l’interprète pas comme il faut.
Mail converted by MHonArc 2.6.19+ | http://listengine.tuxfamily.org/ |