Re: [ostorybook-dev] SHEF: le retour

[ Thread Index | Date Index | More lists.tuxfamily.org/ostorybook-dev Archives ]


J'avais auparavant importé un fichier au format .odt avec la dernière version 5.05.05. En fait, il s'agit de notes avec une mise en forme intégrant  des puces, ce qui crée automatiquement une autre scène.

Voici ce qui apparaît dans la vue Gestion : EDF 1.2 - 1.3 etc

 

Vue scènes


Le texte au format .odt

1EDF (titre 2)

https://www.edf.fr/groupe-edf/producteur-industriel/carte-des-implantations

1centrales nucléaires    (titre 3)

Les paragraphes avec les puces sont au format "Style de paragraphe"

---

Bonne journée à vous.

Amicalement,

Bernard


Le 25/09/2021 à 15:49, oStorybook a écrit :
Je continue à faire la chasse au gaspi (analyser les API pour en
déterminer l'origine, savoir s'il existe une version plus récente,
déterminer s'il n'y a pas doublon, éliminer celles qui ne seraient plus
utiles). Et je suis revenu sur SHEF.

SHEF utilise 2 API: jtidy-8.0 et novaworx-syntax-0.0.7.

JTidy est un parser HTML utilisé psurtout comme beautifier (faire une
"jolie" mise en forme du code). Le parser utilisé par ailleurs (en
particulier les récentes fonctions d'importation) est Jsoup. La dernière
version stable de JTidy est la 1.0.2 du 16/12/2019 (sur github), mais
les versions récentes concernent surtout le HTML5 qui n'a aucune utilité
dans le cas de oStorybook. Avec les développements de l'importation j'ai
mis à jour la version de Jsoup (1.14.2). Donc la première manip serait
de remplacer JTidy par Jsoup (249K économisé).

Novaworx, souvenez-vous je l'avais déjà évoqué. J'ai réussi à retrouver
des informations dans les archives du Web. Ce projet semble s'apparenter
à une IDE, et il a disparu vers 2007-2009 (voir bien avant). Novaworx,
en tout cas l'extrait utilisé, s'occupe de la coloration syntaxique du
HTML. Dans le SHEF que j'ai redéveloppé c'est RSyntaxTextArea que j'ai
utilisé (plus simple). La contre partie est qu'on passe de 219Ko à
presque 1,2Mo. Donc pour l'économie on repassera. J'envisage 3 pistes:
- virer la coloration syntaxique, c'est juste cosmétique et la très
grande majorité des auteurs ne sait même pas ce que c'est que le HTML.
- redévelopper le novaworx (puisque j'ai les sources de 2003, et c'est
sous GPL)
- réduire RSyntaxTextArea pour ne conserver que la partie utile (le
HTML), le code est beaucoup moins évident à comprendre et je ne suis
certain d'y arriver.

Une alternative consisterait à rendre Novaworx ou RSyntaxTextArea
optionnel (si la library est présente on l'utilise, sinon on utilise un
JTextArea tout simple, donc sans coloration).

Qu'en pensez-vous?

PS: j'ai oublié de vous le dire, pour l'importation ODT j'ai découvert
un énorme bug dans LibreOffice. Faites l'expérience: créez un fichier
ODT quelconque (pas trop volumineux mais avec plusieurs niveaux de
titre, des listes, du texte), puis enregistrez-le au format natif (ODT).
redémarrez LibreOffice (pour être sur de partir de rien), ouvrez votre
fichier puis enregistrez-le au format HTML. Quittez LibreOffice, puis
ouvrez-le fichier HTML avec votre navigateur. Moi ça ne marche pas, sauf
bidouilles infâmes. Pourquoi? LibreOffice ne crée pas un HTML mais un
XHTML, du coup le navigateur se basant sur le nom du fichier ne
l’interprète pas comme il faut.



Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/