Re: [CBLX] problème de layout avec un manuel en PDF

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Yoh Didier,

On Wed, Feb 02, 2022 at 06:44:06PM +0100, Didier Spaier wrote:
> Dans un fichier pdf chaque page est une image, 

Ah bon ?! j'ai déjà eu des pdfs qui n'étaient que de l'image (en plus venant
de mon syndic),
j'en ai rencontrés d'autres qui en fait n'étaient que du texte, mais
présentaient sans doute mieux transformés en pdf,
et j'en ai comme ici qu isont une combi des deux;
mais ça ne me dis toujorus pas commetn va se résoudre le problème du layout,
et pour info c pas qu'il manque du texte, c juste qu'il "se colle au mauvais
endroit" quand j'applique pdftotext.
 
> comme si tu prenais une photo de
> cette page, 

Lorsque tu as ça, en efet là pdftotext ne m'est d'aucune aide, soit le
résultat est blanco, soit que des signes braille verticaux, ou autres! 

> ceci quelle que soit la disposition du texte sur la page (sur une ou
> plusieurs colones).

La disposition est -apparement- dans tous les cas un souci majeur, car même
transformé d'abord en html, puis en txt, mon manuel Tascam ne change pas de
disposition pour tout remettre automatiquement en une colonne!

> Reconnaître une image signifie dans ce cas "convertir cette photo de la page 
> en
> texte".

Oui ça c super.
 
> Donc ça doit fonctionner pour ton fichier. CQFD.

Mon pdf n'est pas QUE de l'image,
et le même souci survient, que tu convertisse via pdftotext ou même via
LibreOffice!

ET c tj dommage qu'on ne puisse pas revenir au doc d'origine une fois que tu
as le pdf. 

Aldo. 

-- 
   CBLX - CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
   ou 
   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/