Re: [CBLX] problème de layout avec un manuel en PDF

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


C intéressant! mais dans mon pdf c la partie layout qui pose problème, pas (heureusement) la partie image.

Aldo.

On Wed, Feb 02, 2022 at 05:13:06PM +0100, Didier Spaier wrote:
> Salut Aldo,
> 
> Dans le menu: Fichier -> Ouvrir (ou Ctrl+O) puis sélectionne le fichier.
> 
> Une fenêtre surgit et te demande "Reconnaître toutes les images) réponse oui.
> 
> Même si tu réponds non tu peux le faire après: dans le menu Reconnaître (Alt+R):
> cela affiche une liste déroulante avec des options dont "Reconnaître toutes les
> images".
> 
> La reconnaissance prends un certain temps selon la taille du fichier.
> 
> Tu peux ensuite enregistrer le fichier texte (Ctrl+S)
> 
> si tu presse F5 Lios le lit texte à haute voix en utilisant espeakup.
> 
> Tu peux aussi le convertir en fichier audio: Outil -> Convertisseur Audio
> Cela ouvre un fenêtre de réglages tu peux choisir le format (wav ou mp3).
> Cela s'appuie sur speech-dispatcher.
> 
> Dans le menu Paramètres -> Général tu peux choisir le synthétiseur et la langue
> pour produire le fichier audio, un peu come dans le menu Orca préférences -> voix
> 
> Explore le menu pour en savoir plus.
> 
> Bon après-midi,
> Didier
> 
> Le 02/02/2022 à 16:12, Aldo a écrit :
> > Salut Didier.
> > 
> > J'essaye de comprendre ta suggestion, mais ici LIOS est un outil OCR, dit
> > intelligent et blindfriendly, mais es-ce dire qu'on peut lui refiler le pdf
> > sans plus, sans passer par un scannerou la version papier ?
> > 
> > Aldo. 
> > 
> > ### 
> > Package: lios
> > Architecture: all
> > Version: 2.7.2-1
> > Priority: extra
> > Section: universe/graphics
> > Origin: Ubuntu
> > Maintainer: Ubuntu Developers <ubuntu-devel-discuss@xxxxxxxxxxxxxxxx>
> > Original-Maintainer: Samuel Thibault <sthibault@xxxxxxxxxx>
> > Bugs: https://bugs.launchpad.net/ubuntu/+filebug
> > Installed-Size: 507
> > Depends: python3:any, python3-gi, gir1.2-gtk-3.0, gir1.2-gst-plugins-base-1.0, gir1.2-gstreamer-1.0, gir1.2-vte-2.91, python3-sane, python3-speechd, tesseract-ocr, imagemagick, espeak, poppler-utils, python3-enchant, aspell-en, python3-gi-cairo
> > Recommends: gnome-icon-theme
> > Suggests: cuneiform
> > Filename: pool/universe/l/lios/lios_2.7.2-1_all.deb
> > Size: 168344
> > MD5sum: 6a3b2dade1f73afd7a168dc5c8294d44
> > SHA1: f0240fc90242bdacf2c53aa096457e531e41a017
> > SHA256: 7abcd7b77845b0a20e975324b1ea9c2e9d78c5cab297caffd35b811e7dcd6c82
> > Homepage: http://sourceforge.net/projects/lios/
> > Description-en: Linux intelligent OCR solution
> >  Lios provides a graphical interface on top of the Cuneiform and
> >  Tesseract OCR backends to make OCR processing easier for impaired users,
> >  with full autorotation, brightness optimization, rectangle selection,
> >  audio feedback, etc.
> > Description-md5: 6a462e32cc7c1cae32b05744de9c1bc4
> > ### 
> > 
> > On Wed, Feb 02, 2022 at 01:11:52PM +0100, Didier Spaier wrote:
> >> Bonjour Aldo,
> >>
> >> Lios fonctionne très bien ici.
> >>
> >> En plus il peut lire le texte et l'enregitrer en .wav
> >>
> >> Bonne journée,
> >> Didier
> >>
> >> Le 02/02/2022 à 12:45, Aldo a écrit :
> >>> Bonjour. 
> >>>
> >>> j'essaye de convertir en txt le pdf d'un manuel d'utilisation d'une table de
> >>> mixage (TASCAM Model 12 pour pas la citer :-) ): 
> >>> pdftotext ou pdftohtml font ça +/- bien, 
> >>> euh cad que le manuel est en colonnes et parfois des bouts de phrase de la
> >>> colonne de droite s'intercallent dans la suite "logique" du texte, me
> >>> faisant perdre le fil.
> >>> Question:
> >>> peut-on défaire cette structure et obtenir par une commande donnée que le
> >>> texte suive son cours sans layout particulier, je pensais à l'option -raw de
> >>> pdftotext mais p-e que je me tompes ?
> >>> (je travailel donc bien en ligne de commande, pas sous LibreOffice).
> >>>
> >>> Merci à l'avance pour vos bons conseils!
> >>>
> >>> Aldo.
> >>>
> >>
> >> -- 
> >>    CBLX - CarrefourBLinuX MailingListe 
> >>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
> >>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
> >>    Archives: 
> >>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> >>    ou 
> >>    http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/
> >>
> > 
> 
> -- 
>    CBLX - CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>    ou 
>    http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/
> 

-- 
  |  Verstuurd vanaf mijn GNU/Linux  |  Envoyé de mon GNU/Linux  | 
  |  -----------------  Sent from GNU/Linux  ------------------  | 

-- 
   CBLX - CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  à: 
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
   ou 
   http://www.mail-archive.com/carrefourblinux@xxxxxxxxxxxxxxxxxxx/


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/