[ Thread Index |
Date Index
| More lists.tuxfamily.org/carrefourblinux Archives
]
Bonsoir,
From: Klaus Becker <colonius@xxxxxxx>
Subject: [CBLX] Re: mbrola
Date: Wed, 10 Apr 2013 10:49:38 +0200
> Le mercredi 10 avril 2013 01:01:53, Samuel Thibault a écrit :
>> Bonjour,
>>
>> Je me permets de mettre en copie la liste carrefourblinux, qui contient
>> beaucoup de monde qui sauront te conseiller (bien plus vite que ce que
>> j'ai le temps de faire, en tous cas !)
>>
>> Klaus Becker, le Fri 05 Apr 2013 18:22:43 +0200, a écrit :
>> > étant très myope, je cherche une application capable de lire à haute voix des pages web. J'utilise Debian GNU/Linux AMD64 et il existe plusieurs applications texte to speech, mais le résultat n'est pas utilisable parce que la qualité est trop mauvaise.
>> >
>> > La seule solution valabe semble être mbrola. Lorsque je l'utilise sur mon système, la qualité n'atteind pourtant pas celle des exemples qu'on trouve à http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html. Ecouter un texte est possible, mais parfois laborieux.
Clair ! Comme le dit Samuel c'est la prosodie qui est en
cause et pour les exemples ils ont sans doute léché le truc
en retravaillant à la main si besoin. On ne peut pas
procéder de la sorte si on lit du text à la volée.
>>
>> Quelle voix utilises-tu ? Quel outil de text to speech utilises-tu ?
>> Mbrola ne fait que la synthèse, il faut le découpage en syllabes et
>> prosodies avant, quel outil utilises-tu pour cela ?
>>
>> Les exemples du fichier fr.wav sont vraiment fabriqués à partir des
>> différentes voix disponibles. Par contre la prosodie a été bien
>> travaillée, il se peut simplement que ce soit une mauvaise prosodie qui
>> rende l'écoute laborieuse à tes oeriles.
+1
>>
>> > Malheureusement les listes de diffusions comme mbrola-interest-request@xxxxxxxxxxxxxxx n'existent plus et je n'ai encore trouvé personne qui puisse m'aider pour améliorer la qualité du son produit par mbrola. Dommage pour ce projet formidable.
Il faut regarder du côté de festival-talk. En amont de
mbrola festival est vraiment en mesure de produire une
syllabisation et une prosodie de très haute qualité. Dans
cette optique il faut le patch franfest pour
festival. Celui-ci est fonctionnel
http://www.pollock-nageoire.net/gnu puis suivre le
lien. Pour ceux qui viendraient me chatouiller côté
prosodie, il faut qu'ils écoutent la dernière version parce
que je me suis enfin décidé à implémenté un module de
prosodie. Il est encore très clairement améliorable mais je
me refuse à mettre des patch partout et suis en train de
nettoyer le code de font en comble. Du coup on ne peut pas
espérer une version moderne dans les jours qui viennent.
Mais le projet est en pleine activité.
Le but ultime est de fournir une version pluggable de
franfest. Pour cela il faut que festival soit en mesure
d'accueillir des modules chargés dynamiquement et je suis
sur le coup. Alan W. Black a l'air d'accord sur le principe
mais là non plus je ne peux pas donner de date quant au
moment où sortira une version pluggable de festival. Elle
tourne sur mon système mais il faut que je teste le truc
avant de proposer une modification au code.
>>
>> C'est toujours le problème avec les projets non vraiment libres. Il
>> n'est pas possible de continuer le travail avec une nouvelle équipe.
Oui mbrola et figé dans un état stable depuis des lustre et
je ne suis même pas sûr qu'il y ait des version 64
bits. Quant à redémarrer from scratch un projet comme
celui-là c'est titanesque. Je pense que tous les algos sont
plus ou moins publics mais avant de faire le tour des
publis où c'est expliqué et d'implémenter le truc ....
>> Cependant, si le problème est vraiment de prosodie, ce n'est pas mbrola
>> le coupable, mais l'outil en amont.
+1
>>
>> > Je voudrais savoir s'il existent encore des personnes ou listes ou forums où l'on peut obtenir de l'aide pour l'utilisation de mbrola.
Je crois que je sais me servir plus que convenablement de
cette bête là.
>>
>> On peut sans doute en discuter ici.
Bien volontiers. Et s'il y a des gens motivés et capables
de se fader du code j'ai du boulot à leur donner ! Pas de
problème !
>>
>> Samuel
>
>
> Bonjour Samuel,
>
> merci de ta réponse qui me redonne un peu d'espoir. Je me suis in,scrit à la liste carrefourblinux et je l'ai mise e, copie également.
>
> J'ai installé les voix disponibles sous Debian : de4-de7, fr1 et fr4.
>
> J'ai essayé plusieurs gui : gespeaker (qui a un bug et ne reconnaît pas les voix mbrola) et Jspeak qui fonctionne plus ou moins.
>
> J'ai surtout expérimenté avec espeak, du genre : espeak -s 140 -v german-mbrola-2 -f de.txt.
>
> Le résultat avec les voix allemandes est tout juste passable, mais avec les voix françaises, c'est vraiment mauvais et je reçois des messages d'erreur du genre :
>
> $ espeak -s 140 -v french-mbrola-4 -f fr.txt
> mbrola: Warning: l-a- unkown, replaced with _-_
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline
> ALSA lib pcm_dmix.c:957:(snd_pcm_dmix_open) The dmix plugin supports only playback stream
> Cannot connect to server socket err = No such file or directory
> Cannot connect to server request channel
> jack server is not running or cannot be started
> mbrola: Warning: l-a- unkown, replaced with _-_
> mbrola: Warning: l-e- unkown, replaced with _-_
> mbrola: Warning: l-e- unkown, replaced with _-_
> mbrola: Warning: l-e- unkown, replaced with _-_
> mbrola: Warning: l-a- unkown, replaced with _-_
>
> à bientôt
Avec festival tant l'allemand que le français sont de mon
point de vue tout à fait convenables.
Ma solution personnelle pour le web : w3m + emacs +
speechd-el + speech-dispatcher (enfin shunté ici mais ça
c'est pas obligatoire) + festival(franfest) + mbrola. Ouais
je sais ça fait usine à gaz ! Mais je l'ai dit dans un
autre mail, la synthèse vocale c'est une fusée à plusieurs
étages. Et quoiqu'aparemment très complex c'est très
robuste !
Pierre
>
> Klaus
>
> --
> --
> CarrefourBLinuX MailingListe
> Pour obtenir de l'aide, envoyez le sujet help à:
> carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
> Archives:
> http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>
--
--
CarrefourBLinuX MailingListe
Pour obtenir de l'aide, envoyez le sujet help �
carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
Archives:
http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux