Re: [CBLX] Re: mbrola

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bonsoir,


From: Klaus Becker <colonius@xxxxxxx>
Subject: [CBLX] Re: mbrola
Date: Wed, 10 Apr 2013 10:49:38 +0200

> Le mercredi 10 avril 2013 01:01:53, Samuel Thibault a écrit :
>> Bonjour,
>> 
>> Je me permets de mettre en copie la liste carrefourblinux, qui contient
>> beaucoup de monde qui sauront te conseiller (bien plus vite que ce que
>> j'ai le temps de faire, en tous cas !)
>> 
>> Klaus Becker, le Fri 05 Apr 2013 18:22:43 +0200, a écrit :
>> > étant très myope, je cherche une application capable de lire à haute voix des pages web. J'utilise Debian GNU/Linux AMD64 et il existe plusieurs applications texte to speech, mais le résultat n'est pas utilisable parce que la qualité est trop mauvaise.
>> > 
>> > La seule solution valabe semble être mbrola. Lorsque je l'utilise sur mon système, la qualité n'atteind pourtant pas celle des exemples qu'on trouve à http://tcts.fpms.ac.be/synthesis/mbrola/mbrcopybin.html. Ecouter un texte est possible, mais parfois laborieux.

    Clair ! Comme le dit Samuel c'est la prosodie qui est en
    cause et pour les exemples ils ont sans doute léché le truc
    en retravaillant à la main si besoin. On ne peut pas
    procéder de la sorte si on lit du text à la volée.



>> 
>> Quelle voix utilises-tu ? Quel outil de text to speech utilises-tu ?
>> Mbrola ne fait que la synthèse, il faut le découpage en syllabes et
>> prosodies avant, quel outil utilises-tu pour cela ?
>> 
>> Les exemples du fichier fr.wav sont vraiment fabriqués à partir des
>> différentes voix disponibles. Par contre la prosodie a été bien
>> travaillée, il se peut simplement que ce soit une mauvaise prosodie qui
>> rende l'écoute laborieuse à tes oeriles.

    +1 



>> 
>> > Malheureusement les listes de diffusions comme mbrola-interest-request@xxxxxxxxxxxxxxx n'existent plus et je n'ai encore trouvé personne qui puisse m'aider pour améliorer la qualité du son produit par mbrola. Dommage pour ce projet formidable.

    Il faut regarder du côté de festival-talk. En amont de
    mbrola festival est vraiment en mesure de produire une
    syllabisation et une prosodie de très haute qualité. Dans
    cette optique il faut le patch franfest pour
    festival. Celui-ci est fonctionnel
    http://www.pollock-nageoire.net/gnu puis suivre le
    lien. Pour ceux qui viendraient me chatouiller côté
    prosodie, il faut qu'ils écoutent la dernière version parce
    que je me suis enfin décidé à implémenté un module de
    prosodie. Il est encore très clairement améliorable mais je
    me refuse à mettre des patch partout et suis en train de
    nettoyer le code de font en comble. Du coup on ne peut pas
    espérer une version moderne dans les jours qui viennent.

    Mais le projet est en pleine activité. 

    Le but ultime est de fournir une version pluggable de
    franfest. Pour cela il faut que festival soit en mesure
    d'accueillir des modules chargés dynamiquement et je suis
    sur le coup. Alan W. Black a l'air d'accord sur le principe
    mais là non plus je ne peux pas donner de date quant au
    moment où sortira une version pluggable de festival. Elle
    tourne sur mon système mais il faut que je teste le truc
    avant de proposer une modification au code.



>> 
>> C'est toujours le problème avec les projets non vraiment libres. Il
>> n'est pas possible de continuer le travail avec une nouvelle équipe.

    Oui mbrola et figé dans un état stable depuis des lustre et
    je ne suis même pas sûr qu'il y ait des version 64
    bits. Quant à redémarrer from scratch un projet comme
    celui-là c'est titanesque. Je pense que tous les algos sont
    plus ou moins publics mais avant de faire le tour des
    publis où c'est expliqué et d'implémenter le truc ....



>> Cependant, si le problème est vraiment de prosodie, ce n'est pas mbrola
>> le coupable, mais l'outil en amont.


    +1


>> 
>> > Je voudrais savoir s'il existent encore des personnes ou listes ou forums où l'on peut obtenir de l'aide pour l'utilisation de mbrola.

    Je crois que je sais me servir plus que convenablement de
    cette bête là.



>> 
>> On peut sans doute en discuter ici.

    Bien volontiers. Et s'il y a des gens motivés et capables
    de se fader du code j'ai du boulot à leur donner ! Pas de
    problème !


>> 
>> Samuel
> 
> 
> Bonjour Samuel,
> 
> merci de ta réponse qui me redonne un peu d'espoir. Je me suis in,scrit à la liste carrefourblinux et je l'ai mise e, copie également.
> 
> J'ai installé les voix disponibles sous Debian : de4-de7, fr1 et fr4.
> 
> J'ai essayé plusieurs gui : gespeaker (qui a un bug et ne reconnaît pas les voix mbrola) et Jspeak qui fonctionne plus ou moins.
> 
> J'ai surtout expérimenté avec espeak, du genre : espeak -s 140 -v german-mbrola-2 -f de.txt.
> 
> Le résultat avec les voix allemandes est tout juste passable, mais avec les voix françaises, c'est vraiment mauvais et je reçois des messages d'erreur du genre :
> 
> $ espeak -s 140 -v french-mbrola-4 -f fr.txt
> mbrola: Warning: l-a- unkown, replaced with _-_
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.hdmi
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.modem
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline
> ALSA lib pcm.c:2217:(snd_pcm_open_noupdate) Unknown PCM cards.pcm.phoneline
> ALSA lib pcm_dmix.c:957:(snd_pcm_dmix_open) The dmix plugin supports only playback stream
> Cannot connect to server socket err = No such file or directory
> Cannot connect to server request channel
> jack server is not running or cannot be started
> mbrola: Warning: l-a- unkown, replaced with _-_
> mbrola: Warning: l-e- unkown, replaced with _-_
> mbrola: Warning: l-e- unkown, replaced with _-_
> mbrola: Warning: l-e- unkown, replaced with _-_
> mbrola: Warning: l-a- unkown, replaced with _-_
> 
> à bientôt

    Avec festival tant l'allemand que le français sont de mon
    point de vue tout à fait convenables.


    Ma solution personnelle pour le web : w3m + emacs +
    speechd-el + speech-dispatcher (enfin shunté ici mais ça
    c'est pas obligatoire) + festival(franfest) + mbrola. Ouais
    je sais ça fait usine à gaz ! Mais je l'ai dit dans un
    autre mail, la synthèse vocale c'est une fusée à plusieurs
    étages. Et quoiqu'aparemment très complex c'est très
    robuste !

    Pierre 
> 
> Klaus
> 
> -- 
> -- 
>    CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

-- 
-- 
   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  �
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/