Re: [CBLX] espeak ou speech-dispatcher ?

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bsoir Emmanuel !

From: Emmanuel COUTRIS <emmanuel.coutris@xxxxxxxxx>
Subject: Re: [CBLX] espeak ou speech-dispatcher ?
Date: Sun, 30 Jan 2011 14:46:40 +0100

> Coucou tout le monde,
> 
> Petite contribution modeste car je ne connais pas tant que ça le sujet!
> 
> On Sun, Jan 30, 2011 at 09:11:37PM +0000, Pierre Lorenzon wrote:
>> 
>> > 
>> > je voudrais savoir pourquoi, quand on lance orca pour la 1re fois, il propose
>> > speech-dispatcher comme serveur vocal et non espaek ? es-ce que sous
>> 
>>   Réponse simple : parce que speech-dispatcher est
>>   effecttivement un serveur vocal tandis qu'espaeak est une
>>   synthèse vocale. Sauf qu'évidemment cette dycotomie est
>>   purement artificielle et théorique, parce qu'espeak
>>   implémente probablement des fonctionalités de serveur
>>   vocal. Je dis probablement parce que je ne connais espaeak
>>   que de nom et ne sais pas ce qu'il sait faire. Pour
> Non, espeak n'est pas conçu pour être serveur. Juste un sogiciel pour
> générer du son à partir du texte (TTS). Les logiciels qui utilisent espeak
> doivent envoyer les données à espeak en le lançant et en lui transmettant
> le texte sur son entrée standard.

  OK ! Là j'ai appris quelque chose, dont je me doutais
  quand-même en fait. Je ne veux pas faire de la pub pour
  toujours la même chose, mais le seul truc que je connaisse et
  qui puisse implémenter des features de serveur vocal c'est
  festival. D'ailleurs j'ai caressé le projet d'une
  implémentation complète de speech-dispatcher en
  festival. J'en ai même parlé à Milan qui a trouvé que
  j'allais réinventer la roue, pour un gain somme toute assez
  faible. Ouais sur des super machines, mais sur des machines à
  ressources restreintes pas sûr du tout ! Le modèle que
  j'avais et qui attaquait directement festival depuis emacs
  était beaucoup plus réactif, même sur des super machines que
  speech-dispatcher. Le hic c'est que ce truc n'a jamais été
  "fully featured" faute de temps et de motivation. Mais la
  question théorique, je prétend que je sais la résoudre.



> 
>>   speech-dispatcher, par contre c'est très clair : il ne sait
>>   faire que de l'intégration et du dispatching pas de
>>   synthèse. Il ne sait que déléguer à des synthèses le boulot.
>> 
>> 
>> > speech-dispatcher on a autant de langues supportées que sous espeak ?
>> 
>>   Au vu de ce qui précède, cette question n'a pas de sens !
>>   speech-dispatcher supporte espaeak parmi les synthèses qu'il
>>   sait piloter, donc on a au moins toutes les langues
>>   disponibles sous espaeak.
>> 
>> 
>> 
>> > 
>> > Perso j'ai besoin à la fois du FR et du NL, pas spécialement sous le même
>> > compte (/utilisateur),
>> > quel est la "bonne" solution dans un tel cas, quel serveur préférer avec 
>> > quelle langue ?
>> 
>>   Perso je dirais que quitte à utiliser espeak, autant
>>   l'utiliser sans speech-dispatcher entre les deux. La même
>>   remarque vaudrait avec festival d'ailleurs dans un cas que je
>>   connais alors au micron près. Sauf que ... il y a toujours un
>>   sauf ... Espeak se conduit en serveur vocal, certes, comme
>>   festival certes, mais n'implémente peut-être pas en interne
>>   tout ce que speech-dispatcher implémente par ailleures (un
>>   scheduleur de message digne de ce nom par exemple.) Pour
>>   festival c'est clair, il faudrait implémenter ces features
>>   mais elles ne le sont pas d'origine. Je crains que pour
>>   espeak la situation soit analogue.
>> 
>> 
>>   Donc pour résumer Aldo ! quels avantages et quels
>>   inconvénients :
>> 
>>   1. Avantage : utiliser espeak tout seul : clair légèreté ! un
>>   serveur au lieu de deux en chaîne : tu vois tout de suite que
>>   si tu as une machine à ressources limitées, tu pourrais
>>   gagner en réactivité. Ouaip ! mais bon si tu as une machine à
>>   ressources limitée et que tu utilises déjà des usines à gaz
>>   type gnome+orca : "c'est déjà un mauvais choix" (enfin ça
>>   c'est juste Pierre qui le dit, c'est pour ça qu'il a mis des
>>   guillemets !) !!!!
>> 
>>   2. Avantage espeak piloté par speech-dispatcher : beh je
>>   pense que le scheduling des messages est infiniement meilleur
>>   !
>> 
>>   J'espère qu'avec ça tu as des éléments pour te décider
>>   rationnellement : Sinon ressonne ! Pierre il ouvre presque
>>   toujours !
>> 
>> 
>> 
>> 
>> 
>> 
>> > 
>> > Pour espeak je sais que tant le fr que nl sont possibles,
>> > pour speech-dispatcher où en est-on ?
>> 
>>   Réponse plus haut : speech-dispatcher ne sait rien faire ou
>>   sait tout faire ce qui revient essentiellement au même : les
>>   langues disponibles sous espeak, festival, ibmtts ... le sont
>>   sous speech-dispatcher puisqu'il sait piloter ces synthèses
>>   là (à noter festival est-ce vraiement une synthèse ou un
>>   intégrateur de plus ?) C'est ce genre de question qui jettent
>>   le trouble et amènent des interrogations comme les tiennes :
>>   on peut donner des définitions très précises de tel ou tel
>>   objet : "synthèse" "serveur vocal" etc ... sauf qu'après on
>>   ne trouve aucun soft qui match la définition ! Les gens ont
>>   développer des trucs en rapport à des besoin pratiques, pas
>>   pour illustrer un formalisme !
>> 
>> 
>> > 
>> > Enfin, j'ai vu que mbrola est dispo en paquets prêts-à-intaller sous Ubntu
>> > (répos partner ou autre), es-ce uqe qq'un l'a déjà essayé, et si oui avec
>> > espeak ou speech-dispatcher ?
>> 
>>   Tout le monde a essayé mbrola ! parce que le code de mbrola
>>   et les samples de voix n'ont pas du changer depuis 10 ans. En
>>   revanche mbrola a besoin d'un text-to-speech (humpf c'est
>>   quoi ça par rapport à un serveur vocal et une synthèse ? Beh
>>   on s'en fout, on a dit que les définitions c'était pour les
>>   cochons !) Ouaipf enfin bon mbrola n'est pas capable de
>>   prendre un texte et de fabriquer de la voix. Il faut un bazar
>>   en amont qui lui fabrique des phonèmes à partir du
>>   texte. Typiquement ce que "savent" faire festival et
>>   cicero. Avec les atouts de chacun comme tu le sais bien !
>>   (polémique là ? az non alors elle a déjà eu lieu 250 fois ici
>>   et on ne va pas remùetre ça !) Mais bref je ne sache pas que
>>   speech-dispatcher sache assurer ces fonctions de TTS pour
>>   piloter directement mbrola. Mais ça se pourrait. Je peux
>>   vérifier si ça t'intéresse vraiement. Quant à espaek je ne
>>   sache pas non plus qu'il puisse faire ça.
> Si, espeak peut servir aussi de générateur de phonème, typiquement pour
> utilisation avec mbrola.

  OK Manu ! Ca je note aussi. J'envisageais de faire une petite
  page web où les infos concernant la synthèse vocale sous
  linux serait un peu rassemblées. J'archive ton mail, il me
  sera précieux !


> 
> Amicalement,


  De même !

  Pierre
> 
> Manu
>> 
>> 
>> 
>> > 
>> > Merci
>> 
>>   Oh de rien mon bon Monsieur ! 
>> 
>>   bon dimanche !
>> 
>>   Pierre
>> 
>> 
>> > et bon dimanche,
>> > 
>> > Aldo. 
>> > 
>> > 
>> > ---
>> > -- 
>> >    CarrefourBLinuX MailingListe 
>> >    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>> >    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>> >    Archives: 
>> >    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>> > 
>> 
>> ---
>> -- 
>>    CarrefourBLinuX MailingListe 
>>    Pour obtenir de l'aide, envoyez le sujet  help  ?: 
>>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>>    Archives: 
>>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>> 
> 
> ---
> -- 
>    CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

---
-- 
   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  �
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/