Re: [CBLX] espeak ou speech-dispatcher ?

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Salut Aldo,

From: Aldo <info@xxxxxxxxxxxx>
Subject: Re: [CBLX] espeak ou speech-dispatcher ?
Date: Mon, 31 Jan 2011 10:39:38 +0100

> Salut Manu:
> 
> On Sun, Jan 30, 2011 at 02:46:40PM +0100, Emmanuel COUTRIS wrote:
>> On Sun, Jan 30, 2011 at 09:11:37PM +0000, Pierre Lorenzon wrote:
>> > > je voudrais savoir pourquoi, quand on lance orca pour la 1re fois, il propose
>> > > speech-dispatcher comme serveur vocal et non espaek ? es-ce que sous
> 
>> > 
>> >   Réponse simple : parce que speech-dispatcher est
>> >   effecttivement un serveur vocal tandis qu'espeak est une
>> >   synthèse vocale. Sauf qu'évidemment cette dycotomie est
>> >   purement artificielle et théorique, parce qu'espeak
>> >   implémente probablement des fonctionalités de serveur
>> >   vocal. Je dis probablement parce que je ne connais espaeak
>> >   que de nom et ne sais pas ce qu'il sait faire. 
> 
> Comme je pensais que ça utilisait en background Festival-lite, probab que
> ma perception d'eSeak était totalement erronée;



  Ah ça c'est sûr sur ce coup-là. espeak et une synthèse
  autonome. Certes ce n'est pas un serveur vocale mais c'est
  une synthèse "fully featured" au même titre que flite et un
  peu plus que mbrola qui n'incorpore pas de TTS.
> 
> mais j'ignore si on peut faire plus avec Speech-dispatcher, genre obter pour
> une voix eSpeak pour le NL et une voix Mbrola ou Voxin (/IBMTTS) pour le FR;
> je suppose que c précisément le but ?

  Tout à fait ! Sans compter, comme je me suis tué à le
  répéter, le message scheduling qui est en gros la différence
  entre une synthèse stupide et une synthèse un peu moins
  stupide : j'ai pas dit intelligente !



> 
>> Non, espeak n'est pas conçu pour être serveur. Juste un logiciel pour
>> générer du son à partir du texte (TTS). Les logiciels qui utilisent espeak
>> doivent envoyer les données à espeak en le lançant et en lui transmettant
>> le texte sur son entrée standard.
> 
> OK!
>  
>> >   speech-dispatcher, par contre c'est très clair : il ne sait
>> >   faire que de l'intégration et du dispatching, pas de
>> >   synthèse. Il ne sait que déléguer à des synthèses le boulot.
> 
>> > > speech-dispatcher on a autant de langues supportées que sous espeak ?
>> > 
>> >   Au vu de ce qui précède, cette question n'a pas de sens !
> 
> Effectivement, j'ai bien compris.

  Ca veut dire que j'explique pas trop mal alors ?


> 
>> >   speech-dispatcher supporte espaeak parmi les synthèses qu'il
>> >   sait piloter, donc on a au moins toutes les langues
>> >   disponibles sous espaeak.
> 
> OK, donc si je choisis prochainement Speech-dispatcher sous Ubuntu au lieu
> de directement eSpeak, là je pourrai aumoins tenter ce que je suggérais plus
> haut, à savoir eSpeak pour le NL, Mbrola (ou autre) pour le FR (biensûr
> après avoir activé le bon répo dans le sources.list Ubuntu afin de pouvoir
> installer les packs Mbrola).

  Oui !


> 
>> > > Perso j'ai besoin à la fois du FR et du NL, pas spécialement sous le même
>> > > compte (/utilisateur),
>> > > quel est la "bonne" solution dans un tel cas, quel serveur préférer avec 
>> > > quelle langue ?
> 
>> >   Perso je dirais que quitte à utiliser espeak, autant
>> >   l'utiliser sans speech-dispatcher entre les deux. La même
>> >   remarque vaudrait avec festival d'ailleurs dans un cas que je
>> >   connais alors au micron près. Sauf que ... il y a toujours un
>> >   sauf ... Espeak se conduit en serveur vocal, certes, comme
>> >   festival certes, mais n'implémente peut-être pas en interne
>> >   tout ce que speech-dispatcher implémente par ailleures (un
>> >   scheduleur de message digne de ce nom par exemple.) Pour
>> >   festival c'est clair, il faudrait implémenter ces features
>> >   mais elles ne le sont pas d'origine. Je crains que pour
>> >   espeak la situation soit analogue.
> 
> Ma question est motivée par la recherche d'une meilleure qualité audible de
> la synthèse, or bcp de personnes ici savent ce que je pense d'eSpeak .....
> et donc si là où on le peut je puis utiliser une autre voix d'une autre
> synthèse, si ça passe obligatoirement par Speech-dispatcher je veux bien 
> tenter cette piste! 

  Presque obligatoirement. Surtout si tu veux switcher d'une
  voix à l'autre en fonction de la langue. Je ne sais pas ce
  que sait faire orca sur ce plan là mais il est clair qu'emacs
  lui sait choisir la langue automatiquement en fonction du
  texte édité. Le switch est donc purement transparent pour
  l'utilisateur une fois que la conf est déterminée. Bien sûr
  on peut toujours forcer le switch à la main ...


> 
>> >   Donc pour résumer Aldo ! quels avantages et quels
>> >   inconvénients :
>> > 
>> >   1. Avantage : utiliser espeak tout seul : clair légèreté ! un
>> >   serveur au lieu de deux en chaîne : tu vois tout de suite que
>> >   si tu as une machine à ressources limitées, tu pourrais
>> >   gagner en réactivité. 
> 
> Ah, ce dernier point est un bon argument en effet! le reste hm!

  Ouaip mais après la discussion avec Manu, il s'avère que vu
  les features d'espaeak, si tu l'attaques directement depuis
  orca tu gagneras peut-être en réactivité mais tu perdras
  SUREMENT en intelligence (sauf évidemment si orca est
  complètement con ce que je ne sais pas.) Avec emacs c'est
  clair : si tu shunte speech-dispatcher tu perds énormément !
  i.e. les features décrites plus haut.



> 
>>>Ouaip ! mais bon si tu as une machine à
>> >   ressources limitée et que tu utilises déjà des usines à gaz
>> >   type gnome+orca : "c'est déjà un mauvais choix" (enfin ça
>> >   c'est juste Pierre qui le dit, c'est pour ça qu'il a mis des
>> >   guillemets !) !!!!
> 
> De là ma question, voici une semaine, sur nice, dont je sais maintenant que
> seul avec des permissions su on peut passer des options négatives,
> permettant une accélération (/lis privilège) de certaines applis;
>  j'aurais voulu rêver pouvoir faire ça avec Orca+ eSpeak sur un netbook !!!

   Y a pas que du nice qui puisse accélérer le process. C'est
   le problème de ces fusées à plusieurs étages, les ascenseurs
   entre les étages sont parfois très lents. Typiquement si
   deux étages utilisent des fichiers pour communiquer au lieu
   d'utiliser des sockets ou des connection tcp, tu vois le
   problème surtout si tu as des mémoires de masse lentes. Là
   il y a toujours l'astuce de monter en tmpfs la partition où
   se font les échanges. Ce que je fais avec festival
   d'ailleurs. Mais qui dit tmpfs dit que le traffic se fait en
   RAM et si tu es léger en RAM ben il va se faire dans le swap
   et retour à la case départ.


> 
>> >   2. Avantage espeak piloté par speech-dispatcher : beh je
>> >   pense que le scheduling des messages est infiniement meilleur
> 
> Mais dès que j'ajoute Mbrola, je suppose qu'avec Speech-dispatcher on peut
> du cou pdans son menu de conf changer ses options et activer Mbrola ? Donc
> j'y vois vraiment une solution pour mon problème là, au regard de ce que
> j'ai expliqué plus haut!

  Tout à fait. 


> 
>> >   J'espère qu'avec ça tu as des éléments pour te décider
>> >   rationnellement : Sinon ressonne ! Pierre il ouvre presque
>> >   toujours !
> 
> Oui oui, avec une bassine d'eau derrière la porte :-) :-) Ho hooh, Pierre,
> sorry :-) Agenouillé!!!

  Froide l'eau bien sûr !Glacée même ! Il est comme ça le
  garçon on ne le changera pas !


> 
> Aldo.
> 
> PS: pour les "non avertis", ON t'adore Pierre! 

  Moi aussi je m'adore d'ailleurs !

  Pierre


>  
> 
> ---
> -- 
>    CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

---
-- 
   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  �
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/