Re: [CBLX] Qu'en pensez-vous ?

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Salut Raphaêl,


From: Raphaël POITEVIN <raphael.poitevin@xxxxxxxxx>
Subject: Re: [CBLX] Qu'en pensez-vous ?
Date: Sat, 17 Sep 2011 07:51:07 +0200

> Salut Pierre,
> 
> Désolé, mais là, j'ai à redire. C'est de bone guerre, car je sais que
> tu aimes bien faire un peu de provoque :-).
> Le 17/09/11, Pierre Lorenzon<devel@xxxxxxxxxxxxxxxxxxxx> a écrit :
>> C'est vrai que c'est esthétiquement un peu plus abouti que
>> mbrola par exemple. Sauf que les fichiers de démo de mbrola
>> donnent à peu près la même impresion. Tout simplement parce
>> qu'ils les ont préprocessé avec un outil d'intonation. Bon ici
>> l'outil est intégré très bien. Mais il faut bien avouer que ça
>> me laisse un peu de glace. Ca reste sûrement encore du son 8bit
> 
> Qu'entends-tu par son 8 bits ? Est-ce que tu entends voix synthétique,
> générée artificiellement ? Si tel est ton avis, je peux te démentir
> très facilement en connaissance de cause, car je connais toutes les
> voix de Kali en chair et en os (ou alsa si tu préfère, non je
> plaisante, c'était un mauvais jeu de mot). L'une est celle de Michel,
> le développeur en personne, la voix féminine est malheureusement
> celle d'une personne décédée aujourd'hui.

  Beh justement si c'est du samplé ça peut l'être en n bits. 8
  pour du son basse qualité, 16 pour les cds, 24 pour des gens
  qui veulent quand-même que ça soit joli. Enfin ça ne fait pas
  tout. Typiquement mon nagra aresm fait du 16bit mais vu les
  préamplis qu'il y a là-dedans ça tient le coup face à des
  trucs qui prétendent faire du 24. En fait ce nombre de bit
  est celui sur lequel on code l'échantillon. Donc plus on a de
  bits, plus le codage est précis. bien sûr si derrière on a un
  DAC qui écrabouille tout c'est pas la peine !



> 
>> (peut-être 16) avec une fréquence d'échantillonage sans doute
>> assez faible. Et puis cette voix qui traîne avec une espèce
> 
> Oui pour l'échantillonage, 22KHZ je crois. Mais on s'est aperçu qu'un
> taux d'échantillonnage plus important n'apportait rien, dixit les
> spécialistes du traitement de signal.

  Beh à 22khz tu écrête les fréquences au delà de 11khz ça fait
  pas beaucoup d'harmonique tout ça ! Surtout pour de la voix
  samplée. Enfin si le micro qui a été utilisé pour le sample
  écrêtait déjà comme une bête c'est sûr que c'est pas la peine
  de forcer sur l'échantillonage.



> 
>> d'effet d'écho c'est finalement assez désagréable. Tout ça pour
> 
> Je ne vois pas bien ce que tu veux exprimer par effet d'écho.

  La voix traîne, les attaques ne sont pas nettes et les fins
  encore moins. C'est comme si ils avaient tous de la purée
  dans la bouche quoi .



> 
>> que la voix décrive une courbe somme toute assez artificielle
> 
> Artificielle, oui, c'est de la robotique. Mais l'algo derrière est
> l'aboutissement de recherches de laboratoir.
> 
>> .... Il faut bien dire que l'intonation est une chose à
>> laquelle je suis assez peut sensible pour une synthèse
>> vocale. Car avec tout le mal qu'il se donne un ordinateur reste
> 
> Bien sûr, moi aussi ! C'est en quoi Kali est intéressante, puisque
> justement, elle est assez neutre. On a aussi la possibilité de faire
> varier le coefficient prosodique par paramétrages.
> 
>> un ordinateur et finalement c'est encore plus ridicule quand il
>> essaye dimiter les humains.
> 
> Je ne peux pas dire que je vais à l'en contre de ta
> remarque. Cependant, on a le même débat qu'on les voyants avec les
> outils graphiques, certains vont attacher une importance énorme à
> l'esthétique d'autres non. Le vocal, c'est pareil, certains vont être
> sensibles à l'esthétique auditive et j'en connais qui vont te dire
> qu'ils ne supportent pas les voix hyper robotiques.

  Clair on est d'accord ! C'est quand-même plus sexy que
  mbrola. Mais moi le sexy des ordi en fait je m'en fous !
  C'est tout ! Donc si comme je le dis plus bas on me le livre
  sur un plateau pluggué dans festival je prends. Sinon je
  bouge pas mon petit doigt.



>>
>> En revanche ce qui à mes oreilles fait la qualité d'un outil
>> vocal c'est sa réactivité. Sur plusieurs points : pouvoir
>> s'adapter à divers contextes de travail, pouvoir avoir un débit
>> suffisant pour qu'on ne perde pas trois plombes à lire deux
> 
> La qualité intrincèque de Kali, c'est son intelligibilité à haute
> vitesse justement, point sur lequel nous avons beaucoup insisté lors

  Bon ça c'est à tester en vraie grandeur et là je promets
  d'être très attentif !


> de son développement. Sa neutralité en fait également un outil qui
> s'adapte à tous les contextes, queça soit de la lecture littéraire ou
> de la lecture de messages informatiques.
> 
>> mots, pouvoir être interrompue à volonté et sans délais pour
>> pouvoir substituer au message en cours un message de plus
> 
> Ca se passait très bien sous Windows. Le problème, si problème il
> devait y avoir, devra être travaillé au niveau du portage.
> 
>> grande importance.
>>
>> Ca ça ne se voit pas dans un fichier de démo. Et en fait ça
>> dépend aussi de l'outil intégrateur.
> 
>>   ... Je te signale à toute fin utile que des outils
>>   intégrateurs ça existe .... festival speech-dispatcher ou
>>   même emacs.
> 
> Puisque pour le moment l'outil le plus standard est speech-dispatcher,
> sur lequel speechd-el ou Orca peuvent se connecter, on travaillera sur
> speech-dispatcher.

  Ca a le mérite d'être pragmatique je ne peux rien dire
  là. Mais speech-dispatcher j'aime pas beaucoup en vérité !




>>
>>   Si c'était pluggable dans festival .... sans trop de travail
>>   peut-être .... Mais j'ai du mal à me convaincre que pour moi
>>   le jeu en vaille la chandelle. Ben ouais je fais la fine
>>   bouche ...
> 
> Pour le moment, je suis désolé, mais je me vois mal proposer ta
> solution festival mbrola qui marche mal en lecture littéraire, qui

  Ca s'est amélioré faudrait faire un petit svn update mon garçon !



> n'arrive pas à avoir un son correcte à l'épellation et qui nous fait

  ah tu ne m'avais jamais parlé de ça avant. J'épelle rarement
  moi. Je regarderai s'il y a un problème.



> des envolées prosodiques on ne sait pourquoi.

  Oui ça c'est vrai. Parce que la fonction de calcul du pitch
  doit être un truc mal foutu. Enfin le point c'est que je ne
  me suis jamais donné le mal d'aller chercher quelle devrait
  être la courbe. Parce qu'étant donnée une courbe
  l'implémenter dans un langage fût-il le plus goddam c'est pas
  la mère à boire et scheme c'est tout sauf un langage goddam.



> 
> Moi je ne demande pas mieux que de faire progresser franfest +
> festival. Mais festival est ce qu'il est, un projet qui n'avance pas
> beaucoup, qui n'est pas compilable avec les derniers gcc, le patch

  Et là tu retardes encore ! la version 2.0 est sortie, j'en ai
  parlé sur cette liste et elle compile avec du gcc 4. et des
  brouettes ! Tu crois vraiement que si festival ne compilait
  pas avec un gcc standard je m'en servirai comme wrapping pour
  mon interpréteur scheme d'ecasound ...


> franfest que personne n'arrive à retoucher parce que c'est du vieux
> code ...

  Demain matin ! mon petit au pré au corbeaux et chacun une
  épée ! Là je me sens visé ! Il y a une adresse sur la page
  web de franfest à laquelle on peut écrire si on rencontre une
  difficulté. Et cette adresse elle abouti chez moi ! Et j'ai
  jamais reçu un mail me disant il y a tel ou tel problème dans
  le code. Le code c'est du c dur et méchant, même pas du c++
  alors avant que ça se démode ... Y en a beaucoup qui on
  essayé de retoucher ? Bon c'et vrai qu'il y a des parties
  assez obscures ... Mais je répète personne ne m'a jamais dit
  j'ai essayé de faire ci ou ça et je n'y suis pas
  arrivé. Alors mon petit doigt me dit qu'il n'y en a pas
  beaucoup qui on du vraiment essayer. Ou alors il essayent
  comme mes étudiants essayent de résoudre mes exos : il
  regardent la feuille 5 minutes et il disent, sans même avoir
  empoigné leur stylo : de toute façon ce prof est fou et on
  n'y arrivera pas !




> 
> Donc je pense qu'à un moment, il faut un peu révolutionner les chose
> et partir de projets solides à la base, sur lequel on a des

  Ouaips , Enfin là festival dans le genre projet solide ça se
  pose quand-même là !



> interlocuteurs fiables, même si ce n'est pas libre, chose à laquelle je

  Allan W. Black est tout sauf un clown !




> crois tu n'es pas sensible d'autant plus. Kali est un projet qui a
> réuni deux gros labos de recherche, pour moi il reste très crédible.

  Oh l'université d'Edinbourg et la CMU (Carnegie Mellon
  University) c'est un petit truc dont personne n'a jamais
  entendu parlé c'est vrai ...


> 
> Après, chacun est libre de choisir la solution qui lui convient.

  Oh certes ! Moi si je pouvais intégrer kali avec festival je
  serais ravi. Parce que c'est vrai et je te le redis en
  conclusion, Kali c'est quand-même esthétiqement assez
  chouette. Et objectivement comme outil intégrateur, festival
  (ou en fait plus précisément siod) c'est du très très sérieux
  (à noter que siod est le scripting language de chose aussi
  variée que gimp ou lilypond.) Et je n'aurais pas choisi siod
  comme scripting language pour ecasound si je 'ny croyais pas
  un peu.Mais ça a un coup, comme chaque fois qu'il faut rendre
  compatibles deux systèmes. Et moi je ne suis pas près à payer
  ce coup pour un simple gain d'esthétique. Parce qu'en matière
  d'efficacité ce dont je dispose est quand-même assez optimal.



> 
> Surtout, il ne faut pas avoir l'impression que je m'énerve, mais il y
> a un moment, je crois qu'il faut arrêter de philosopher et rester dans
> l'abstrait, mais faire du concret. J'ai derrière moi des gens, qui ne
> croient pas aux solutions GNU/Linux, (il me semble que gilles avait
> dit une fois que sa femme était un exemple concret), qui sont
> doucement en train de s'apercevoir que ça pourrait être crédible, mais
> restent encore sur des acquis de qualité qu'offre les solutions
> windows, fondées ou non d'ailleurs, là n'est pas le débat. Mais si à
> l'heure actuelle, on leur montre des outils qui juste marchent, je
> crois qu'on a tout raté et qu'on peut retourner dans notre petit chez
> soit auprès d'un bon feu de cheminée. Malheureusement, les
> utilisateurs sont exigents et on les a habitué à des choses kikoulol
> sous Windows, ils ne pourront pas s'en détacher facilement.

  100% d'accord ! But it's not my job ! I don't care ! Moi je
  ne suis pas un missionaire ! chacun son truc. J'ai d'autres
  préoccupations que de convertir des windowsiens à linux. Donc
  voilà pourquoi je n'ai peut-être pas les mêmes priorités
  ... Et comme dit ma belle mère, s'il n'y avait qu'un goût il
  'ny aurait qu'une sauce.


  Et puis je ne veux pas déballoner votre boulot à Sam et à
  toi. Je ne sais pas pourquoi, j'ai été négatif .. En fait
  parce que j'ai été assez déçu par Kali. Je pense qu'en terme
  de qualité sonore avec ce qu'on a sous le pied maintenant en
  terme de machines, on pourrait faire mieux encore.

  Pierre



> 
> Bien à toi et à tous,
> 
> Raphaël
> 
> ---
> -- 
>    CarrefourBLinuX MailingListe 
>    Pour obtenir de l'aide, envoyez le sujet  help  à: 
>    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>    Archives: 
>    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
> 

---
-- 
   CarrefourBLinuX MailingListe 
   Pour obtenir de l'aide, envoyez le sujet  help  �
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives: 
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/