Re: [CBLX] Synthèses Was: Delire 0.2 : une nouvelle version du lecteur de texte vocal en ligne de commande

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Bonjour,

Voilà des renseignements extrêmement précieux. J'archive ce
mail à un endroit où je saurai le retrouver le moment
venu. Effectivement festival + speech-dispatcher prennent
essentiellement en charge les entrées (sous forme de phonèmes)
et les sorties (gestion du son.) Dans l'optique d'une telle
utilisation c'est donc bien des modules centraux dont on a
besoin.

Cordialement 

Pierre


From: Michel MOREL <michel.morel@xxxxxxxxxx>
Subject: Re: [CBLX] Synthèses Was: Delire 0.2 : une nouvelle version du lecteur de texte vocal en ligne de commande
Date: Fri, 30 Apr 2010 12:44:23 +0200

> Bonjour,
> 
> Je vais essayer d'apporter quelques infos sur Synthé.
> Il est heureusement modulaire.
> Synthé ne comporte pas d'analyse syntaxique (et donc pas de
> prosodie). Pour la phonétisation du texte, si Festival
> l'effectue, on peut effectivement s'en passer et sauter cette
> étape dans Synthé.
> Pour mieux comprendre l'architecture de Synthé, je vais décrire
> les 8 modules. Chaque module constitue un fichier. Les modules
> sont les suivants :
> 1. Synthé. C'est l'entrée de la librairie. Elle contient les
> fonctions publiques pour régler la synthèse, parler, demander
> l'état d'avancement de la lecture et stopper.
> 2. SynTex. Elle gère la fonction principale avec un paramètre
> sous forme de structure, qui contient les réglages et un
> pointeur sur le texte à lire. L'un des réglages est le mode
> phonétique, à utiliser si la phonétisation est déjà faite en
> amont. Il faudra convertir les codes phonétiques de Festival en
> codes Synthé par tableau.
> 3. SynTrans. Transcription graphème-phonème. Inutile si
> Festival le fait.
> 4. SynParle. Gère la parole : traitement du texte phonétique
> jusqu'à la création des échantillons (classe Parle).
> 5. SynVoix. Gère la fabrication de la voix : échantillons de
> parole (classe Voix), paramètres qui permettent d'organiser les
> échantillons de parole (classe Tab).
> 6. SynCalcul. Fonctions de fenêtres sinusoïdales pour fabriquer
> les échantillons de parole résultants. SynParle, SynVoix et
> SynCalcul sont indissociables, il est inutile de rentrer dans
> leur fonctionnement.
> 7. SynSon. Module de sortie qui gère la carte son avec
> Direct-X. Remplacer Direct-X par alsa, à moins que Festival
> possède une fonction qui prend les échantillons en entrée et
> synchronise leur sortie sur la carte son.
> 8. SynGlobal. C'est la classe Global, toutes les fonctions qui
> ont pour portée la synthèse dans son ensemble (vitesse,
> hauteur, etc. demande de stop, demande de position de
> lecture). Les fonctions de Global sont accessibles depuis tous
> les modules car la plupart des réglages concernent plusieurs
> modules.
> 
> Que la solution choisie soit un fonctionnement autonome depuis
> les entrées de la librairie ou que seulement certains modules
> soient gérés par Festival, le résultat sera le même, je n'ai
> pas de préférence. Question complexité, cela me semble à peu
> près équivalent de créer une interface entre lecteur d'écran et
> librairie Synthé, ou entre des fonctions de Festival et une
> librairie simplifiée de Synthé.
> 
> Meilleurs sentiments
> 
> Michel MOREL
> 
> Le 07:12 30/04/2010,Pierre Lorenzon écrit:
> 
>>Salut Raphaël,
>>
>>From: Raphaël POITEVIN <raphael.poitevin@xxxxxxxxx>
>>Subject: Re: [CBLX] Synthèses Was: Delire 0.2 : une nouvelle
>>version du lecteur de texte vocal en ligne de commande
>>Date: Thu, 29 Apr 2010 23:51:17 +0200
>>
>> > Salut Pierre,
>> >
>> > Je me permets d'ajouter le développeur de synthe 3 et Kali en
>> > CC si il
>> > a envie de suivre notre débat bien qu'il soit très pris.
>>
>>   Excellente idée !
>>
>>
>> > Le 29/04/10, Pierre Lorenzon<devel@xxxxxxxxxxxxxxxxxxxx> a
>> > écrit :
>> >>   Oui et sur ce point, Alain Rousseau, le grand Alain Rousseau
>> >>   que connaît bien ton Papa, m'avait donné une explication à
>> >
>> > Oui moi aussi je le connais, il paraît que vous vous parlez
>> > souvent
>> > m'a-t-il dit. Bah, entre grand scientifique, quoi de plus
>> > normal !
>> >
>> >>   savoir qu'en fait c'est le mode de synthèse qui est en
>> >>   cause. si j'avais bien compris c'est la synthèse par diphone
>> >>   type mbrola qui est en cause et n'est pas adaptée au
>> >
>> > Ah non pourquoi ça ne serait pas adapté ?
>> >
>> >>   Français. On pourrait creuser quitte à prendre un petit cours
>> >>   d'acoustique. Mais je crois que kali fonctionne différemment.
>> >
>> > Si si, Kali fonctionne par concaténation de diphones. Ce sont
>> > les
>> > synthèses dont je t'ai parlé qui elles, fonctionnent par
>> > concaténation
>> > d'unité et parallèlement par diphones.
>>
>>   Je disais bien que j'avais compris ça à moitié ! Va falloir
>>   que je me remette au parfum !
>>
>>
>> >
>> >>
>> >>> Chez moi, quand je mets en place tout le paquet esdffm, mbrola
>> >>> est non
>> >>> seulement mécanique mais quasi inaudible du fait de son timbre
>> >>> rauque.
>> >>
>> >>   Ouais tu n'aimes pas mbrola et voilà tout ! Mais il n'y a
>> >>   rien de péjoratif dans mon propos ! Tout le monde ne peut pas
>> >
>> > Ah je ne dis pas que je n'aime pas mbrola, mais je dis juste
>> > que je
>> > m'attendais à mieux chez moi, car un jour tu nous avais envoyé
>> > une
>> > petite démo qui me semblait intéressante. Je suis simplement
>> > très déçu
>> > de ne pas retrouver ça sur ma machine.
>>
>>   Ah alors ça c'est embêtant ! Parce que la démo je l'avait
>>   faite avec speechd-el speech-dispatcher festival et
>>   mbrola. Donc ça devrait être reproductible. Bon c'est un
>>   point à creuser il n'y a peut être qu'un petit détail à
>>   régler.
>>
>>
>> >
>> >>   porter les mêmes godasses parce que tout le monde n'a pas le
>> >>   même pied ! Tout le monde n'est pas content avec la même
>> >>   synthèse parce que tout le monde n'a pas la même oreille !
>> >>   D'où vient-il que certains mélomanes détestent le clavecin ?
>> >
>> > Parce qu'à la base ils ne doivent pas trop aimer l'époque
>> > baroque ! (sourire) !
>> >
>> >>   Oh là je suis sûr que Gilles va y aller de son grain de sel !
>> >
>> > J'espère bien !
>> >>
>> >>   Mais je reviens sur un épisode antérieur : Tu disais vouloir
>> >>   porter synth3 à la festival ! Non non non faut pas faire ça !
>> >>   C'est du réinventage de roue ! Faut juste dans la chaîne
>> >>   remplacer mbrola par synthe3. La partie intégration serveur
>> >>   et même analyse synthaxique tu ne t'em.... pas avec ça !
>> >>   C'est fait de manière excellente et inégalable dans
>> >>   festival. Comme festival sait piloter la synthèse qu'on veut
>> >
>> > Ah peut-être que je n'ai rien compris mais là je t'arrête !
>> > Synthe 3
>> > est un tout, elle comprend déjà son propre moteur écrit en c++
>> > mis en
>> > place depuis 1982 je crois, donc je n'ose trop m'avancer, mais
>> > je
>> > pense que ça a été fait avant franfest voir avant festival et
>> > elle est
>> > très bonne. Donc je ne vais rien réinventer, loin de moi la
>> > capacité,
>> > mais juste porter. Mais peut-être aurais-je la possibilité de
>> > m'inspirer du code de festival pour la partie client
>> > serveur. C'est
>> > surtout à but pédagogique, pour m'améliorer en programmation
>> > que je
>> > veux faire ça, ça me donne un truc concret à manger.
>> >
>> >>   pour peu qu'on écrive trois lignes de schem, tu vois c'est
>> >>   juste le moteur qu'il faut changer pas la boîte de vitesse,
>> >>   la direction, etc ... Clair ?
>> >
>> > Non désolé, pas tout à fait clair, mais je ne demande qu'à
>> > m'informer.
>> > Je pense qu'au contraire, si j'essaie d'extraire juste la
>> > partie
>> > sonore de synthe je vais m'arracher tous les cheveux.
>>
>>   Beh là ça ne dépend que de la modularité du code ! Si ça a
>>   été dévelopé de manière modulaire ça devrait être
>>   possible. Et de mon point de vue c'est l'idéal. Festival est
>>   un très bon intégrateur avec des possibilités de contrôle
>>   immense du fait de son langage de programmation interne. Donc
>>   de mon point de vue, il faut isoler dans synthe3 la partie de
>>   code qui prend des diphones et les transforme en son. En gros
>>   ce que fait mbrola. Si même tu ne le faisais pas pour faire
>>   piloter synthe3 par festival, tu aurais intérêt à le faire de
>>   toute façon. Conseil d'ami ! Si le code n'est pas modulaire à
>>   l'origine (ce qui pourrrait être parce que c'est un code déjà
>>   bien ancien) il faut le modulariser. Il y a tout à y gagner !
>>
>>   Pierre
>>
>>
>>
>> >
>> > Bien à toi,
>> >
>> > Raphaël
>> >
>> > ---
>> > --
>> >    CarrefourBLinuX MailingListe
>> >    Pour obtenir de l'aide, envoyez le sujet  help  à:
>> >    carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
>> >    Archives:
>> >    http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux
>> >
> 
> --------------------
> Michel MOREL
> Laboratoire CRISCO
> Université de Caen
> Esplanade de la Paix
> 14032 CAEN CEDEX
> Tél. 02 31 56 57 37
> Fax 02 31 56 54 27
> www.crisco.unicaen.fr
> 



---
--
   CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  à:
   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/