Re: Cicero Was:Re: [CBLX] Faire parler brltty

[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]


Le Thu, 5 Feb 2009 09:22:01 +0100
Osvaldo La Rosa <ald0.nospam@xxxxxxxxxx> écrivait:

> 
> > Après avoir traduit cicero en c++, me suis penché sur rules.fr, pour 
> >améliorer la prononciation de certains mots ou verbes 
> 
> Es-ce que cette conversion en C++ permet d'autres intégrations qu'en Python
> ?

Normalement oui : la version c++ fonctionne *exactement* comme la version python. Rien d'ajouté, rien de retranché. 
(sauf un truc : les suites de consonnes imprononçables - hhtp, https - sont limitées à 4 consonnes).
En fait c'est une librairie partagée .so, installée dans /usr/local/lib. Le rules.fr est lu au chargement initial, et ensuite, comme dans la version python, la routine process se charge de créer la chaîne de phonèmes à envoyer à mbrola.

> > Donc, j'ai travaillé avec le dictionnaire "Gutenberg" (336000 mots)

Ceci me permet d'extraire très vite les mots mal prononcés. Ainsi quand je me suis aperçu que affrontions était mal prononcé, j'ai extrait du dictionnaire tous les verbes terminés en "tions" : 686 verbes. Idem pour les mots terminés en "gent".
> 
> je pense qu'en complétant cette approche par la tienne, on obtient un 
> résultat sérieux car à la fois basé sur le dico, donc très rigoureux, et à
> la fois sur la variété, la diversité, la variation, cad ce que la société
> est dans toutes ses facettes et centres d'intérêts divers et variés de nous
> tous!
> 
> Je pense qu'o ndoit essayer de voir ce qu'on peut faire ensemble pour ne pas
> aboutir à deux rules.fr concurrentiels que de toute façon on ferait mieux de
> fondre plus tard.

Tout à fait d'accord !
Amitiés
Erwin
> 
> 
> ---


---
--
   CarrefourBLinuX MailingListe
   Pour obtenir de l'aide, envoyez le sujet  help  �   carrefourblinux-request@xxxxxxxxxxxxxxxxxxx
   Archives:
   http://listengine.tuxfamily.org/lists.tuxfamily.org/carrefourblinux


Mail converted by MHonArc 2.6.19+ http://listengine.tuxfamily.org/