| Re: [CBLX] Paps, UTF/ISO |
[ Thread Index | Date Index | More lists.tuxfamily.org/carrefourblinux Archives ]
Le Mon, 2 Nov 2009 19:41:30 +0100 Aldo <info@xxxxxxxxxxxx> écrivait: > question: > quelqu'un a-t-il un document txt récent AVEC des accents dedant, qu'il > pourrait convertir en .ps par paps: > si ça marche alors le bug est en amont, cad probab dans l'ocr. > Si c'est dns paps alors faut que je le rapporte pour que ça soit fixé dans > une version ultérieure. > Bonsoir, je viens d'essayer de convertir un texte récent (en utf8) par paps : pas de pbs. je joins les 2 fichiers cordialement erwin
-----------------------------------------
configuration de sphinx4 pour le français
-----------------------------------------
après récupération de l'archive "french_f0.tgz" (http://sourceforge.net/projects/cmusphinx/files/)
du LIUM (Laboratoire d'Informatique de l'Université du Maine (http://www-lium.univ-lemans.fr/)
il faut modifier la structure des répertoires pour la rendre conforme à la structure adoptée
par l'Université Carnegie-Mellon et copier dans ces répertoires les fichiers nécessaires.
sphinx4_fr0.jar
|
+- edu
|
+- cmu
|
+- sphinx
|
+- model
|
+ acoustic
|
+ fr0
|
| - model.props
| - Model.java
| - ModelLoader.java
| - PropertiesDumper.java
| - LICENCE
| - README
|
+ - cd_continuous
|
| - means
| - variances
| - mixture_weights
| - transition_matrices
|
+ - dict
|
| - frenchWords62k.dic
| - frenchFillers.dic
|
+ - etc
|
| - french_f0.5725.mdef
---------
à noter :
---------
model.props est nommé dans l'archive originale du LIUM "am.props"
il faut le renommer en "model.props" et ajouter les 2 lignes suivantes :
dataLocation = cd_continuous
modelDefinition = etc/french_f0.5725.mdef
les 2 dictionnaires doivent être enregistrés en utf-8 !
les trois fichiers sources java sont à récupérer dans les sources de Sphinx4
copiés et modifiés de façon à refléter la structure:
"package edu.cmu.sphinx.model.acoustic.fr0;"
ils doivent être compilés dans le répertoire d'installation.
pour terminer, il ne reste plus qu'à générer le fichier "sphinx4_fr0.jar"
Attachment:
lisez-moi.ps
Description: PostScript document
| Mail converted by MHonArc 2.6.19+ | http://listengine.tuxfamily.org/ |