[General] Reconocimiento de voz con Simon [script de trabajo]

Hola lista y a Miguel He estado trabajando en el procesamiento del corpus AnCora para crear un diccionario sombra y facilitar con su uso el reconocimiento de la voz con Simon. <http://userbase.kde.org/Applications/Accessibility/ca#simon> El corpus AnCora es GPL pero nos requieren ver de qué se trata el trabajo final. Una vez acabemos tengo pensado añadir un corpus creado a partir de los catálogos de traducción, pues serán las palabras de uso común. <http://clic.ub.edu/corpus/ancora-descarregues> <http://l10n.kde.org/stats/doc/trunk-kde4/toplist/> Adjunto el script de trabajo para que comentéis mejoras. Que las habrá. La traducción para el fonema todavía no funciona como espero que lo haga. Sólo trabaja sobre un subdirectorio para reducir el procesamiento durante las pruebas. Un poco de la salida: titllar,t i t ll a r tranquil·la,t r a n q u i l· l a unitària,u n i tà r i a Vilafranca,v i l a f r a n c a Mañana escribiré a la lista de correo kde-accessibility@kde.org para aclarar cual seria el mejor formato y con quién contactar para subirlo a FTP. <https://mail.kde.org/mailman/listinfo/kde-accessibility> Soy currante no informático y entiendo mejor el bash. Si alguien puede echar una mano con el perl se lo agradeceremos enormemente. Atentamente Toni

Buenos días: Acabo de empezar hace un par de días la traducción de Simon al castellano y he aprovechado para retomar el tema del corpus, por el que me interesé hace unos meses. He solicitado un usuario para la descarga del corpus en castellano en la dirección que se indica en el script perl y esperaré a que me respondan. Cuando tenga acceso quizás tenga que pedir algún tipo de información/ayuda con respecto al uso del script y la incorporación de los resultados a Simon. Saludos y gracias: Javier Viñal. El 23 de noviembre de 2012 03:16, Antoni Bella Pérez <antonibella5@orange.es
escribió:
Hola lista
Ésta versión del script soluciona la traducción.
Toni _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general

El Dimecres, 9 de gener de 2013, a les 22:58:03, Javier Viñal va escriure:
Buenos días:
Acabo de empezar hace un par de días la traducción de Simon al castellano y he aprovechado para retomar el tema del corpus, por el que me interesé hace unos meses. He solicitado un usuario para la descarga del corpus en castellano en la dirección que se indica en el script perl y esperaré a que me respondan. Cuando tenga acceso quizás tenga que pedir algún tipo de información/ayuda con respecto al uso del script y la incorporación de los resultados a Simon.
Saludos y gracias: Javier Viñal.
¡Oido cocina! ;-) Éste mes voy a ser un pésimo colaborador pero ahí van mis cinco centavos. Ya que traduces la IGU mira en las fuentes de «Simon» y traduce el texto de sus imágenes «simon/simon/themes/default». En éste informe de error (<https://bugs.kde.org/show_bug.cgi?id=301722>) explican cómo hacerlo. He modificado el script, así que en su momento te pasaré la última versión. Atentamente Toni

Hola: Ya he terminado la traducción completa de Simon y del resto de kde-accessibility al castellano, tanto mensajes como documentación. También he conseguido compilar y hacer funcionar Simon en mi Arch Linux (excepto que no reconoce el micrófono de la cámara en el portátil). Me gustaría retomar el tema de generar el diccionario en la sombra en castellano, por lo que me gustaría saber si disponéis de una versión actualizada del script o me pongo a trabajar sobre la última que enviastéis. Saludos, Javier El 10 de enero de 2013 00:19, Antoni Bella Pérez <antonibella5@orange.es>escribió:
El Dimecres, 9 de gener de 2013, a les 22:58:03, Javier Viñal va escriure:
Buenos días:
Acabo de empezar hace un par de días la traducción de Simon al castellano y he aprovechado para retomar el tema del corpus, por el que me interesé hace unos meses. He solicitado un usuario para la descarga del corpus en castellano en la dirección que se indica en el script perl y esperaré a que me respondan. Cuando tenga acceso quizás tenga que pedir algún tipo de información/ayuda con respecto al uso del script y la incorporación de los resultados a Simon.
Saludos y gracias: Javier Viñal.
¡Oido cocina! ;-)
Éste mes voy a ser un pésimo colaborador pero ahí van mis cinco centavos.
Ya que traduces la IGU mira en las fuentes de «Simon» y traduce el texto de sus imágenes «simon/simon/themes/default». En éste informe de error (<https://bugs.kde.org/show_bug.cgi?id=301722>) explican cómo hacerlo.
He modificado el script, así que en su momento te pasaré la última versión.
Atentamente Toni _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general

El Divendres, 5 de juliol de 2013, a les 22:39:40, Javier Viñal va escriure:
Hola:
Ya he terminado la traducción completa de Simon y del resto de kde-accessibility al castellano, tanto mensajes como documentación. También he conseguido compilar y hacer funcionar Simon en mi Arch Linux (excepto que no reconoce el micrófono de la cámara en el portátil). Me gustaría retomar el tema de generar el diccionario en la sombra en castellano, por lo que me gustaría saber si disponéis de una versión actualizada del script o me pongo a trabajar sobre la última que enviastéis.
Saludos, Javier
El 10 de enero de 2013 00:19, Antoni Bella Pérez
<antonibella5@orange.es>escribió:
El Dimecres, 9 de gener de 2013, a les 22:58:03, Javier Viñal va escriure:
Buenos días: Acabo de empezar hace un par de días la traducción de Simon al
castellano y he aprovechado para retomar el tema del corpus, por el que
me
interesé hace unos meses. He solicitado un usuario para la descarga del corpus en castellano en la dirección que se indica en el script perl y esperaré a que me respondan. Cuando tenga acceso quizás tenga que pedir algún tipo de información/ayuda con respecto al uso del script y la incorporación de los resultados a Simon.
Saludos y gracias: Javier Viñal.
¡Oido cocina! ;-)
Éste mes voy a ser un pésimo colaborador pero ahí van mis cinco centavos.
Ya que traduces la IGU mira en las fuentes de «Simon» y traduce el texto
de sus imágenes «simon/simon/themes/default». En éste informe de error (<https://bugs.kde.org/show_bug.cgi?id=301722>) explican cómo hacerlo.
He modificado el script, así que en su momento te pasaré la última
versión.
Atentamente Toni
Hola ¡Oido cocina! Lo tenia bastante dejado por otras tareas. Veo cómo està y mañana envio lo que hay y las sugerencias desde kde-accessibility At kde org. Atentamente Toni

El Divendres, 5 de juliol de 2013, a les 22:39:40, Javier Viñal va escriure:
Hola:
Ya he terminado la traducción completa de Simon y del resto de kde-accessibility al castellano, tanto mensajes como documentación. También he conseguido compilar y hacer funcionar Simon en mi Arch Linux (excepto que no reconoce el micrófono de la cámara en el portátil).
Hola Javier Veo que ahun te falta traducir las imágenes de simon/themes/default/l10n en el código fuente de la aplicación. Si te es mucho lio envíamelas y lo haré en breve.
Me gustaría retomar el tema de generar el diccionario en la sombra en castellano, por lo que me gustaría saber si disponéis de una versión actualizada del script o me pongo a trabajar sobre la última que enviastéis.
Saludos, Javier
No he tenido tiempo de mucho pero aquí te envio lo que tengo. En éste correo solicito información mas específica sobre el formato a seguir: <http://lists.kde.org/?l=kde-accessibility&m=135927996901086&w=2> Éstos apuntes vienen a ser lo que he ido encontrando para adaptarme al mejor formato (PLS o Julius), pero por inconveniencias (no soy desarrollador) continuaré con el antiguo (HTK) que trabajo con el script. // Then I used this spelling dictionary to produce the content of the grapheme // elements: iconv -f ISO-8859-15 -t UTF-8 < /usr/share/hunspell/ca_ES.dic > ca_ES.dic ^- (para el catalan solo proceso éste con el script original) iconv -f ISO-8859-15 -t UTF-8 < /usr/share/hunspell/ca_ES.aff > ca_ES.aff // Change in the file ca_ES.aff the line SET ISO8859-1 into SET UTF-8 unmunch ca_ES.dic ca_ES.aff > catalan-wordlist ^- (con lo cual me salto ésta orden) // - Bién. Ahora proceso // From the word list, I created the content of the phoneme elements: espeak -f catalan-wordlist -m -v ca -q -x --phonout="catalan-phoneme" // I combined the grapheme with the phoneme elements: paste catalan-wordlist -o catalan-phoneme > catalan-pls // With this style-sheet, I transformed the eSpeak phonemes into IPA phonemes. // I am not sure whether I transformed everything correctly. E.g., I am unsure // whether the following conversion is correct: // http://spirit.blau.in/simon/files/2009/11/espeak2perfectipa1.xsl // http://en.wikipedia.org/wiki/Help:IPA_for_Catalan // http://en.wikipedia.org/wiki/Wikipedia:IPA_for_Spanish replace($sierra, 'J\^', 'ʎ') replace($sierra, 'J', 'ʝ') // It might be the other way around. // The following phonemes probably will cause problemes when you import the // dictionary into simon: β, ð, θ, ɣ, ɾ, ʎ, ʝ Hasta aquí todo lo que tengo y el script adjunto. Por si no ha quedado claro, ahora uso el diccionario de hunspell que ja es muy completo. Atentamente Toni PD: Estoy ocupado con el KDE 4.11 y no veo mas tiempo en los siguientes meses. Mi ayuda sí que puedo ofrecertela. ;-)
participants (2)
-
Antoni Bella Pérez
-
Javier Viñal