
Hola lista y a Miguel He estado trabajando en el procesamiento del corpus AnCora para crear un diccionario sombra y facilitar con su uso el reconocimiento de la voz con Simon. <http://userbase.kde.org/Applications/Accessibility/ca#simon> El corpus AnCora es GPL pero nos requieren ver de qué se trata el trabajo final. Una vez acabemos tengo pensado añadir un corpus creado a partir de los catálogos de traducción, pues serán las palabras de uso común. <http://clic.ub.edu/corpus/ancora-descarregues> <http://l10n.kde.org/stats/doc/trunk-kde4/toplist/> Adjunto el script de trabajo para que comentéis mejoras. Que las habrá. La traducción para el fonema todavía no funciona como espero que lo haga. Sólo trabaja sobre un subdirectorio para reducir el procesamiento durante las pruebas. Un poco de la salida: titllar,t i t ll a r tranquil·la,t r a n q u i l· l a unitària,u n i tà r i a Vilafranca,v i l a f r a n c a Mañana escribiré a la lista de correo kde-accessibility@kde.org para aclarar cual seria el mejor formato y con quién contactar para subirlo a FTP. <https://mail.kde.org/mailman/listinfo/kde-accessibility> Soy currante no informático y entiendo mejor el bash. Si alguien puede echar una mano con el perl se lo agradeceremos enormemente. Atentamente Toni