[General] Localización del reconocimiento de voz con Simon

Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz. Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano. Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías. ¿Quién se anima? :) Saludos!! Aleix [1] http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde [2] http://clic.ub.edu/corpus/ancora-descarregues

Hola. Yo podría estar interesado, hace un año y medio estuve desarrollando temas de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como solución para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo esa espina clavada de no poder adaptar una solución de código libre para nuestro proyecto. Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de bastante apoyo para empezar. Saludos.
Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1] http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde [2] http://clic.ub.edu/corpus/ancora-descarregues _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general

2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>:
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando temas de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como solución para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo esa espina clavada de no poder adaptar una solución de código libre para nuestro proyecto.
Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de bastante apoyo para empezar.
Saludos.
Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1] http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde [2] http://clic.ub.edu/corpus/ancora-descarregues _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Hola Miguel! Bueno, ya sabes más que yo ;). Quizá podrías echar un ojo al enlace de la UB y mirar lo que haría falta para tirar esto adelante? Aleix

Buenas, Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto con Nepomuk. Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad como backend para tecnologías de tipo Siri de Apple y, Simon sería un frontend fastástico. Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos bien :), pero si podría integrarme como tester en un posible equipo. 2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando temas de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como solución para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo esa espina clavada de no poder adaptar una solución de código libre para nuestro proyecto.
Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de bastante apoyo para empezar.
Saludos.
Hola,
Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1] http://dot.kde.org/2009/08/22/**simon-speech-activated-user-** interface-kde<http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde> [2] http://clic.ub.edu/corpus/**ancora-descarregues<http://clic.ub.edu/corpus/ancora-descarregues> ______________________________**_________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/**listinfo/general<http://kde-espana.es/mailman/listinfo/general>
______________________________**_________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/**listinfo/general<http://kde-espana.es/mailman/listinfo/general>
-- Best wishes, Ignacio

2012/8/10 Ignacio Serantes <kde@aynoa.net>:
Buenas,
Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto con Nepomuk.
Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad como backend para tecnologías de tipo Siri de Apple y, Simon sería un frontend fastástico.
Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos bien :), pero si podría integrarme como tester en un posible equipo.
2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando temas de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como solución para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo esa espina clavada de no poder adaptar una solución de código libre para nuestro proyecto.
Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de bastante apoyo para empezar.
Saludos.
Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1] http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde [2] http://clic.ub.edu/corpus/ancora-descarregues _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
-- Best wishes, Ignacio
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Uyuy, no te lies Ignacio. Este thread se trata de poder adaptar un corpus (que entiendo que es algo tipo los fonemas de un idioma) en castellano y catalan a Simon. No creo que se tenga que tocar C, de hecho no creo que se tenga que programar nada, a no ser que se tenga que automatizar el proceso... Aleix

Ah, había leído el mensaje rápido y por encima y lo contesté más rápido XD. De todas formas lo de probar que lo que se haga funciona con la variante hispano-galaica si puedo hacerlo ;). 2012/8/10 Aleix Pol <aleixpol@kde.org>
2012/8/10 Ignacio Serantes <kde@aynoa.net>:
Buenas,
Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto con Nepomuk.
Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad como backend para tecnologías de tipo Siri de Apple y, Simon sería un frontend fastástico.
Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos bien :), pero si podría integrarme como tester en un posible equipo.
2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando
temas
de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como solución para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo esa espina clavada de no poder adaptar una solución de código libre para nuestro proyecto.
Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de bastante apoyo para empezar.
Saludos.
Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1]
http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde
[2] http://clic.ub.edu/corpus/ancora-descarregues _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
-- Best wishes, Ignacio
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Uyuy, no te lies Ignacio.
Este thread se trata de poder adaptar un corpus (que entiendo que es algo tipo los fonemas de un idioma) en castellano y catalan a Simon.
No creo que se tenga que tocar C, de hecho no creo que se tenga que programar nada, a no ser que se tenga que automatizar el proceso...
Aleix _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
-- Best wishes, Ignacio

Hola Si yo también creo que no hay mucho trabajo de programación, y menos en C. En todo caso algún que otro script de sistema para automatizar el proceso de ajuste y uso del corpus. Realmente sólo con unos pocos conocimientos del tema, creo que la parte más dura ya está hecha que es la de construir un modelo acústico para el idioma en particular, despues es sólo decirle a Simon/Julius que lo utilice para hacer el proceso de reconocimiento. Empezando por un vocabulario limitada e ir ampliando hasta permitir habla natural. Es una pena puesto que cuando estaba haciendo el reconocimiento de voz para el proyecto, nos hubiera venido de perlas este corpus para poder implementarlo con código libre. Saludos y ayudaré en lo pueda. El 10 de agosto de 2012 13:19, Ignacio Serantes <kde@aynoa.net> escribió:
Ah, había leído el mensaje rápido y por encima y lo contesté más rápido XD.
De todas formas lo de probar que lo que se haga funciona con la variante hispano-galaica si puedo hacerlo ;).
2012/8/10 Aleix Pol <aleixpol@kde.org>
2012/8/10 Ignacio Serantes <kde@aynoa.net>:
Buenas,
Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto con Nepomuk.
Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad como backend para tecnologías de tipo Siri de Apple y, Simon sería un frontend fastástico.
Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos bien :), pero si podría integrarme como tester en un posible equipo.
2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando
temas
de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como solución para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo esa espina clavada de no poder adaptar una solución de código libre para nuestro proyecto.
Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de bastante apoyo para empezar.
Saludos.
Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1]
http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde
[2] http://clic.ub.edu/corpus/ancora-descarregues _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
-- Best wishes, Ignacio
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Uyuy, no te lies Ignacio.
Este thread se trata de poder adaptar un corpus (que entiendo que es algo tipo los fonemas de un idioma) en castellano y catalan a Simon.
No creo que se tenga que tocar C, de hecho no creo que se tenga que programar nada, a no ser que se tenga que automatizar el proceso...
Aleix _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
-- Best wishes, Ignacio
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general

Hola Y ya estoy en el hilo... ;-) Todavía no he accedido a dicho corpus y se debería aclarar el tema de las licencias pensando en subirlo en el formato adecuado a VoxForge [1] (sitio dónde ya hay algo, nada de corpus). ¿Alguna corrección? [1] http://docs.kde.org/development/en/extragear- accessibility/simon/vocabulary.html#import_dictionary Toni El Dilluns, 13 d'agost de 2012, a les 12:30:51, Miguel Angel va escriure:
Hola
Si yo también creo que no hay mucho trabajo de programación, y menos en C. En todo caso algún que otro script de sistema para automatizar el proceso de ajuste y uso del corpus.
Realmente sólo con unos pocos conocimientos del tema, creo que la parte más dura ya está hecha que es la de construir un modelo acústico para el idioma en particular, despues es sólo decirle a Simon/Julius que lo utilice para hacer el proceso de reconocimiento. Empezando por un vocabulario limitada e ir ampliando hasta permitir habla natural.
Es una pena puesto que cuando estaba haciendo el reconocimiento de voz para el proyecto, nos hubiera venido de perlas este corpus para poder implementarlo con código libre.
Saludos y ayudaré en lo pueda.
El 10 de agosto de 2012 13:19, Ignacio Serantes <kde@aynoa.net> escribió:
Ah, había leído el mensaje rápido y por encima y lo contesté más rápido XD.
De todas formas lo de probar que lo que se haga funciona con la variante hispano-galaica si puedo hacerlo ;).
2012/8/10 Aleix Pol <aleixpol@kde.org>
2012/8/10 Ignacio Serantes <kde@aynoa.net>:
Buenas,
Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto con Nepomuk.
Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad
como
backend para tecnologías de tipo Siri de Apple y, Simon sería un
frontend
fastástico.
Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos
bien
:), pero si podría integrarme como tester en un posible equipo.
2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando
temas
de reconocimiento de voz para nuestro proyecto y por temas comerciales tuvimos que descatar simon/julius. Al final adoptamos verbio como
solución
para el prototipo y por motivos de agenda del proyecto no se ha podido migrar e incruir en el paquete final el reconocimiento de voz. Tengo
esa
espina clavada de no poder adaptar una solución de código libre para
nuestro
proyecto.
Aunque como digo hace más de un año, tampoco es que tenga conocimientos específicos en esa materia o de simon. Por lo que necesitaré de
bastante
apoyo para empezar.
Saludos.
Hola, Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1] para el reconocimiento de voz.
Por lo que tengo entendido, de momento sólo se puede utilizar en inglés, por lo que Antoni Bella del equipo de traducción al catalán ha estado investigando el tema y ha encontrado este "corpus" [2] que se desarrolló en la Universitat de Barcelona, tanto en catalán como en castellano.
Mando este correo porque creo que es una tecnología importante y necesitamos gente interesada en la adaptación de este corpus a nuestras tecnologías.
¿Quién se anima? :)
Saludos!! Aleix
[1]
http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde
[2] http://clic.ub.edu/corpus/ancora-descarregues _______________________________________________ -- Best wishes, Ignacio
Uyuy, no te lies Ignacio.
Este thread se trata de poder adaptar un corpus (que entiendo que es algo tipo los fonemas de un idioma) en castellano y catalan a Simon.
No creo que se tenga que tocar C, de hecho no creo que se tenga que programar nada, a no ser que se tenga que automatizar el proceso...
Aleix
-- Best wishes, Ignacio

2012/8/13 Antoni Bella Pérez <antonibella5@orange.es>:
Hola
Y ya estoy en el hilo... ;-)
Todavía no he accedido a dicho corpus y se debería aclarar el tema de las licencias pensando en subirlo en el formato adecuado a VoxForge [1] (sitio dónde ya hay algo, nada de corpus). ¿Alguna corrección?
[1] http://docs.kde.org/development/en/extragear-accessibility/simon/vocabulary....
Toni
El Dilluns, 13 d'agost de 2012, a les 12:30:51, Miguel Angel va escriure:
Hola
Si yo también creo que no hay mucho trabajo de programación, y menos en C.
En todo caso algún que otro script de sistema para automatizar el proceso
de ajuste y uso del corpus.
Realmente sólo con unos pocos conocimientos del tema, creo que la parte más
dura ya está hecha que es la de construir un modelo acústico para el idioma
en particular, despues es sólo decirle a Simon/Julius que lo utilice para
hacer el proceso de reconocimiento. Empezando por un vocabulario limitada e
ir ampliando hasta permitir habla natural.
Es una pena puesto que cuando estaba haciendo el reconocimiento de voz para
el proyecto, nos hubiera venido de perlas este corpus para poder
implementarlo con código libre.
Saludos y ayudaré en lo pueda.
El 10 de agosto de 2012 13:19, Ignacio Serantes <kde@aynoa.net> escribió:
Ah, había leído el mensaje rápido y por encima y lo contesté más rápido
XD.
De todas formas lo de probar que lo que se haga funciona con la variante
hispano-galaica si puedo hacerlo ;).
2012/8/10 Aleix Pol <aleixpol@kde.org>
2012/8/10 Ignacio Serantes <kde@aynoa.net>:
Buenas,
Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto
con
Nepomuk.
Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad
como
backend para tecnologías de tipo Siri de Apple y, Simon sería un
frontend
fastástico.
Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos
bien
:), pero si podría integrarme como tester en un posible equipo.
2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
Hola.
Yo podría estar interesado, hace un año y medio estuve desarrollando
temas
de reconocimiento de voz para nuestro proyecto y por temas comerciales
tuvimos que descatar simon/julius. Al final adoptamos verbio como
solución
para el prototipo y por motivos de agenda del proyecto no se ha podido
migrar e incruir en el paquete final el reconocimiento de voz. Tengo
esa
espina clavada de no poder adaptar una solución de código libre para
nuestro
proyecto.
Aunque como digo hace más de un año, tampoco es que tenga
conocimientos
específicos en esa materia o de simon. Por lo que necesitaré de
bastante
apoyo para empezar.
Saludos.
> Hola,
> Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1]
> para
> el reconocimiento de voz.
>
> Por lo que tengo entendido, de momento sólo se puede utilizar en
> inglés, por lo que Antoni Bella del equipo de traducción al catalán
> ha
> estado investigando el tema y ha encontrado este "corpus" [2] que > se
> desarrolló en la Universitat de Barcelona, tanto en catalán como en
> castellano.
>
> Mando este correo porque creo que es una tecnología importante y
> necesitamos gente interesada en la adaptación de este corpus a
> nuestras tecnologías.
>
> ¿Quién se anima? :)
>
> Saludos!!
> Aleix
>
> [1]
http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde
> _______________________________________________
--
Best wishes,
Ignacio
Uyuy, no te lies Ignacio.
Este thread se trata de poder adaptar un corpus (que entiendo que es
algo tipo los fonemas de un idioma) en castellano y catalan a Simon.
No creo que se tenga que tocar C, de hecho no creo que se tenga que
programar nada, a no ser que se tenga que automatizar el proceso...
Aleix
--
Best wishes,
Ignacio
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Bueno, pues parece ser que hay que estar registrado para acceder al contenido (como dice la web) y tienen una persona que se dedica a aceptar los registros que está de vacaciones. Pronto nos deberían aceptar el registro y poder acceder a los ficheros. Aun asi, no me han dicho cuando estará disponible. Aparte, he quedado con ellos para discutir sobre como podemos trabajar juntos, ya os diré qué tal. Saludos! Aleix

2012/8/22 Aleix Pol <aleixpol@kde.org>:
2012/8/13 Antoni Bella Pérez <antonibella5@orange.es>:
Hola
Y ya estoy en el hilo... ;-)
Todavía no he accedido a dicho corpus y se debería aclarar el tema de las licencias pensando en subirlo en el formato adecuado a VoxForge [1] (sitio dónde ya hay algo, nada de corpus). ¿Alguna corrección?
[1] http://docs.kde.org/development/en/extragear-accessibility/simon/vocabulary....
Toni
El Dilluns, 13 d'agost de 2012, a les 12:30:51, Miguel Angel va escriure:
Hola
Si yo también creo que no hay mucho trabajo de programación, y menos en C.
En todo caso algún que otro script de sistema para automatizar el proceso
de ajuste y uso del corpus.
Realmente sólo con unos pocos conocimientos del tema, creo que la parte más
dura ya está hecha que es la de construir un modelo acústico para el idioma
en particular, despues es sólo decirle a Simon/Julius que lo utilice para
hacer el proceso de reconocimiento. Empezando por un vocabulario limitada e
ir ampliando hasta permitir habla natural.
Es una pena puesto que cuando estaba haciendo el reconocimiento de voz para
el proyecto, nos hubiera venido de perlas este corpus para poder
implementarlo con código libre.
Saludos y ayudaré en lo pueda.
El 10 de agosto de 2012 13:19, Ignacio Serantes <kde@aynoa.net> escribió:
Ah, había leído el mensaje rápido y por encima y lo contesté más rápido
XD.
De todas formas lo de probar que lo que se haga funciona con la variante
hispano-galaica si puedo hacerlo ;).
2012/8/10 Aleix Pol <aleixpol@kde.org>
2012/8/10 Ignacio Serantes <kde@aynoa.net>:
Buenas,
Yo hace tiempo que le eché el ojo por sus posibilidades de uso junto
con
Nepomuk.
Uno de los puntos de Nepomuk que se ha explotado poco es su posibilidad
como
backend para tecnologías de tipo Siri de Apple y, Simon sería un
frontend
fastástico.
Dudo que pueda colaborar como desarrollador, el C y yo no nos llevamos
bien
:), pero si podría integrarme como tester en un posible equipo.
2012/8/10 Miguel en GMAIL <miguel.wasabi@gmail.com>
> Hola.
>
> Yo podría estar interesado, hace un año y medio estuve desarrollando
temas
> de reconocimiento de voz para nuestro proyecto y por temas > comerciales
> tuvimos que descatar simon/julius. Al final adoptamos verbio como
solución
> para el prototipo y por motivos de agenda del proyecto no se ha > podido
> migrar e incruir en el paquete final el reconocimiento de voz. Tengo
esa
> espina clavada de no poder adaptar una solución de código libre para
nuestro
> proyecto.
>
> Aunque como digo hace más de un año, tampoco es que tenga
> conocimientos
> específicos en esa materia o de simon. Por lo que necesitaré de
bastante
> apoyo para empezar.
>
> Saludos.
>
>> Hola,
>> Como algunos sabréis, en KDE usamos un proyecto llamado Simon [1]
>> para
>> el reconocimiento de voz.
>>
>> Por lo que tengo entendido, de momento sólo se puede utilizar en
>> inglés, por lo que Antoni Bella del equipo de traducción al catalán
>> ha
>> estado investigando el tema y ha encontrado este "corpus" [2] que >> se
>> desarrolló en la Universitat de Barcelona, tanto en catalán como en
>> castellano.
>>
>> Mando este correo porque creo que es una tecnología importante y
>> necesitamos gente interesada en la adaptación de este corpus a
>> nuestras tecnologías.
>>
>> ¿Quién se anima? :)
>>
>> Saludos!!
>> Aleix
>>
>> [1]
http://dot.kde.org/2009/08/22/simon-speech-activated-user-interface-kde
>> _______________________________________________
--
Best wishes,
Ignacio
Uyuy, no te lies Ignacio.
Este thread se trata de poder adaptar un corpus (que entiendo que es
algo tipo los fonemas de un idioma) en castellano y catalan a Simon.
No creo que se tenga que tocar C, de hecho no creo que se tenga que
programar nada, a no ser que se tenga que automatizar el proceso...
Aleix
--
Best wishes,
Ignacio
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Bueno, pues parece ser que hay que estar registrado para acceder al contenido (como dice la web) y tienen una persona que se dedica a aceptar los registros que está de vacaciones. Pronto nos deberían aceptar el registro y poder acceder a los ficheros. Aun asi, no me han dicho cuando estará disponible.
Aparte, he quedado con ellos para discutir sobre como podemos trabajar juntos, ya os diré qué tal.
Saludos! Aleix
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas. Saludos! Aleix

El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure:
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas.
¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar. Toni

Bueno, he quedado con ellos para el miércoles, porque me decían que querían controlar quien usa el corpus. Yo creo que podéis empezar a usarlo, aunque si no lo véis claro y os da miedo perder el tiempo, esperad a entonces y os puedo decir como está el tema de primera mano. Aleix 2012/9/1 Antoni Bella Pérez <antonibella5@orange.es>:
El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure:
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas.
¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar.
Toni _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general

El Dissabte, 1 de setembre de 2012, a les 19:35:42, Aleix Pol va escriure:
Bueno, he quedado con ellos para el miércoles, porque me decían que querían controlar quien usa el corpus.
Yo creo que podéis empezar a usarlo, aunque si no lo véis claro y os da miedo perder el tiempo, esperad a entonces y os puedo decir como está el tema de primera mano.
Aleix
2012/9/1 Antoni Bella Pérez <antonibella5@orange.es>:
El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure:
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas.
¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar.
Toni
Sin visitarlo ya se que es útil pues se trataría de crear un script en perl para darle el formato adecuado y después trabajar una a una las entradas, previo paso de algún script que nos de una pronunciación escrita (punto a aclarar en la lista de devel). _Mucho trabajo._ ¿Controlar el uso? Mi intención seria distribuir bajo una licencia compatible con Open Source. Quizá encontraremos un punto conveniente que prevenga el uso inadecuado que están protegiendo. ¿Cual? Seguro que su experiencia sera reveladora. Toni

2012/9/2 Antoni Bella Pérez <antonibella5@orange.es>:
El Dissabte, 1 de setembre de 2012, a les 19:35:42, Aleix Pol va escriure:
Bueno, he quedado con ellos para el miércoles, porque me decían que querían controlar quien usa el corpus.
Yo creo que podéis empezar a usarlo, aunque si no lo véis claro y os da miedo perder el tiempo, esperad a entonces y os puedo decir como está el tema de primera mano.
Aleix
2012/9/1 Antoni Bella Pérez <antonibella5@orange.es>:
El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure:
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas.
¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar.
Toni
Sin visitarlo ya se que es útil pues se trataría de crear un script en perl para darle el formato adecuado y después trabajar una a una las entradas, previo paso de algún script que nos de una pronunciación escrita (punto a aclarar en la lista de devel). _Mucho trabajo._ Entiendo, sería interesane si me puedieras ponerme al día de lo que sabes que tocaría hacer con esto y para qué nos sirve lo que nos proporcionan, asi podremos llegar más lejos durante la reunión.
¿Controlar el uso?
Mi intención seria distribuir bajo una licencia compatible con Open Source. Quizá encontraremos un punto conveniente que prevenga el uso inadecuado que están protegiendo. ¿Cual?
Seguro que su experiencia sera reveladora.
Bueno, mi idea es plantearles como trabajamos en KDE y como nos gustaría poderlo distribuir, a partir de ahi supongo que tocará encontrar un punto medio, asumiendo que les interesa que se adopte su trabajo en un proyecto como KDE.
Toni _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Aleix

El Diumenge, 2 de setembre de 2012, a les 22:23:26, Aleix Pol va escriure:
2012/9/2 Antoni Bella Pérez <antonibella5@orange.es>:
El Dissabte, 1 de setembre de 2012, a les 19:35:42, Aleix Pol va escriure:
Bueno, he quedado con ellos para el miércoles, porque me decían que querían controlar quien usa el corpus.
Yo creo que podéis empezar a usarlo, aunque si no lo véis claro y os da miedo perder el tiempo, esperad a entonces y os puedo decir como está el tema de primera mano.
Aleix
2012/9/1 Antoni Bella Pérez <antonibella5@orange.es>:
El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure:
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas.
¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar.
Toni
Sin visitarlo ya se que es útil pues se trataría de crear un script en perl
para darle el formato adecuado y después trabajar una a una las entradas, previo paso de algún script que nos de una pronunciación escrita (punto a aclarar en la lista de devel). _Mucho trabajo._
Entiendo, sería interesane si me puedieras ponerme al día de lo que sabes que tocaría hacer con esto y para qué nos sirve lo que nos proporcionan, asi podremos llegar más lejos durante la reunión.
Para ello es mejor documentarse en la documentación de Simon: Diccionarios (diccionario sombra) http://docs.kde.org/development/en/extragear- accessibility/simon/vocabulary.html Extracto de la doc: (He importado el léxico HTK de voxforge disponible en inglés desde voxforge como un diccionario sombra). Mi intención seria poderlo subir a voxforge (de fácil distribución) en el formato adecuado. Aquí la versión en ingles: http://voxforge.org/home/downloads
¿Controlar el uso?
Mi intención seria distribuir bajo una licencia compatible con Open Source.
Quizá encontraremos un punto conveniente que prevenga el uso inadecuado que están protegiendo. ¿Cual?
Seguro que su experiencia sera reveladora.
Bueno, mi idea es plantearles como trabajamos en KDE y como nos gustaría poderlo distribuir, a partir de ahi supongo que tocará encontrar un punto medio, asumiendo que les interesa que se adopte su trabajo en un proyecto como KDE.
Ésta seria la política de voxforge http://www.voxforge.org/home/about/legal Sino se aviene podríamos utilizar kde-apps.org subiendo las fuentes a nuestro propio repositorio SVN de traducción (se puede hacer comentándolo en la lista devel de Simon y pidiendo permiso en el KDE - semejante fichero no se puede distribuir en el binario de traducciones y seguramente se podría descargar con Get Hot New Stuff). http://userbase.kde.org/Glossary#Get_Hot_New_Stuff Toni

2012/9/3 Antoni Bella Pérez <antonibella5@orange.es>:
El Diumenge, 2 de setembre de 2012, a les 22:23:26, Aleix Pol va escriure:
2012/9/2 Antoni Bella Pérez <antonibella5@orange.es>:
El Dissabte, 1 de setembre de 2012, a les 19:35:42, Aleix Pol va escriure:
Bueno, he quedado con ellos para el miércoles, porque me decían que querían controlar quien usa el corpus.
Yo creo que podéis empezar a usarlo, aunque si no lo véis claro y os da miedo perder el tiempo, esperad a entonces y os puedo decir como está el tema de primera mano.
Aleix
2012/9/1 Antoni Bella Pérez <antonibella5@orange.es>:
El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure:
Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no es asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo acceder a las descargas.
¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar.
Toni
Sin visitarlo ya se que es útil pues se trataría de crear un script en perl
para darle el formato adecuado y después trabajar una a una las entradas, previo paso de algún script que nos de una pronunciación escrita (punto a aclarar en la lista de devel). _Mucho trabajo._
Entiendo, sería interesane si me puedieras ponerme al día de lo que sabes que tocaría hacer con esto y para qué nos sirve lo que nos proporcionan, asi podremos llegar más lejos durante la reunión.
Para ello es mejor documentarse en la documentación de Simon:
Diccionarios (diccionario sombra) http://docs.kde.org/development/en/extragear- accessibility/simon/vocabulary.html
Extracto de la doc: (He importado el léxico HTK de voxforge disponible en inglés desde voxforge como un diccionario sombra).
Mi intención seria poderlo subir a voxforge (de fácil distribución) en el formato adecuado. Aquí la versión en ingles: http://voxforge.org/home/downloads
¿Controlar el uso?
Mi intención seria distribuir bajo una licencia compatible con Open Source.
Quizá encontraremos un punto conveniente que prevenga el uso inadecuado que están protegiendo. ¿Cual?
Seguro que su experiencia sera reveladora.
Bueno, mi idea es plantearles como trabajamos en KDE y como nos gustaría poderlo distribuir, a partir de ahi supongo que tocará encontrar un punto medio, asumiendo que les interesa que se adopte su trabajo en un proyecto como KDE.
Ésta seria la política de voxforge http://www.voxforge.org/home/about/legal
Sino se aviene podríamos utilizar kde-apps.org subiendo las fuentes a nuestro propio repositorio SVN de traducción (se puede hacer comentándolo en la lista devel de Simon y pidiendo permiso en el KDE - semejante fichero no se puede distribuir en el binario de traducciones y seguramente se podría descargar con Get Hot New Stuff). http://userbase.kde.org/Glossary#Get_Hot_New_Stuff
Toni _______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Bueno, vamos a ver. Primero de todo, me han comentado que no tienen problema con la utilización del corpus, si bien me han comentado que preferirían que nos hicieramos responsables de como se distribuyen los datos generados, por lo que me gustaría a ver si podemos distribuirlo nosotros. En cualquier caso, también me ha estado comentando que el corpus este sólo nos proporcionará un listado de palabras pero que la traducción fonética a texto no está especificada en el corpus este (ni en ninguno de los varios que tienen) y es algo que cabría mirar. También me ha dicho que se pondrá en contacto con nosotros un personaje que está en el mundillo a ver si nos puede echar una mano. No acabo de tener muy claro como quieres trabajar con esto, quizá sería interesante que empezaras un hilo nuevo en esta lista sobre el tema y a ver si podemos encontrar una manera de tirarlo adelante :). Saludos! Aleix

El Dimecres, 5 de setembre de 2012, a les 01:33:28, Aleix Pol va escriure:
2012/9/3 Antoni Bella Pérez <antonibella5@orange.es>:
El Diumenge, 2 de setembre de 2012, a les 22:23:26, Aleix Pol va escriure:
2012/9/2 Antoni Bella Pérez <antonibella5@orange.es>:
El Dissabte, 1 de setembre de 2012, a les 19:35:42, Aleix Pol va escriure:
Bueno, he quedado con ellos para el miércoles, porque me decían que querían controlar quien usa el corpus.
Yo creo que podéis empezar a usarlo, aunque si no lo véis claro y os da miedo perder el tiempo, esperad a entonces y os puedo decir como está el tema de primera mano.
Aleix
2012/9/1 Antoni Bella Pérez <antonibella5@orange.es>:
El Dijous, 30 d'agost de 2012, a les 10:10:54, Aleix Pol va escriure: > Ok, la mujer que se encargaba de dejar registrarse a la gente ya ha > vuelto de vacaciones, asi que supongo que ya tendréis cuenta. Si no > es > asi decidmelo y os paso lo que necesitéis, porque yo sí que puedo > acceder a las descargas. > ¿Sobre cual licencia trabajaríamos? Punto importante antes de trabajar.
Toni
Sin visitarlo ya se que es útil pues se trataría de crear un script en perl
para darle el formato adecuado y después trabajar una a una las entradas, previo paso de algún script que nos de una pronunciación escrita (punto a aclarar en la lista de devel). _Mucho trabajo._
Entiendo, sería interesane si me puedieras ponerme al día de lo que sabes que tocaría hacer con esto y para qué nos sirve lo que nos proporcionan, asi podremos llegar más lejos durante la reunión.
Para ello es mejor documentarse en la documentación de Simon: Diccionarios (diccionario sombra) http://docs.kde.org/development/en/extragear- accessibility/simon/vocabulary.html
Extracto de la doc: (He importado el léxico HTK de voxforge disponible en inglés desde voxforge como un diccionario sombra).
Mi intención seria poderlo subir a voxforge (de fácil distribución) en el
formato adecuado. Aquí la versión en ingles: http://voxforge.org/home/downloads
¿Controlar el uso?
Mi intención seria distribuir bajo una licencia compatible con Open Source.
Quizá encontraremos un punto conveniente que prevenga el uso inadecuado que están protegiendo. ¿Cual?
Seguro que su experiencia sera reveladora.
Bueno, mi idea es plantearles como trabajamos en KDE y como nos gustaría poderlo distribuir, a partir de ahi supongo que tocará encontrar un punto medio, asumiendo que les interesa que se adopte su trabajo en un proyecto como KDE.
Ésta seria la política de voxforge
http://www.voxforge.org/home/about/legal
Sino se aviene podríamos utilizar kde-apps.org subiendo las fuentes a nuestro> propio repositorio SVN de traducción (se puede hacer comentándolo en la lista devel de Simon y pidiendo permiso en el KDE - semejante fichero no se puede distribuir en el binario de traducciones y seguramente se podría descargar con Get Hot New Stuff). http://userbase.kde.org/Glossary#Get_Hot_New_Stuff
Toni
_______________________________________________ General mailing list General@kde-espana.es http://kde-espana.es/mailman/listinfo/general
Bueno, vamos a ver. Primero de todo, me han comentado que no tienen problema con la utilización del corpus, si bien me han comentado que preferirían que nos hicieramos responsables de como se distribuyen los datos generados, por lo que me gustaría a ver si podemos distribuirlo nosotros.
En cualquier caso, también me ha estado comentando que el corpus este sólo nos proporcionará un listado de palabras pero que la traducción fonética a texto no está especificada en el corpus este (ni en ninguno de los varios que tienen) y es algo que cabría mirar.
También me ha dicho que se pondrá en contacto con nosotros un personaje que está en el mundillo a ver si nos puede echar una mano.
No acabo de tener muy claro como quieres trabajar con esto, quizá sería interesante que empezaras un hilo nuevo en esta lista sobre el tema y a ver si podemos encontrar una manera de tirarlo adelante :).
Saludos! Aleix
Pronto dispondré de un par de días libres, procederé a descargarlo y haber cómo hacerlo (abriré el hilo de trabajo). Cuanto a la licencia es libre y no se controlan las descargas mientras se acepte ésta. Toni
participants (5)
-
Aleix Pol
-
Antoni Bella Pérez
-
Ignacio Serantes
-
Miguel Angel
-
Miguel en GMAIL