Un primer estudio sobre clasificación por edades de hablantes de costarricense basado en análisis de vocales acústicas

Contenido principal del artículo

Victor Yeom-Song
Marvin Coto-Jiménez

Resumen

Según varios estudios, el habla de los niños es más dinámica e inconsistente en comparación con el habla de un adulto. Este aspecto se puede considerar en la tarea de reconocer la edad de la persona que habla y de gran importancia en muchas aplicaciones, como la interacción humano-computadora, la seguridad en Internet y los asistentes educativos. Esas aplicaciones tienen una dependencia del lenguaje y el acento, debido a los diferentes sonidos y estilos que caracterizan a los hablantes. Este trabajo presenta los resultados iniciales sobre la identificación del habla infantil costarricense, en una base de datos creada para tal fin, que consta de palabras pronunciadas por adultos y niños de distintas edades. Para este primer estudio, elegimos la vocal más común del idioma y extraemos un conjunto de características acústicas comunes para determinar su aplicabilidad para distinguir entre adultos y niños de un rango de edad. Los resultados obtenidos muestran resultados prometedores en la clasificación utilizando una sola vocal, que mejora según el número de vocales utilizadas para extraer las características acústicas. Esto significa que un sistema automático podría mejorar su capacidad para identificar la edad a medida que se recibe y transcribe más información del habla, pero no puede ser muy preciso en interacciones breves.

Detalles del artículo

Cómo citar
Yeom-Song, V. ., & Coto-Jiménez, M. (2022). Un primer estudio sobre clasificación por edades de hablantes de costarricense basado en análisis de vocales acústicas . Revista Tecnología En Marcha, 35(8), Pág. 145–152. https://doi.org/10.18845/tm.v35i8.6466
Sección
Artículo científico

Citas

Safavi, Saeid, Martin Russell, and Peter Janˇcoviˇc. “Automatic speaker, age-group and gender identification from children’s speech.” Computer Speech & Language 50 (2018): 141-156.

Schuller, Bjorn W., et al. “Covid-19 and computer audition: An overview on what speech & sound analysis could contribute in the SARS-CoV-2 Corona crisis.” arXiv preprint arXiv:2003.11117 (2020).

Imran, Ali, et al. “AI4COVID-19: AI enabled preliminary diagnosis for COVID-19 from cough samples via an app.” Informatics in Medicine Unlocked (2020)

Safavi, Saeid, et al. “Identification of gender from children’s speech by computers and humans.” INTERSPEECH. 2013.

Yildirim, Serdar, et al. “Acoustic analysis of preschool children’s speech.” Proc.15th ICPhS. 2003.

Lyakso, Elena E., Olga V. Frolova, and Aleks S. Grigoriev. “The acoustic char- acteristics of Russian vowels in children of 6 and 7 years of age.” Tenth Annual Conference of the International Speech Communication Association. 2009.

Gerosa, Matteo, et al. “Analyzing children’s speech: An acoustic study of consonants and consonant-vowel transition.” 2006 IEEE International Conference on Acoustics Speech and Signal Processing Proceedings. Vol. 1. IEEE, 2006.

Lee, Sungbok, Alexandros Potamianos, and Shrikanth Narayanan. “Analysis of children’s speech: Duration, pitch and formants.” Fifth European Conference on Speech Communication and Technology. 1997.

Ting, Hua Nong, and Jasmy Yunus. “Speaker-independent Malay vowel recognition of children using multilayer perceptron.” 2004 IEEE Region 10 Conference TENCON 2004. IEEE, 2004.

Katz, William F., and Sneha Bharadwaj. “Coarticulation in fricative-vowel syllables produced by children and adults: A preliminary report.” Clinical linguistics & phonetics 15.1-2 (2001): 139-143.

Gerosa, Matteo, Diego Giuliani, and Fabio Brugnara. “Acoustic variability and automatic recognition of children’s speech.” Speech Communication 49.10-11 (2007): 847-860.

Zeng, Yumin, and Yi Zhang. “Robust children and adults speech classification.”Fourth International Conference on Fuzzy Systems and Knowledge Discovery (FSKD 2007). Vol. 4. IEEE, 2007.

Massarente, Enrico. “Classificazione automatica della voce in ambito logopedico: training e testing di un algoritmo per discriminare la voce adulta da quella dei bambini.” (2015).

Martins, Rui, et al. “Detection of Children’s Voices.” I Iberian SLTech 2009: 77.

Goldman, Jean-Philippe. “EasyAlign: an automatic phonetic alignment tool un- der Praat.” Interspeech’11, 12th Annual Conference of the International Speech Communication Association. 2011.

Guirao, Miguelina, and Mar´ıa Garc´ıa Jurado. “Frequency of occurence of phonemes in American Spanish.” Revue quebecoise de linguistique 19.2 (1990): 135-149.

Boersma, P. Weenink, D. “Praat: doing phonetics by computer” [Computer pro- gram]. Version 6.0.37, retrieved May 2020 from http://www.praat.org/.