Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales

Jorge Castro; Roberto Vargas-Masís; Danny Alfaro-Rojas

doi:10.18845/tm.v33i5.5075

PDF (English)

Publicado: mar. 27, 2020

DOI: https://doi.org/10.18845/tm.v33i5.5075

Palabras clave:

Aprendizaje profundo, Aprendizaje de instancias múltiples, Bioacústica, Detección de Aves

Jorge Castro

Centro Nacional de Alta Tecnología

https://orcid.org/0000-0003-1553-0461

Roberto Vargas-Masís

Universidad Estatal a Distancia

https://orcid.org/0000-0003-1244-4381

Danny Alfaro-Rojas

Universidad Estatal a Distancia

https://orcid.org/0000-0001-7694-7194

Resumen

Se han propuesto muchos algoritmos de detección de audio para monitorear aves usando sus vocalizaciones. Entre estos algoritmos, las técnicas basadas en el aprendizaje profundo han tomado la delantera en términos de rendimiento a gran escala. Sin embargo, usualmente se requiere de mucho trabajo manual para etiquetar correctamente las vocalizaciones de aves en grandes conjuntos de datos. Una forma de abordar esta limitación es usar el marco de trabajo de aprendizaje de instancias múltiples (MIL), que modela cada grabación como una bolsa de instancias, es decir, una colección de segmentos de audio que se asocia con una etiqueta positiva si un pájaro está presente en la grabación. En este trabajo, modificamos una red profunda MIL propuesta previamente, para predecir la presencia o ausencia de aves en grabaciones de campo de un minuto. Exploramos el comportamiento y el rendimiento de la red cuando utilizamos un número diferente de coeficientes cepstrales de frecuencia de mel (MFCC) para representar las grabaciones. La mejor configuración encontrada logró un valor F de 0.77 sobre el conjunto de datos de validación.

Cómo citar

Castro, J., Vargas-Masís, R., & Alfaro-Rojas, D. (2020). Entendiendo el Desempeño Variable en el Marco de Trabajo MIL Profundo para la Detección Acústica de Aves Tropicales. Revista Tecnología En Marcha, 33(5), Pág. 49–54. https://doi.org/10.18845/tm.v33i5.5075

Número

2020: Vol. 33 especial. Contribuciones a la Conferencia 6th Latin America High Performance Computing Conference (CARLA)

Sección

Artículo científico

Los autores conservan los derechos de autor y ceden a la revista el derecho de la primera publicación y pueda editarlo, reproducirlo, distribuirlo, exhibirlo y comunicarlo en el país y en el extranjero mediante medios impresos y electrónicos. Asimismo, asumen el compromiso sobre cualquier litigio o reclamación relacionada con derechos de propiedad intelectual, exonerando de responsabilidad a la Editorial Tecnológica de Costa Rica. Además, se establece que los autores pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.

Barra lateral del artículo

Contenido principal del artículo

Resumen

Detalles del artículo