Agregando a la pila de funciones que permite a los usuarios de Teams tener una buena llamada de conferencia, Microsoft anunció hoy tres nuevas caracterÃsticas: cancelación de eco, eliminación de reverberación e interrupción.
Todos estos están entrenados en modelos de IA especÃficos para diferenciar de manera inteligente los ruidos y el audio del altavoz, y hacer que las llamadas salgan bien. Aparte de esto, Microsoft también notó algunas funciones lanzadas anteriormente que ayudan con lo mismo.
Nuevas caracterÃsticas en los equipos de Microsoft
Desde COVID-19, Microsoft Teams creció hasta convertirse en una de las aplicaciones de videoconferencia más utilizadas para escuelas, empresas y otras organizaciones. Como ahora tiene una base de usuarios significativa, Microsoft está implementando nuevas caracterÃsticas regularmente para ofrecer excelentes experiencias a los usuarios.
En esta búsqueda, vemos al creador agregando un soporte de cancelación de eco – donde se aborda el sonido perturbador causado por un bucle de sonidos entre los dispositivos de entrada y salida. Con la ayuda de la IA, esta función puede detectar la diferencia entre su voz y los sonidos del hablante y eliminar el eco de su voz.
Además, hay De-reverberación – una función que se ocupa de los sonidos acústicos que provienen de su habitación, especialmente cuando está hablando a distancia. Esto hace que su sonido parezca superficial y distorsionado. Por lo tanto, la función de eliminación de reverberación usará ML para diferenciar los sonidos de la habitación y los suyos y permitirá que solo sus sonidos pasen por el micrófono del dispositivo.
Por fin, hay interrumpibilidad – soporte que aborda el ruido superpuesto causado por dos personas hablando simultáneamente. Aunque esto puede ser solucionado por los oradores que usan auriculares, la mayorÃa de las personas no lo hacen. Por lo tanto, la función de interrumpibilidad se activa para identificar las llamadas bidireccionales y dejarlas claras para ambas.
Para ello, la tecnologÃa se entrenó en 30.000 horas de muestras de voz para detectar y filtrar las voces no deseadas, de modo que el audio de todos los altavoces se escuche con claridad, incluso si se superponen.