Todas las Noticias en Películas, Avances de Películas y Reseñas.

La gente decía ‘Hey Siri’ antes de que ‘Hey Siri’ fuera una cosa

Estaba leyendo la entrada más reciente del Machine Learning Journal * de Apple y me pareció muy interesante: los usuarios decían “Hey Siri” para interactuar con Siri mucho antes de que la activación por voz “Hey Siri” existiera. Según Apple, los usuarios comenzarían sus interacciones de Siri con “Hey Siri” incluso cuando la única forma de acceder al servicio era mediante el botón de inicio del iPhone.

Hola Siri

De la entrada del Diario de aprendizaje automático:

La frase “Hey Siri” se eligió originalmente para que fuera lo más natural posible; de hecho, era tan natural que incluso antes de que se introdujera esta función, los usuarios invocarían a Siri usando el botón de inicio y sin darse cuenta anteponían sus solicitudes con las palabras “Hey Siri”.

Ese no era el objetivo de esta publicación de Apple, pero habla de nuestro deseo innato de interactuar con los asistentes de voz como si fueran personas reales. “Hey Siri” como una invocación de voz ni siquiera se había introducido, y sin embargo, así es como muchos de nosotros elegimos comenzar nuestras conversaciones con ella.

Reconocimiento de locutor

El verdadero punto de la publicación del blog del equipo de IA (es decir entrada de diario) es hablar sobre el reconocimiento del orador, el campo de la inteligencia artificial que se ocupa de reconocer quién está hablando. Como lo expresó Apple:

El objetivo general del reconocimiento del hablante (SR) es determinar la identidad de una persona que utiliza su voz. Estamos interesados ​​en “quién está hablando”, en contraposición al problema del reconocimiento de voz, que tiene como objetivo determinar “lo que se dijo”.

Recomendado:  LG G6 puede obtener soporte de escaneo facial 3D a través de una actualización de software en junio

Esta es un área donde los competidores de asistentes de voz de Apple (Amazon, Google, por nombrar dos) tienen una ventaja sobre Apple, y esta publicación ofrece información sobre cómo Apple está trabajando en el problema.

La publicación del blog explica cómo Apple identificó las aceptaciones falsas (Siri responde cuando nadie pregunta por ella), los rechazos falsos (Siri no responde cuando se invoca) y las aceptaciones impostoras (Siri responde cuando alguien que no es el propietario del dispositivo dice “Hola Siri”). Todas estas instancias tienen diferentes desafíos y abordar cualquiera de ellos afecta el desempeño en las otras dos áreas.

Techity Gobbledy Blah

Hay una gran cantidad de descripciones de cómo Apple está trabajando en el reconocimiento de oradores, la mayoría de las cuales están dirigidas a académicos en el campo. Sin embargo, la compañía también dijo que está trabajando para mejorar el rendimiento de Hey Siri en entornos ruidosos como habitaciones grandes, en el viento y en vehículos en movimiento.

*Como tu lo haces.