Los cientÃficos han desarrollado un nuevo método de alta velocidad que puede detectar, clasificar y localizar múltiples objetos sin la necesidad de imágenes o reconstrucción compleja de escenas. Pero, ¿cómo es esto posible?
Este enfoque innovador es ideal para detectar peligros mientras se conduce y se espera que resuelva los problemas existentes de carga pesada de comunicación, alta sobrecarga informática y muchos más.
Técnica SPOD
El equipo, dirigido por Liheng Bian del Instituto de TecnologÃa de Beijing, desarrolló una técnica llamada detección de objetos de un solo pÃxel sin imágenes (SPOD).
La técnica SPOD utiliza un detector de un solo pÃxel que permite la detección de múltiples objetos directamente a partir de una pequeña cantidad de mediciones 2D.
Utilizando un patrón de luz estructurado pequeño pero optimizado, el equipo escaneó rápidamente toda la escena para recopilar mediciones 2D, que luego fueron procesadas por un codificador basado en transformador, un tipo de modelo de aprendizaje profundo que extraÃa caracterÃsticas de alta dimensión de la escena.
Luego, estas caracterÃsticas se enviaron a un decodificador basado en una red de atención de múltiples escalas, que proporcionó simultáneamente información sobre la clase, ubicación y tamaño de todos los objetivos en la escena.
“En comparación con el patrón de tamaño completo utilizado por otros métodos de detección de un solo pÃxel, el patrón pequeño y optimizado produce un mejor rendimiento de detección sin imágenes”, dijo Lintao Peng, miembro del grupo, en un comunicado de prensa.
“Además, la red de atención multiescala en el decodificador SPOD refuerza la atención de la red al área objetivo en la escena. Esto permite una extracción más eficiente de las caracterÃsticas de la escena, lo que permite un rendimiento de detección de objetos de última generación”.
El método SPOD puede realizar las tres tareas de percepción visual de clasificación, reconocimiento de un solo objeto y seguimiento simultáneamente, al tiempo que logra una precisión de detección de objetos ligeramente superior al 80%.
“Para la conducción autónoma, SPOD podrÃa usarse con lidar para ayudar a mejorar la velocidad de reconstrucción de la escena y la precisión de la detección de objetos. Creemos que tiene una tasa de detección y precisión suficientemente altas para la conducción autónoma y al mismo tiempo reduce el ancho de banda de transmisión y los requisitos de recursos informáticos necesarios para los objetos. detección”, dijo Bian.
Prueba de concepto
Los investigadores crearon una configuración de prueba de concepto para demostrar SPOD, donde utilizaron imágenes elegidas al azar del conjunto de datos de prueba Pascal Voc 2012 y las imprimieron en una pelÃcula para usarlas como escenas de destino. Con una tasa de muestreo del 5 %, SPOD completó la modulación de la luz espacial y la detección de objetos sin imágenes por escena en un tiempo promedio de solo 0,016 segundos.
Sin embargo, la capacidad de detección de objetos de SPOD aún es limitada ya que solo puede detectar las 80 categorÃas disponibles en el conjunto de datos de detección de objetos existente utilizado para entrenar el modelo, como afirmó Peng.
Pero el modelo previamente entrenado se puede ajustar para lograr la detección de múltiples objetos sin imágenes de nuevas clases de objetivos, como la detección de peatones, vehÃculos o embarcaciones, para cumplir con requisitos especÃficos.
Los investigadores pretenden ampliar la tecnologÃa de percepción sin imágenes a varios detectores y sistemas de adquisición computacional para lograr una tecnologÃa de detección sin reconstrucción.
Los hallazgos del trabajo fueron publicado en la revista Letras de Óptica.
â“’ 2023 . .