domingo, 5 de abril de 2009

Un software que reconoce señas

Estudiantes de Ingeniería en Informática de la Universidad Nacional del
Litoral , desarrollaron un modelo de identificación automática a través
de una webcam. Es un sistema de bajo costo que por su variabilidad de
usos en situaciones cotidianas, puede comenzar a cambiar la relación del
hombre con los ordenadores.
El procesamiento de la imagen incluye diferentes etapas
Alumnos de Ingeniería en Informática de la Facultad de Ingeniería y
Ciencias Hídricas (FICH) lograron que una computadora reconozca las
señas hechas por una mano frente a una cámara web con una eficiencia
superior al 87%.
El sistema utiliza elementos de bajo costo: una webcam de resolución
media (como las que existen en cualquier hogar) y una computadora, y
podría llegar a usarse como control remoto o en otros tipos de
interfaces y "conexiones" entre hombre y ordenador.
“Habíamos visto que existían otros trabajos sobre el tema, pero que
tenían muchas restricciones, como la necesidad de que la mano tenga un
guante para ser identificada, por ejemplo. Nosotros buscábamos una
aplicación adaptada a situaciones cotidianas, darle instrucciones a la
computadora en un ambiente natural, con luz común, evitando las
condiciones de laboratorio o cámaras de alta resolución”, afirmó Juan
Pablo Hernández Vogt, uno de los autores, con el que trabajaron Pablo
Novara y Javier Godoy.
En sí, se trata de un desarrollo sencillo, pero su importancia radica en
las utilidades que se le podría dar. Con algunas modificaciones se
podría llegar a realizar un software que reconozca el lenguaje de señas
para sordos o controlar toda una presentación audiovisual a distancia,
prescindiendo del teclado y el mouse.

Funcionamiento

El proceso consta de varias etapas: comienza con la captura de la
imagen, luego se trata de “recortar” la mano del fondo y otros
elementos, como el brazo. Una vez extraída la silueta, el modelo la
compara con un conjunto de patrones que se corresponden con cada seña a
reconocer. Esto implica que el usuario debería entrenar en el sistema
para que aprenda las características de cada una de ellas.
Los gestos reconocidos pueden ser empleados como entrada en el control
de equipamiento o ser traducidos a otra forma de información. Esto es
posible porque el proceso ocurre en tiempo real.

El principal problema que los estudiantes debieron sortear fue las
características deficientes de las imágenes, producto de la poca
resolución de la cámara. Para ello diferenciaron el “ruido” proveniente
de los problemas técnicos y se ocuparon de la silueta de la mano en sí.
“Comenzamos logrando que la computadora interpretara tres señas, para
luego reconocer catorce. Esa cantidad nos pareció suficiente, aunque
podríamos haber inventado muchas más”, destacó Godoy.
Para los ensayos se conformó una base de 126 imágenes (realizaciones de
14 señas) con una cámara web estándar, bajo condiciones de iluminación
natural. “Al capturar las imágenes buscamos que la persona realizara las
señas con la mayor naturalidad posible”, explicaron los alumnos.
El método propuesto logra, además, una aproximación a la aplicación del
sistema en tiempo real suficientemente aceptable como para ser
considerada un buen punto de partida para trabajos futuros.

prensa@unl.edu.ar
Prensa Institucional UNL
Dirección de Comunicación
Universidad Nacional del Litoral
Facultad de Ingeniería y Ciencias Hídricas