SEMINARIOS DE DOCTORADO 2005-2006
Doctorado en Ingeniería
Informática y de
Telecomunicación
Escuela Politécnica Superior, Universidad Autónoma de
Madrid

19 de Mayo de 2006, 12:00
Salón de Grados, Escuela Politécnica Superior,
Universidad Autónoma de Madrid
Video Technologies, Software Architecture
and Signal
Processing Strategy in the UPC Smart Room
Josep R. Casas
Universitat
Politècnica de Catalunya
Resumen
Research in Multimodal Interfaces is currently being
carried out at UPC in the framework of the European Project "CHIL"
(Computers in the Human Interaction
Loop).
A
Smart Room was built in 2004 and provided with multiple A/V sensors
(cameras, microphones) and the computing infrastructure for data
collection and signal processing. The purpose of the CHIL project is to
demonstrate useful services for the attendees in the Smart Room.
After a brief description of the sensor setup in the Smart Room and its
use in the CHIL project, this talk will focus on the status of vision
technologies being developed at UPC. In particular, Object/Body
detection and tracking, Face Detection and recognition, Body and
Gesture Analysis, Object Detection and Analysis, Text Detection and
Video OCR, Activity Analysis and Emotion Detection.
Then, we will describe the distributed processing architecture and the
processing strategy that has been developed to process the signals from
the sensors. The distributed architecture allows the integration of
low-level and high-level features resulting from visual analysis tasks
and also features resulting from the analysis in other modalities such
as audio processing, speech processing and natural language processing.
This architecture is set as the lowest layer of an agent-based
framework used for situation modeling and reasoning in CHIL scenarios.
Josep R. Casas
Josep R. Casas es Profesor Titular de la UPC desde
1996,
donde se tituló en Ingeniería de Telecomunicación
en 1990 y como Doctor Ingeniero
por el Departamento de Teoría de Señal y Comunicaciones
(TSC) en 1996. Durante
el año 2001 realizó una estancia de investigación
en el CSIRO Mathematics &
Information Sciences en Canberra, Australia. Actualmente imparte
docencia en la
ETSETB en las asignaturas de Procesado de Imagen, Televisión y
Señales y
Sistemas.
Su actividad de investigación se centra en
el campo de
análisis de imagen y vídeo, principalmente en
análisis multicámera,
segmentación, seguimiento de objetos, y análisis de
estructuras en imagen para
su interpretación semántica. Actualmente, coordina la
contribución de la UPC en
CHIL ("Computers in the Human Interaction Loop"), un Proyecto
Integrado europeo del 6º PM en un consorcio formado por 15
miembros (13 europeos
y 2 americanos). CHIL estudia interfaces multimodales y la
contribución de la
UPC abarca las tecnologías de video, audio y lenguaje natural de
3 grupos de
investigación de dos departamentos distintos (TSC y LSI).
Anteriormente, ha sido responsable por la UPC en
proyectos
como la NoE SCHEMA, IST ADViSOR e INCO/COPERNICUS INTACCOMP. En nuestro
país,
dirigió el equipo técnico del proyecto DOMUS con la
empresa D'Ocon Films
Productions que, con financiación del Ministerio de Industria
entre 1996 y
2000, desarrolló técnicas avanzadas de análisis,
codificación e indexación para
la producción de Dibujos Animados.