SEMINARIOS DE DOCTORADO 2005-2006


Doctorado en Ingeniería Informática y de Telecomunicación
Escuela Politécnica Superior, Universidad Autónoma de Madrid

Escuela Politécnica Superior                        


19 de Mayo de 2006, 12:00

Salón de Grados, Escuela Politécnica Superior, Universidad Autónoma de Madrid


Video Technologies, Software Architecture and Signal Processing Strategy in the UPC Smart Room

Josep R. Casas

Universitat Politècnica de Catalunya

     

Resumen

Research in Multimodal Interfaces is currently being carried out at UPC in the framework of the European Project "CHIL" (Computers in the Human Interaction Loop). A Smart Room was built in 2004 and provided with multiple A/V sensors (cameras, microphones) and the computing infrastructure for data collection and signal processing. The purpose of the CHIL project is to demonstrate useful services for the attendees in the Smart Room.
After a brief description of the sensor setup in the Smart Room and its use in the CHIL project, this talk will focus on the status of vision technologies being developed at UPC. In particular, Object/Body detection and tracking, Face Detection and recognition, Body and Gesture Analysis, Object Detection and Analysis, Text Detection and Video OCR, Activity Analysis and Emotion Detection.
Then, we will describe the distributed processing architecture and the processing strategy that has been developed to process the signals from the sensors. The distributed architecture allows the integration of low-level and high-level features resulting from visual analysis tasks and also features resulting from the analysis in other modalities such as audio processing, speech processing and natural language processing. This architecture is set as the lowest layer of an agent-based framework used for situation modeling and reasoning in CHIL scenarios.

PDF presentation

Josep R. Casas

Josep R. Casas es Profesor Titular de la UPC desde 1996, donde se tituló en Ingeniería de Telecomunicación en 1990 y como Doctor Ingeniero por el Departamento de Teoría de Señal y Comunicaciones (TSC) en 1996. Durante el año 2001 realizó una estancia de investigación en el CSIRO Mathematics & Information Sciences en Canberra, Australia. Actualmente imparte docencia en la ETSETB en las asignaturas de Procesado de Imagen, Televisión y Señales y Sistemas.

Su actividad de investigación se centra en el campo de análisis de imagen y vídeo, principalmente en análisis multicámera, segmentación, seguimiento de objetos, y análisis de estructuras en imagen para su interpretación semántica. Actualmente, coordina la contribución de la UPC en CHIL ("Computers in the Human Interaction Loop"), un Proyecto Integrado europeo del 6º PM en un consorcio formado por 15 miembros (13 europeos y 2 americanos). CHIL estudia interfaces multimodales y la contribución de la UPC abarca las tecnologías de video, audio y lenguaje natural de 3 grupos de investigación de dos departamentos distintos (TSC y LSI).

Anteriormente, ha sido responsable por la UPC en proyectos como la NoE SCHEMA, IST ADViSOR e INCO/COPERNICUS INTACCOMP. En nuestro país, dirigió el equipo técnico del proyecto DOMUS con la empresa D'Ocon Films Productions que, con financiación del Ministerio de Industria entre 1996 y 2000, desarrolló técnicas avanzadas de análisis, codificación e indexación para la producción de Dibujos Animados.