Project

Back to overview

Very Large Sets of Heuristics for Scene Interpretation (VELASH)

English title Very Large Sets of Heuristics for Scene Interpretation (VELASH)
Applicant Fleuret François
Number 140941
Funding scheme Project funding (Div. I-III)
Research institution IDIAP Institut de Recherche
Institution of higher education Idiap Research Institute - IDIAP
Main discipline Information Technology
Start/End 01.09.2012 - 31.08.2013
Approved amount 59'458.00
Show all

Keywords (4)

Pattern recognition; Large feature space; Part-based models; Object detection

Lay Summary (French)

Lead
Le projet VELASH étudie l'utilisation d'espaces de caractéristiques d'images de très grandes dimensions pour l'analyses de scènes complexe, la détection d'objets et la classification d'images.
Lay summary
Nous avons développé plusieurs techniques d'apprentissage capables de traiter efficacement des signaux dans de tels espaces de grandes dimensions. Notre objectif est à présent d'étendre en particulier les modèles classiques déformables pour réduire leur coût computationel au moment de l'évaluation elle-même, et de profiter de l'information jointe présente dans le vecteurs de caractéristiques calculé sur les différentes parties du modèle.

Comme la plupart des techniques de détection reposent sur des filtres linéaires, nous avons développé une nouvelle implantation qui utilise la transformation de Fourier, et qui réduit le coût computational total en effectuant la convolution dans le domaine fréquentiel. Cette implantation doit résoudre trois problèmes techniques rédhibitoires: La nécessité d'effectuer une transformée de Fourier inverse pour chaque plan de caractéristique de l'image, la consommation de mémoire pour effectuer la détection à de multiples échelles, et finalement la lenteur des accès du microprocesseur à la mémoire vive de l'ordinateur lors du calcul des produit pour les convolution dans le domaine fréquentiel. Notre méthode résout ces trois problème et permet d'obtenir un gain de vitesse proche d'un ordre de magnitude par rapport aux meilleures implantation existantes.

Notre second axe de travail est la conception d'un nouveau score de détection qui prend en compte l'apparence jointe des parties d'un objet. Le modèle classique déformable repose sur une hypothèse d'indépendance conditionnelle pour les positions de parties, conditionnellement à la position du centre de l'objet, et ne fait aucune hypothèse pour modéliser les valeurs des caractéristiques d'images elles-mêmes. Cette simplification empêche l'algorithme d'utiliser les régularités en termes de couleurs ou de texture des différentes parties de l'objet. Nous étudions des moyens d'exploiter cette information en utilisant un plongement de l'espace des caractéristiques de l'image dans un espace de dimension réduite, où une faible distance Euclidienne rendrait compte de l'appartenance à un seul et même objet.
Direct link to Lay Summary Last update: 21.01.2013

Responsible applicant and co-applicants

Employees

Name Institute

Publications

Publication
Adaptive Sampling for Large Scale Boosting
Dubout C., Fleuret F. (2014), Adaptive Sampling for Large Scale Boosting, in Journal of Machine Learning Research (JMLR), 15, 1431-1453.
Accelerated Training of Linear Object Detectors
Dubout C., Fleuret F. (2013), Accelerated Training of Linear Object Detectors, in Proceedings of the IEEE international conference on Computer Vision and Pattern Recognition Workshop, -, -.
Deformable Part Models with Individual Part Scaling
Dubout C., Fleuret F. (2013), Deformable Part Models with Individual Part Scaling, in Proceedings of the British Machine Vision Conference (BMVC), -, -.

Scientific events

Active participation

Title Type of contribution Title of article or contribution Date Place Persons involved
British Machine Vision Conference (BMVC) Poster Deformable Part Models with Individual Part Scaling 12.09.2013 Bristol, Great Britain and Northern Ireland Dubout Charles;
Structured Prediction workshop of the IEEE international conference on Computer Vision and Pattern Recognition (SPWS/CVPR) Talk given at a conference Accelerated Training of Linear Object Detectors 24.06.2013 Portland, OR, United States of America Dubout Charles;
European Conference on Computer Vision Talk given at a conference Exact Acceleration of Linear Object Detectors 09.10.2012 Firenze, Italy Dubout Charles;


Associated projects

Number Title Start Funding scheme
124822 Very Large Sets of Heuristics for Scene Interpretation (VELASH ) 01.09.2009 Project funding (Div. I-III)

Abstract

This project is a one-year renewal of the three-year VELASH project, which started in September 2009. The objective of VELASH is to design novel algorithms to facilitate the development and the use of very large families of image feature extractors for object detection in natural scenes.In coordination with the European MASH project, we have created over the last two years a collaborative platform to allow multiple contributors to develop and test such image feature extractors collaboratively.In VELASH, we have adapted Boosting to deal with multiple families of feature extractors, and have developed new generic procedures extremely efficient in that context. This new techniques have been validated on object classification and detection on canonical databases (INRIA pedestrians, CIFAR, Caltech 101, etc.)The objective of this renewal is to move from monolithic models, and to extend state-of-the-art part-based object detection methods. Our objective is twofold. First, while current methods mainly exploit variants of histograms of gradients -- which result in edge-based templates stable to local deformation -- we want to leverage the multiple modalities provided by the many families of feature extractors we have already implemented. Second, we will investigate the modeling of the joint behavior of features computed on individual parts, instead of relying on strong assumptions of conditional independence.
-