Une
équipe de Stanford vient de proposer un nouvel algorithme d'analyse d'image permettant
d'estimer les distances des différents objets sur une image unique statique. Le
logiciel développé permet la perception de la profondeur sans faire appel à la
disparité binoculaire, contrairement aux algorithmes traditionnels qui utilisent
la vision stéréo et la triangulation.
L'intérêt serait d'équiper
des robots pour leur permettre de se déplacer à grande vitesse en évitant les
obstacles, tout en n'étant équipé que d'une simple caméra monoculaire, la technique
mise au point fournissant une détection des obstacles avec estimation de leur
éloignement (du moins pour les obstacles ni trop petits ni trop plats). Ceci serait
intéressant pour de très petits robots, ou des robots bon marchés, pour lesquels
on ne peut envisager de multiplier les capteurs.
L'algorithme utilise plusieurs approches : analyse
de la texture des objets (moins l'objet contiendra de détails plus il sera éloigné),
analyse des contours (des lignes convergentes indiquent un accroissement des distances),
comparaison de la netteté (plus un objet sera flou plus il sera loin). L'image
est segmentée puis les secteurs sont analysés individuellement et comparativement
pour déterminer les positionnements relatifs des objets détectés. Le processus
est répété avec plusieurs niveaux de grossissement pour essayer de détecter tous
les éléments présents dans l'image.
Par ailleurs, l'approche repose sur
un apprentissage supervisé de l'environnement, pour que l'algorithme estime correctement
la décomposition de l'image. L'apprentissage permet d'initier un sous-système
de bas niveau, très précis sur l'ensemble d'apprentissage, sous-système sur lequel
un contrôleur s'appuie ensuite pour continuer d'apprendre par apprentissage par
renforcement (maximisation d'une fonction d'apprentissage). L'approche est donc
plus complexe que celles antérieurement développées, par exemple à CMU.
Le
taux d'erreurs annoncé est de 35% ce qui d'après les chercheurs est suffisamment
bon pour permettre à un robot de se mouvoir rapidement (par exemple à 30 ou 40km/h)
et d'ajuster sa route au fur et à mesure de son déplacement.
Pour en savoir plus
- High speed obstacle avoidance using monocular vision and reinforcement learning.
ACM International Conference Proceeding Series; Vol. 1 Proceedings of the 22nd
international conference on Machine learning, Bonn, Germany, 7-11/08/2005 -
Appearance-Based Obstacle Detection with Monocular Color Vision - http://www.cs.cmu.edu/~illah/PAPERS/abod.pdf
- Sources : Stanford Report, 07/12/2005 - http://news-service.stanford.edu/news/2005/december7/robotsee-120705.html
Andrew Y. Ng, Computer Science Department, Stanford University - http://ai.stanford.edu/~ang/ -
Rédacteur : Christophe Lerouge, christophe.lerouge@consulfrance-sanfrancisco.org