Definition Un domaine inter-disciplinaire pour permettre a une machine d'analyser, traiter et comprendre une representation de l'environnement obtenue par un systeme d'acquisition.
Cette branhe de l'intelligence artificielle implique le developpement d'algorithmes permettant l'automatisation de taches que le systeme visuel humain peut realiser.
On ne peut pas voir derriere les objets On devine en utilisant des donnees autour et on interpole
Telemetrie par decalage de phase
Envoi d'une impulsion modulee
Lumineuse classique: Camera SWIR a modulation de phase
Lumineurse Laser: LIDAR
Ultrasonore: SONAR
Ondes Radio: RADAR
Mesure du decalage de la phase
Il faut utiliser des longueurs d'ondes adaptees aux utilisations qu'on veut en faire
C'est comme ca qu'on se fait flasher sur l'autoroute
Triangulation
Principe utilise par les geometres, le GPS…
Triangulation active
Pointeur laser
Un rayon laser est envoye vers l'objet a mesurer
La lumiere diffusee est observee par une camera
On peut en deduire la profondeur du point
Laser ligne, profilometrie
Une image saisie donne une ligne de points
Un unique balayage suffit pour assurer la couverture de la surface
Lumiere structuree
Projection d'un motif connu
Appariement pixels/motif
Cameras
Avantages:
Pas de contact
Peu onereux
Robuste (~pas de piece mobile, pas d'interferences…)
Facilite d'acquisition de grandes quantites de donnees
Couverture dense
Grande variete de distances
Possibilite d'obtenir de l'information 2D et 3D
Pas besoin d'eclairage specifique
Technique passive
Informatino geometrique mais aussi semantique, interpretation de l'image
Donnee directement interpretable par l'Homme
Inconvenients:
Besoin de lumiere
Occlusions
Perte d'information
Une image est une projection du monde 3D sur un plan 2D
Difficulte de l'appariement des pixels
Precision relativement faible
Mono-vision passive
Utilisation d'image 2D pour avoir un rendu 3D
Stereo-vision
Vision d'une meme scene depuis 2 endroits legerements decales l'un par rapport a l'autre
Principe de la perception 3D chez l'Homme
Precision et etalonnage
Les points 3D sont des mesures geometriques obtenues par des principes physique (lumiere, contact, etc.) et mecaniques
Les erreurs systematiques de mesure peuvent etre ameliorees par calibrage/etalonnage
Modelisation de la camera
Geometrie optique
Postulats:
La propagation de la lumiere est decrite par des rayons lumineux provenant d'une source de lumiere
Un rayon lumineur suis une ligne droite dans un milieu homogene
A l'intersection entre 2 milieux homogenes, la lumiere est reflehie ou refractee
Le chemin parcouru par un rayon lumineux et reversible
L'intersection de rayons lumineux est sans effets
Modelisation de la camera
Capteur uniquement
Comment eviter ca ?
On met une lentille :) (Theotime)
Pinhole/stenope
C'est le modele stenope
Distance focale
Ouverture
Reduction de la taille de l'ouverture
Amelioration de la nettete
Reduction de la luminosite
Problematique du computer vision: choisir la bonne ouverture
Lumiere
Sans lumiere, pas d'image (pas de bras pas de chocolats)
L'illumination de la scene a une influence importante sur le processus d'acquisition
Controler l'illumination est un concept clef
GLobalement possible de controler l'illuminatino dans l'industrie
Difficile a impossible en milieu exterieur
Il faut si possible controle l'illumination
Sinon, agir sur les parametres physiques de la camera
Vitesse d'obturation
Ouverture
Petite vitesse d'obturation et/ou grande vitesse de l'objet attention au flou de mouvement
Logiciel d'auto-exposition
Cameras "global shutter" plutot que "rolling shutter"
Lentilles
Utilisation d'une lentille pour concentrer la lumiere sur le plan image
Amelioration de la luminosite
Amelioration de la nettete
Distance focale
La distance entre la lentille et le point ou tous les rayons lumineux convergent
Focus
Les objets sont correctement projetes sur le plan image uniquement lorsqu'ils sont a une certaine distance de la lentille/lorsque le capteur est a une certaine distance de la lentille
Distance de focus
Hyperfocale
Definition
Distance minimum a laquelle il est possible de faire la mise au point tout en gardant les objets situes a l'infini avec une nettete acceptable
Depend de la distance focale et de l'ouverture
Validite du modele stenope
On peut assimilier une camera munie d'une lentille a une camera stenope si:
On considere uniquement le rayon lumineux central
On suppose que la mise au point est faite
On considere que la distance de focus de la camera avec lentille est equivalenete a la distance focale de la camera stenope
On neglige ou corrige les distortions induites par la lentille
On ajoute un systeme d'ouverture pour limiter les erreurs
Distortions
Probleme des lentilles
Distortion radiale
Distortion en moustache mais tres rare
Distortion tangentielle
La distortion est plus importante pour les rayons qui passent pres du bord de la lentille
Astigmatisme
La distance focale est differente selon l'axe et l'axe car la lentille n'est pas parfaitement circulaire
Abberations
Probleme des lentilles
Aberration chromatique
Aberration comatique
S'observe notemment sur les telescopes
Malformation capteur
Probleme du capteur
Asymetrie des pixels ou "skewness"
Souvent negligeable sur les cameras modernes
Bruit
Probleme du capteur
Bruit lie a l'electronique
Bruit lie a la discretisation des mesures (seulement 255 valeurs possibles)
Geometrie optique
Systeme d'equation
Centre optique
Le capteur et la lentille ne sont pas parfaitement alignes decalage entre le centre optique et le centre de l'image
Le point/pixel de coordonnees dans l'image correspond au coin superieur gauche
On applique une tranlsation permettant de passer au centre optique de l'image
Parametres intrinseques
Retenir: matrice intrinseque
3D vers image 2D:
Les coordonnees du monde ne sont pas necesairement les memes que les coordonnees de la camera
Il faut convertir du systeme de cooordonnees du monde vers le system de coorodnnnees de la camera
une matrice de rotation
un vecteur translation
Du monde a l'image
Estimation de la matrice camera
une matrice inconnues
On peut decomposer en
matrice
vecteur
Resectioning:
On estime a partir de parires et connues
Estimation de la matrice intrinseque
Plane-based calibration
On realise l'acquisition de multiple images d'une surface plane (e.g. damier)
Cela permet de fixer pour tous les points du plan observe
On a donc:
A l'aide de ces equations et de la conaissance du plan observe, il est possible de determiner
Parametres de distorsion
Il est possible d'estimer des aprametres caraterisant les distortions radiales et tangentielles
Plusieurs modeles de distorsion existent, notamment le modele polynomial de Brown-Conrady
Modele complet
Comment realiser une bonne calibration ?
La cible doit etre parfaitement plane
Les motifs de type cercles asymetrqiues donnent de meilleurs resultats
La distance entre les points doit etre mesuree precisement
Il faut correctement definir le nombre de lignes/colonnes de la cible
Controler l'environnement de calibration
Pas de sources de lumiere directe
Pas d'autres cible/motifs similaires visible
Pas de relets
Controle de l'exposition
Il faut toujours calibrer sur site
Procedure de calibration
Mettre la camera dans une position fixe
Acquerir 9 images a la distance de travail la plus proche
Recommecer pour la distance de travail moyenne
Acquerir 8 images avec des inclinaisons differentes de la cible
Acquerir 5 a 10 images supplementaires avec des angles "aleatoires"
Essayer d'avoir une distribution homogene des points dans le plan image
Stereovision
Triangulation
Geometrie epipolaire
Lignes epipolaires
Matrice essentielle
Matrice fondamentale
Rectification
Le fait de rendre 2 images "paralleles"
Rend la triangulation facile
Facilite l'appariement
Appariement de points
Trouver les coordonnees en pixel d'un point 3D dans le plan image des 2 cameras
Les points images sont sur la meme ligne lorsque les images sont rectifiees
Plans image paralelles
Disparite Distance en pixels qui separe la projection d'un meme point sur les images des 2 cameras
Calcul de la profondeur
Image de disparite/clarte de profondeur
Calcul des coordonnees 3D
Methodes de correlation
Comment faire pour trouver les points correspondants ?
De facon naive, recherche identique mais on peut avoir des pixels qui ont la meme valeurs et avoir des faux positifs -> selection d'une fenetre
pick a window around
build vector
Slide the window along in image 2 and compute for each
Compute the dot product
C'est sensible aux differences d'exposition
On fait de la normalized crossed-correlation
On peut faire varier la taille de la fenetre
Petite fenetre:
Plus de details
Plus de bruit
Problemes de la stero-vision
Occlusions
Problemes de la stereo vision
Regions homogenes et/ou peu texturees
Patterns repetitifs
Influence de la baseline
Petite baseline, petit
Grande baseline, grand
Disparite entiere
Le processus de stereo-correlation permet uniquement de calculer des valeurs entieres de disparite
Il est necessaire de raliser une interpolation pour lisser les disparite
Exemples ans interpolation sous-pixellique:
Une fonction d'interpolation sous-pixellique doit etre implementee
La fonction de disparite est estimee en appliquant une fonction de la forme:
avec les scores de correlation
On peut simpifier la formulation de cette fonction:
L'utilisation d'une fonction d'interpolation sous-pixellique a pour effet d'introduire de petites erreurs sous la forme d'une sinusoide
Meme si cet effet est difficilement visible sur la carte de disaprtie, il apparait clairement sur la reprojection 3D: