Lien de la note Hackmd
On va decouvrir les principes fondamentaux l'audio et la video numerique.
Plusieurs parties:
Ce sont les prerequis pour la suite
La suite: standards de compression video
C'est un element d'une image
Mais encore ?
Monde PC: PAR = 1:1
Monde video: PAR >= 1
Pourquoi ?
On tient ca de l'analogique: pas de resolution
On arrive sur le display aspect ration: la resolution de sortie
Est-ce qu'on a deja essaye de jouer un fichier VOG d'un DVD tout seul ?
L'image sera plus carree et deformee car on ne lit pas les metadata
Generateurs de graphismes RGB
Pourquoi on affiche le nom de la chaine quand on zappe en numerique ?
En analogique, quand on zappait c'etait instantane car il suffisait de changer que quelques parametres pour changer de frequence sans pre-processing
C'est juste pour faire attendre les gens, sinon on n'a qu'un ecran noir
Pourquoi certaines box ont une mosaique avec plusieurs flux videos de differentes chaines ?
Car ce n'est pas fait par la box, ce sont des chaines mosaiques pre-composees par l'emetteur
On utilise les metadatas pour choisir une chaine sur les mosaiques
Certaines mosaiques ne permettent pas de selectionner de chaine
Video: YUV
Est-ce que les premiers signaux analogiques pour la tele etaient en couleur ?
Bien sur que non
Vers les annees 50 on se dit que ca serait bien d'avoir la couleurs
On va faire un truc degueulasse pour que ce soit retrocompatible avec les gens ayant une tele en noir et blanc
L'analogique est la reponse de ce qu'on fait en numerique.
Les US avaient NTC qui on cree un standard video de 480 lignes en noir et blanc qui est passe en couleurs en une nuit (et ca a marche !)
L'heritage de l'analogiqe nous enquiquine encore aujourd'hui
Qu'est-ce qu'on remarque ?
Le vert est predominant car il est predominant dans la nature
Les humains ont un excellent pouvoir d'observation sur le vert (60-70% de notre champ de vision)
On voit moins bien le rouge car c'est le sang et le feu (20-30% de notre champ de vision)
On voit encore moins bien le bleu car on ne veut pas etre aveugle par le ciel
La compression numerique va user et abuser de nos limitations de perception
Qu'est-ce qu'on remarque ?
Dans le V il y a tres peu de rouge, noye dans du gris
Si on etait un algorithme, lesquels de ces images on trouverait plus facile a digerer que les autres ?
U et V ont une dynamique faible donc l'encodeur entropique va se regaler
On va grignoter tout ce qui est possible pour faire des economies
Format lineaire:
Combien ca coute ?
Que faut-il dans un systeme ?
Pour un systeme:
TODO
Format paletisse:
Tous les OSDs sont paletises
TODO
Sampling Mode: sous-echantillonnage de la chrominance
Qu'est-ce que ca veut dire ?
On va peut-etre enlever du U ou du V sur certains pixels car nos yeux ne peuvent pas le voir de toute facon
Le fameux grignottage
Exemple:
Sur la 2e image, on a commence a diviser l'echantillonnage
Qu'est-ce qu'on observe ?
Il y a des bandes qui apparaissent a chaque bordures de couleurs
Elles se degeulent les unes sur les autres
Si on met une video youtube avec du rouge petant on aura le meme effet
Ca arrive surtout sur les cas extremes avec des transitions abruptes
On suppose 8 pixels:
Ils ont chacun leurs composantes
Pour 4 pixels consecutifs (pas forcement en ligne mais aussi en carre) il y a 4
Pour 4 pixels consecutifs, on n'en a que 2 qui contiennent de la chrominance
On a litteralement decime une colonne de chroma sur 2
Ce sont toutes les images JPEG
On a 6 composantes sur 8 bits au lieu de 12
Le calculateur fait la moyenne
On a beaucoup economise juste en coupant la chroma une ligne sur 2 et un colonne sur 2
Utilise par les Etats-Unis
Pendant notre enfance on avait les camescopes DV, en Europe ils sont en
Tous les CODECs aujourd'hui sont bases sur la perception visuelle
Une image planaire, combien ca coute ?
Pour un systeme:
On pas en YUV car c'est le seul format qui nous permet de decimer le chroma sans tout casser
Pour un systeme:
70 ans et toutes ses dents
Un peu d'histoire: les signaux videos ne sont pas tous faits de la meme maniere et ne sont pas fait comme on le pense.
Mais nous n'avons pas parle de la structure d'une image.
Il y a un peu moins d'un siecle, des ingenieurs se sont dit "On va transmettre de l'image analogique sur des tubes cathodiques".
Le principe d'un ecran cathodique est toujours le meme: on a une surface remplit de photophores qui emet de la lumiere quand elle se prend des electrons, elle met du temps a s'allumer et du temps a s'eteindre.
On s'est dit qu'on allait utiliser ces ecrans pour afficher des images.
Pourquoi ecran cathodique ?
Car les electrons sont generes par une cathode, et si on etait un peu trop pres de l'ecran on se prenait des rayons.
On ecrit notre image ligne a ligne a l'ecran et on obtient notre image.
SAUF QUE
On a remarque de 480 lignes c'est bien pour le format d'image. Mais si on envoie 480 lignes par image, 60 images par seconde, on a un signal beaucoup trop large.
Des ingenieurs se sont dit "Mais c'est pas un probleme, regardez le temps que prend mon ecran a s'eteindre" (c'est une gaussienne). Ces ingenieurs se sont dit "Je ne vais envoyer qu'une ligne sur 2 de chaque image et alterner entre lignes paires/impaires".
C'est ca l'entrelacement
On a decime l'image spatialement.
On a quasiment la meme qualite d'image
Est-ce qu'on a vu que les tubes cathodiques scintillent ?
C'est lie du a l'entrelacement et alterner les images
Aujourd'hui on n'a que des ecrans plats avec des pixels avec une bonne reactivite (jusqu'a 140 Hz)
Mais ca nous pose des ENORMES problemes avec l'entrelacement
Sur nos ecrans actuels, chaque pixel a chacun sa vie.
On a un probleme de taille d'ecran, de pixels, de resolution, etc.
Pourquoi garder l'entrelacement ?
Car il y a encore des pays qui utilisent des teles cathodiques
Si c'est moins cher, on va le faire
On paye cher apres car c'est a credit
TFF = Top filter (flag)
BFF = Bottom filter (flag)
Une image entrelacee c'est une image avec des dents
Tous les flux de la TNT sont entrelaces et ne sont pas en HD
On en en 1440i50
Le numerique, c'est pas que c'est mieux, c'est que c'est moins cher
Avantages:
Inconvenients:
En bas a droite l'objet bouge mais n'est pas entrelace
Ce flux video donne des maux de tete aux ingenieurs
Le OK ne bouge pas et ne doit pas etre entrelace
Le logo en bas a droite est le logo corporate
Il y a plusieurs entrelaceurs
Exemple: VLC
Ou est le K ?
On a pris que les lignes du haut et on a degage les lignes du bas
C'est desentrelace comme un pied par le GPU
Plusieurs facons de desentrelace: