Vidéo - Video

Dans une vidéo, les membres de l'équipe partagent les défis des dernières minutes de Mars Science Laboratory ( Curiosity ) pour atterrir sur la surface de Mars .

La vidéo est un support électronique pour l'enregistrement, la copie , la lecture, la diffusion et l'affichage de supports visuels en mouvement . La vidéo a d'abord été développée pour les systèmes de télévision mécaniques , qui ont été rapidement remplacés par des systèmes à tube cathodique (CRT) qui ont ensuite été remplacés par des écrans plats de plusieurs types.

Les systèmes vidéo varient en termes de résolution d'affichage , de rapport hauteur/largeur , de taux de rafraîchissement , de capacités de couleur et d'autres qualités. Des variantes analogiques et numériques existent et peuvent être transportées sur une variété de supports, y compris la diffusion radio , la bande magnétique , les disques optiques , les fichiers informatiques et la diffusion en continu sur le réseau .

Histoire

Vidéo analogique

Signal vidéo composite NTSC (analogique)

La technologie vidéo a d'abord été développée pour les systèmes de télévision mécaniques , qui ont été rapidement remplacés par des systèmes de télévision à tube cathodique (CRT) , mais plusieurs nouvelles technologies pour les dispositifs d'affichage vidéo ont depuis été inventées. La vidéo était à l'origine exclusivement une technologie en direct . Charles Ginsburg a dirigé une équipe de recherche Ampex développant l'un des premiers magnétoscopes pratiques (VTR). En 1951, le premier magnétoscope a capturé des images en direct des caméras de télévision en écrivant le signal électrique de la caméra sur une bande vidéo magnétique .

Les magnétoscopes ont été vendus 50 000 $ US en 1956 et les cassettes vidéo 300 $ US la bobine d'une heure. Cependant, les prix ont progressivement baissé au fil des ans; en 1971, Sony a commencé à vendre magnétoscope plate - formes (VCR) et les bandes dans le marché des consommateurs .

Vidéo numérique

L'utilisation de techniques numériques en vidéo crée une vidéo numérique . Au départ, il ne pouvait pas rivaliser avec la vidéo analogique, en raison des premières vidéos numériques non compressées nécessitant des débits binaires peu pratiques . La vidéo numérique pratique a été rendue possible grâce au codage par transformée en cosinus discrète (DCT), un processus de compression avec perte développé au début des années 1970. Le codage DCT a été adapté à la compression vidéo DCT à compensation de mouvement à la fin des années 1980, en commençant par H.261 , la première norme de codage vidéo numérique pratique .

La vidéo numérique était plus tard capable d'une qualité supérieure et, finalement, d'un coût beaucoup plus bas que la technologie analogique antérieure. Après l'invention du DVD en 1997, puis du disque Blu-ray en 2006, les ventes de cassettes vidéo et de matériel d'enregistrement ont chuté. Les progrès de la technologie informatique permettent même aux ordinateurs personnels et aux smartphones bon marché de capturer, stocker, éditer et transmettre des vidéos numériques, réduisant encore le coût de la production vidéo , permettant aux créateurs de programmes et aux diffuseurs de passer à la production sans bande . L'avènement de la radiodiffusion numérique et la transition subséquente à la télévision numérique sont en train de reléguer la vidéo analogique au statut de technologie héritée dans la plupart des régions du monde. À partir de 2015, avec l'utilisation croissante de caméras vidéo haute résolution avec une plage dynamique et des gammes de couleurs améliorées , et des formats de données intermédiaires numériques à plage dynamique élevée avec une profondeur de couleur améliorée , la technologie vidéo numérique moderne converge avec la technologie du film numérique .

Caractéristiques des flux vidéo

Nombre d'images par seconde

La fréquence d'images, le nombre d'images fixes par unité de temps de vidéo, varie de six ou huit images par seconde ( frame/s ) pour les anciens appareils photo mécaniques à 120 images ou plus par seconde pour les nouveaux appareils photo professionnels. Les normes PAL (Europe, Asie, Australie, etc.) et SECAM (France, Russie, régions d'Afrique, etc.) spécifient 25 images/s, tandis que les normes NTSC (États-Unis, Canada, Japon, etc.) spécifient 29,97 images/s. Le film est tourné à une fréquence d'images plus lente de 24 images par seconde, ce qui complique légèrement le processus de transfert d'un film cinématographique en vidéo. La fréquence d'images minimale pour obtenir une illusion confortable d'une image en mouvement est d'environ seize images par seconde.

Entrelacé vs progressif

La vidéo peut être entrelacée ou progressive . Dans les systèmes à balayage progressif, chaque période de rafraîchissement met à jour toutes les lignes de balayage dans chaque trame en séquence. Lors de l'affichage d'un signal diffusé ou enregistré nativement progressif, le résultat est une résolution spatiale optimale des parties fixes et mobiles de l'image. L'entrelacement a été inventé comme un moyen de réduire le scintillement dans les premiers affichages vidéo mécaniques et CRT sans augmenter le nombre d' images complètes par seconde . L'entrelacement conserve les détails tout en nécessitant une bande passante inférieure par rapport au balayage progressif.

En vidéo entrelacée, les lignes de balayage horizontal de chaque trame complète sont traitées comme si elles étaient numérotées consécutivement et capturées comme deux trames : une trame impaire (zone supérieure) constituée des lignes impaires et une trame paire (zone inférieure) constituée des lignes paires. Les dispositifs d'affichage analogique reproduisent chaque image, doublant efficacement la fréquence d'images en ce qui concerne le scintillement global perceptible. Lorsque le dispositif de capture d'image acquiert les champs un par un, plutôt que de diviser une image complète après sa capture, la fréquence d'images pour le mouvement est également doublée, ce qui permet une reproduction plus fluide et plus réaliste des parties de l'image en mouvement rapide. lorsqu'il est visualisé sur un écran CRT entrelacé.

NTSC, PAL et SECAM sont des formats entrelacés. Les spécifications de résolution vidéo abrégées incluent souvent un i pour indiquer l'entrelacement. Par exemple, le format vidéo PAL est souvent décrit comme 576i50 , où 576 indique le nombre total de lignes de balayage horizontales, i indique l'entrelacement et 50 indique 50 champs (demi-images) par seconde.

Lors de l'affichage d'un signal entrelacé de manière native sur un appareil à balayage progressif, la résolution spatiale globale est dégradée par un simple doublement de ligne - des artefacts tels que des effets de scintillement ou de "peigne" dans les parties mobiles de l'image qui apparaissent à moins qu'un traitement de signal spécial ne les élimine. Une procédure connue sous le nom de désentrelacement peut optimiser l'affichage d'un signal vidéo entrelacé à partir d'une source analogique, DVD ou satellite sur un appareil à balayage progressif tel qu'un téléviseur LCD , un vidéoprojecteur numérique ou un écran plasma. Le désentrelacement ne peut cependant pas produire une qualité vidéo équivalente à un véritable matériel source à balayage progressif.

Ratio d'aspect

Comparaison des proportions cinématographiques courantes et de la télévision traditionnelle (verte)

Le rapport hauteur/largeur décrit la relation proportionnelle entre la largeur et la hauteur des écrans vidéo et des éléments d'image vidéo. Tous les formats vidéo populaires sont rectangulaires et peuvent donc être décrits par un rapport entre la largeur et la hauteur. Le rapport largeur/hauteur d'un écran de télévision traditionnel est de 4:3, soit environ 1,33:1. Les téléviseurs haute définition utilisent un rapport hauteur/largeur de 16:9, soit environ 1,78:1. Le rapport hauteur/largeur d'une image complète d'un film 35 mm avec bande son (également connu sous le nom de rapport Academy ) est de 1,375:1.

Les pixels sur les écrans d'ordinateur sont généralement carrés, mais les pixels utilisés dans la vidéo numérique ont souvent des rapports d'aspect non carrés, tels que ceux utilisés dans les variantes PAL et NTSC de la norme vidéo numérique CCIR 601 , et les formats grand écran anamorphiques correspondants. Le raster de 720 x 480 pixels utilise des pixels fins sur un écran au format 4:3 et des pixels épais sur un écran 16:9.

La popularité de la visualisation de vidéos sur les téléphones mobiles a conduit à la croissance de la vidéo verticale . Mary Meeker, partenaire de Kleiner Perkins Caufield & Byers , société de capital-risque de la Silicon Valley , a souligné la croissance du visionnage vertical de vidéos dans son rapport sur les tendances Internet 2015 : elle est passée de 5 % du visionnage de vidéos en 2010 à 29 % en 2015. Les publicités vidéo verticales comme Les Snapchat sont regardées dans leur intégralité neuf fois plus fréquemment que les publicités vidéo en mode paysage.

Modèle de couleur et profondeur

Exemple de plan de couleur UV, valeur Y=0,5

La couleur modélise la représentation des couleurs vidéo et mappe les valeurs de couleur codées aux couleurs visibles reproduites par le système. Il existe plusieurs représentations de ce type couramment utilisées : généralement, YIQ est utilisé dans la télévision NTSC, YUV est utilisé dans la télévision PAL, YDbDr est utilisé par la télévision SECAM et YCbCr est utilisé pour la vidéo numérique.

Le nombre de couleurs distinctes qu'un pixel peut représenter dépend de la profondeur de couleur exprimée en nombre de bits par pixel. Un moyen courant de réduire la quantité de données requises dans la vidéo numérique est le sous-échantillonnage de la chrominance (par exemple, 4:4:4, 4:2:2, etc.). Parce que l'œil humain est moins sensible aux détails de couleur qu'à la luminosité, les données de luminance pour tous les pixels sont conservées, tandis que les données de chrominance sont moyennées pour un certain nombre de pixels dans un bloc et cette même valeur est utilisée pour tous. Par exemple, cela se traduit par une réduction de 50 % des données de chrominance en utilisant des blocs de 2 pixels (4:2:2) ou de 75 % en utilisant des blocs de 4 pixels (4:2:0). Ce processus ne réduit pas le nombre de valeurs de couleurs possibles qui peuvent être affichées, mais il réduit le nombre de points distincts auxquels la couleur change.

Qualité vidéo

La qualité vidéo peut être mesurée à l'aide de mesures formelles telles que le rapport signal sur bruit (PSNR) ou par une évaluation subjective de la qualité vidéo à l'aide d'observations d'experts. De nombreuses méthodes de qualité vidéo subjective sont décrites dans la recommandation ITU-T BT.500 . L'une des méthodes standardisées est la Double Stimulus Impairment Scale (DSIS). Dans DSIS, chaque expert visionne une vidéo de référence intacte suivie d'une version altérée de la même vidéo. L'expert évalue ensuite la vidéo altérée à l' aide d'une échelle allant de « les déficiences sont imperceptibles » à « les déficiences sont très gênantes ».

Méthode de compression vidéo (numérique uniquement)

La vidéo non compressée offre une qualité maximale, mais avec un débit de données très élevé . Diverses méthodes sont utilisées pour compresser les flux vidéo, les plus efficaces utilisant un groupe d'images (GOP) pour réduire la redondance spatiale et temporelle . D'une manière générale, la redondance spatiale est réduite en enregistrant les différences entre les parties d'une même trame ; cette tâche est connue sous le nom de compression intraframe et est étroitement liée à la compression d'image . De même, la redondance temporelle peut être réduite en enregistrant les différences entre les trames ; cette tâche est connue sous le nom de compression inter- images , y compris la compensation de mouvement et d'autres techniques. Les normes de compression modernes les plus courantes sont MPEG-2 , utilisé pour les DVD , Blu-ray et la télévision par satellite , et MPEG-4 , utilisé pour AVCHD , les téléphones portables (3GP) et Internet.

Stéréoscopique

La vidéo stéréoscopique pour film 3D et autres applications peut être affichée en utilisant plusieurs méthodes différentes :

  • Deux canaux : un canal droit pour l'œil droit et un canal gauche pour l'œil gauche. Les deux canaux peuvent être visualisés simultanément en utilisant des filtres polarisant la lumière à 90 degrés hors axe l'un de l'autre sur deux vidéoprojecteurs. Ces canaux polarisés séparément sont visualisés avec des lunettes avec des filtres de polarisation correspondants.
  • Anaglyphe 3D où un canal est superposé à deux couches codées par couleur. Cette technique de couche gauche et droite est parfois utilisée pour la diffusion en réseau ou les récentes versions anaglyphes de films 3D sur DVD. De simples lunettes en plastique rouge/cyan permettent de visualiser les images discrètement pour former une vue stéréoscopique du contenu.
  • Un canal avec des cadres gauche et droit alternés pour l'œil correspondant, utilisant des lunettes à obturateur LCD qui se synchronisent avec la vidéo pour bloquer alternativement l'image à chaque œil, de sorte que l'œil approprié voit le cadre correct. Cette méthode est la plus courante dans les applications de réalité virtuelle informatique telles que dans un environnement virtuel automatique Cave , mais réduit la fréquence d'images vidéo effective d'un facteur de deux.

Formats

Différentes couches de transmission et de stockage vidéo fournissent chacune leur propre ensemble de formats parmi lesquels choisir.

Pour la transmission, il existe un connecteur physique et un protocole de signal (voir Liste des connecteurs vidéo ). Un lien physique donné peut comporter certaines normes d'affichage qui spécifient un taux de rafraîchissement, une résolution d'affichage et un espace colorimétrique particuliers .

De nombreux formats d'enregistrement analogiques et numériques sont utilisés, et les clips vidéo numériques peuvent également être stockés sur un système de fichiers informatique en tant que fichiers, qui ont leurs propres formats. En plus du format physique utilisé par le périphérique de stockage de données ou le support de transmission, le flux de uns et de zéros qui est envoyé doit être dans un format de codage vidéo numérique particulier , dont un certain nombre est disponible (voir Liste des formats de codage vidéo ).

Vidéo analogique

La vidéo analogique est un signal vidéo représenté par un ou plusieurs signaux analogiques . Les signaux vidéo couleur analogiques comprennent la luminance , la luminosité (Y) et la chrominance (C). Lorsqu'il est combiné en un seul canal, comme c'est le cas, entre autres avec NTSC , PAL et SECAM , il est appelé vidéo composite . La vidéo analogique peut être acheminée dans des canaux séparés, comme dans les formats S-Vidéo (YC) à deux canaux et vidéo composante multicanal .

La vidéo analogique est utilisée dans les applications de production télévisuelle grand public et professionnelles .

Vidéo numérique

Des formats de signaux vidéo numériques ont été adoptés, notamment l'interface numérique série (SDI), l'interface visuelle numérique (DVI), l'interface multimédia haute définition (HDMI) et l' interface DisplayPort .

Moyen de transport

La vidéo peut être transmise ou transportée de diverses manières, y compris la télévision terrestre sans fil en tant que signal analogique ou numérique, le câble coaxial dans un système en circuit fermé en tant que signal analogique. Les caméras de diffusion ou de studio utilisent un système de câble coaxial simple ou double utilisant une interface numérique série (SDI). Voir Liste des connecteurs vidéo pour plus d'informations sur les connecteurs physiques et les normes de signal associées.

La vidéo peut être transportée sur des réseaux et d'autres liaisons de communications numériques partagées en utilisant, par exemple, le flux de transport MPEG , SMPTE 2022 et SMPTE 2110 .

Normes d'affichage

Télévision numérique

Les émissions de télévision numérique utilisent le MPEG-2 et d'autres formats de codage vidéo et comprennent :

Télévision analogique

Les normes de diffusion de la télévision analogique comprennent :

Un format vidéo analogique contient plus d'informations que le contenu visible de l'image. L'image précède et suit des lignes et des pixels contenant des métadonnées et des informations de synchronisation. Cette marge environnante est appelée intervalle de suppression ou région de suppression ; le porche avant horizontal et vertical et le porche arrière sont les éléments constitutifs de l'intervalle de suppression.

Écrans d'ordinateur

Les normes d'affichage informatique spécifient une combinaison de rapport hauteur/largeur, de taille d'affichage, de résolution d'affichage, de profondeur de couleur et de taux de rafraîchissement. Une liste de résolutions communes est disponible.

Enregistrement

Une cassette vidéo VHS .

Au début, la télévision était presque exclusivement un média en direct avec certains programmes enregistrés sur film pour la distribution à des fins historiques à l'aide de Kinéscope . Le magnétoscope analogique a été commercialisé en 1951. Par ordre chronologique approximatif. Tous les formats répertoriés ont été vendus et utilisés par des radiodiffuseurs, des producteurs de vidéos ou des consommateurs ; ou étaient importants historiquement (VERA).

Les magnétoscopes numériques offraient une qualité améliorée par rapport aux enregistreurs analogiques.

Les supports de stockage optiques offraient une alternative, en particulier dans les applications grand public, aux formats de bandes volumineux.

Formats d'encodage numérique

Voir également

Général
Format vidéo
Utilisation de la vidéo
Logiciel d'enregistrement d'écran vidéo

Les références

Liens externes