Comment fonctionne la compression audio ?

Vous avez peut-être déjà entendu dire que la musique que vous écoutez est « compressée » et que si elle était moins compressée, voire non compressée, elle serait bien meilleure.

musique

Cependant, si vous savez ce qu’est la compression et comment elle fonctionne, vous ne serez peut-être pas si pressé d’élargir vos horizons musicaux.

À la rencontre de Harry Nyquist

Avant d’entrer dans le vif du sujet, il est important de parler du théorème d’échantillonnage de Whittaker-Nyquist-Shannon, car il est basé sur les travaux de Harry Nyquist, Claude Shannon et (en 1915) E.T. Whitaker. Nyquist est toutefois le plus célèbre défenseur de ce théorème, c’est pourquoi on l’appelle souvent « théorème de Nyquist ».

Au-delà de l’aspect historique, le théorème de Nyquist est le fondement de l’audio numérique. Il stipule que pour représenter numériquement un son, vous devez échantillonner au moins deux fois la fréquence la plus élevée du son. Par exemple, les CD échantillonnent l’audio à 44,1 kHz, capturant des fréquences allant jusqu’à 22,05 kHz, juste au-delà de la gamme supérieure de l’audition humaine.

L’échantillonnage peut être considéré comme la forme de base de la compression audio numérique. Après tout, vous pouvez augmenter la fréquence d’échantillonnage et obtenir techniquement un enregistrement plus précis du son analogique original, mais la taille de vos fichiers augmentera de manière exponentielle. Il n’est pas utile d’augmenter la précision au-delà de ce que l’oreille humaine peut percevoir, car cela nécessite trop d’espace de stockage. Vous disposez donc d’une base pour déterminer l’espace maximal qu’un enregistrement audio doit occuper.

Bien sûr, de nos jours, les formats audio de qualité supérieure offrent des taux supérieurs à la qualité CD, avec des fréquences de 48 kHz, mais le point de rendement décroissant est relativement clair.

La compression avec perte réduit la qualité audio

La compression audio existe sous deux formes : avec perte et sans perte. La compression sans perte (comme le format FLAC) conserve chaque bit des données d’origine, mais génère des fichiers plus volumineux, environ deux fois plus gros qu’un enregistrement audio sur CD.

La compression avec perte (comme le MP3 ou l’AAC) supprime les données « inutiles » pour gagner de l’espace, en se basant sur des modèles psychoacoustiques de l’audition humaine. Ces modèles partent du principe que nous ne remarquons pas certains sons masqués par des sons plus forts, ni les fréquences situées aux limites de la gamme audible par l’oreille humaine.

Cette approche n’est toutefois pas parfaite. Si la compression avec perte supprime les données audio redondantes, elle peut également éliminer des détails subtils, tels que la réverbération d’une pièce ou la richesse harmonique des instruments. Il en résulte un son que certains audiophiles pourraient qualifier de « plat » ou « sans vie », en particulier à des débits binaires faibles tels que 128 kbps.

La fréquence d’échantillonnage et la profondeur de bits sont les facteurs les plus importants

La compression n’est pas le seul facteur qui affecte la qualité ; le taux d’échantillonnage et la profondeur de bits d’origine sont tout aussi importants.

Comme mentionné plus haut, le taux d’échantillonnage correspond à la fréquence à laquelle le son est mesuré par seconde. Des taux d’échantillonnage plus élevés (par exemple, 96 kHz) capturent plus de détails, mais nécessitent plus d’espace de stockage.

La profondeur de bits définit la gamme dynamique, c’est-à-dire la différence entre les sons les plus forts et les plus faibles. Une profondeur de bits plus élevée, comme l’audio 24 bits, préserve davantage de nuances que la norme 16 bits des CD.

Lorsque l’audio est compressé dans des formats avec perte, la fréquence d’échantillonnage et la profondeur de bits sont souvent réduites, ce qui peut éliminer les détails sonores discrets et donner une texture « dure » ou « granuleuse ».

Bien sûr, grâce à des supports de stockage moins coûteux, des processeurs plus puissants et de meilleurs algorithmes de compression qui font varier le débit en fonction des besoins de la musique à un moment donné, la qualité originale de la musique peut être presque entièrement préservée. Tout cela en utilisant seulement une fraction de l’espace de stockage nécessaire à un format tel que FLAC.

Vous pouvez facilement entendre une mauvaise compression

Même si vous n’êtes pas un audiophile, une mauvaise compression audio peut être perceptible. Les « artefacts » audio courants comprennent :

  • Écrêtage : les sons forts sont déformés ou coupés.
  • Son métallique : une qualité « métallique » due à une compression trop agressive.
  • Perte de dynamique : la musique semble plate et manque d’impact.
  • Écho ou trémolo : distorsions subtiles dans les voix ou les notes soutenues.

Vous voulez vous en rendre compte par vous-même ? Comparez un MP3 à haut débit (par exemple 320 kbps) à une version à faible débit (par exemple 128 kbps). La différence est flagrante, en particulier avec des morceaux complexes comme les enregistrements orchestraux ou live.

Cependant, passer à des débits binaires plus élevés donne rapidement le même résultat, ce qui signifie qu’il existe un juste milieu, le 320 kbps étant un bon exemple pour le MP3 en particulier.

Les Infos de Ballajack
Résumé de la politique de confidentialité

Ce site utilise des cookies afin que nous puissions vous fournir la meilleure expérience utilisateur possible. Les informations sur les cookies sont stockées dans votre navigateur et remplissent des fonctions telles que vous reconnaître lorsque vous revenez sur notre site Web et aider notre équipe à comprendre les sections du site que vous trouvez les plus intéressantes et utiles.