Audiophilie, Hi-fi et Mesures ?


On lit souvent que la mesure ne reflète que peu ou mal la qualité d'un système Haute-Fidélité. Je me propose de donner un éclairage théorique autour de ma démarche réconciliant audiophilie et mesures.

Nous aborderons tout d'abord les notions de son et de son enregistré, pour arriver à celle de haute-fidélité.
La définition du système de reproduction du son dit "chaîne hi-fi" nous amènera tout naturellement à quelques réflexions autour des notions de système linéaire et de distorsion.
Le principe de superposition est la brique fondamentale sur laquelle se construit la démarche de caractérisation de systèmes audio par la mesure. Nous verrons que celle-ci n'est en rien incompatible avec notre passion audiophile !

Note: Les illustrations sont générées à l'aide de REW ou Audacity.


Un ou deux aspects du son

Wikipédia renferme
un bon article généraliste donnant une définition du son:

Le son est une vibration mécanique d'un fluide, qui se propage sous forme d'ondes longitudinales grâce à la déformation élastique de ce fluide.

On pourra aussi lire la leçon Rudiments d'acoustique de Wikiversité.
Dans le cas qui nous intéresse en premier lieu le fluide élastique est l'air et l'onde de déformation élastique sa traduit par une variation locale de la pression atmosphérique.
Lorsqu'un cailloux tombe dans l'eau, on observe une déformation de la surface qui se propage en formant des cercles concentriques autour du point d’impact:

Illustration empruntée au site http://www.freewebs.com/geometrie/Nature.htm

L'onde sonore se propage de la même façon sauf que sa propagation se fait dans un milieu à trois dimensions, les cercles deviennent des « coquilles » concentriques qui vont grandir jusqu’à occuper tout le milieu disponible, puis "rebondir" au contact de ses limites (parois). En fait la forme du motif de propagation d'un son n'est pas forcément une sphère... cela dépend de la taille et de la forme de l'objet qui le crée.

De la même façon que le déplacement vertical d'un flotteur de pêche à la ligne "mesure" l'onde créée par le cailloux dans l'eau, un microphone placé en un point de l'espace mesure la pression atmosphérique en ce point, dont la variation au cours du temps représente l'onde sonore.


Exemple de son capté par un microphone (portion d'un "Allo" prononcé par moi-même); intervalle de temps de 200ms.

Un microphone transforme la pression atmosphérique en un courant électrique; un dispositif électronique simple mesure la tension résultante à ses bornes. Une prise de son est donc une forme de mesure: lorsque nous écoutons de la musique enregistrée, nous écoutons en fait des mesures savamment assemblées...

Périodicité, fréquence

On observe que la pression mesurée forme toujours un mouvement alternatif autour d’un point de repos, ce qu'on appelle vibration ou oscillation; Lorsqu’un même cycle se retrouve de nombreuses fois à l'identique, on parle de phénomène périodique. Le son est alors perçu comme stable et sa hauteur (ou fréquence fondamentale) correspond à l’inverse de la durée du cycle élémentaire, appelée période. La fréquence se quantifie en Hertz (Hz). 1 Hz signifie « une fois par seconde ».
La plupart des sons sont de nature "quasi-périodique": ils sont formés de motifs qui se répétent avec de faibles variations et sont remplacés (progressivement ou brutalement) par d'autres.


Exemple de son quasi périodique: on retrouve un motif qui se répète avec de faibles variations (Extrait de Ron Carter & Jim Hall: Summer Nigths, piste droite.

Une note « La médian » correspond à un phénomène qui se répète 440 fois par seconde, soit une fréquence de 440Hz et une période de 1/440 = 0,002273 seconde.

Un son dit « pur » n’est formé que d’une unique fréquence. Dans ce cas précis, la « forme d’onde » est celle d’une fonction sinusoïde :


Son pur à 440 Hz.

Forme d’onde et contenu spectral d'un son

Mais la plupart du temps, un son se compose de plusieurs fréquences. Dans ce cas, la forme d’onde n’est plus celle de la fonction sinusoïde, mais celle résultant de l'ajout de ces différentes fréquences pures. La forme d'onde sera variable en fonction du contenu spectral du son, c'est à dire des amplitudes (et phases) relatives de chaque fréquence.
Voici par exemple le contenu spectral du son pur ci-dessus:


Contenu spectral d'un son pur à 440 Hz.

Un "signal carré" est un son (très dissonnant) formé d'une fréquence fondamentale a laquelle on ajoute ses harmoniques impaires. Une harmonique est une fréquence multiple de la fréquence de base considérée.

Signal carré à 440 Hz et son spectre, sur lequel on observe les pics associés à la présence de chaque fréquence: 440Hz (fondamentale), 1320Hz (harmonique 3), 2200Hz (harmonique 5), 3080Hz (harmonique 7), etc.

Pour un son musical, on retrouve une fréquence fondamentale souvent accompagnée d’une sélection de ses harmoniques paires.

Contenu spectrale d'un extrait musical, dans lequel on retrouve deux fréquences fondamentales (120 et 180Hz) et leurs harmoniques 2 (240=2*120Hz, 360=2*180Hz).

Lorsque l’ensemble des fréquences présentes ne sont pas liées entre elles par des relations harmoniques, le son se rapproche d'un bruit; voici par exemple, le contenu spectral du son d'un sèche-cheveux:

Contenu spectrale du son d'un sèche-cheveux. Les fréquences qui se détachent n'ont pas de relation harmonique.

En langage plus scientifique, un « bruit blanc » est un son dans lequel toutes les fréquences sont globalement présentes au même niveau moyen, alors que leur répartition évolue constamment de façon aléatoire. Il n’y a donc plus du tout de motif répétitif qui émerge de la forme d’onde, la période de la fréquence la plus basse présente tendant vers l’infini.

Forme d'onde et contenu spectral d'un bruit blanc. On ne distingue aucun motif de répétition, toutes les fréquences sont présentes au même niveau (attention à l'échelle verticale 1dB/carreau).

Sons non périodiques (ou transitoires)

Nous avons vu quelques illustrations de formes d’ondes correspondant à des sons stables, c'est-à-dire répétant un motif donné pendant une durée plus ou moins longue. Mais tous les sons ne sont pas de cette nature: on parle alors de son apériodique, ou transitoire. Ainsi les sons résultants d’un choc de deux objets, comme par exemple un claquement de mains:

Forme d'onde d'un claquement de mains.

Un son transitoire est souvent de durée brève car résultant uniquement d’une excitation initiale (choc). Mais un transitoire n'est pas obligatoirement de courte durée: on pourrait considérer qu'un bruit blanc n’est autre qu’un très long transitoire.

Contrairement à ce que pourrait laisser penser leur nature non périodique, les sons transitoires sont également décomposables en fréquences. Il suffit en effet de « tronçonner » la partie intéressante et d’en répéter le motif pour créer artificiellement une périodicité, et donc faire apparaître les fréquences constituantes du signal. Voici le contenu spectral du claquement de mains ci-dessus:

Contenu spectral d'un claquement de mains.

Ainsi les sons transitoires sont également dotés d’un contenu fréquentiel. Très souvent les sons de percussions sont constitués d’un transitoire précédant un régime périodique ou quasi-périodique correspondant aux résonances de l'objet excitées par le choc initial. C'est généralement le cas des sons produits par les instruments de musique, par exemple un fut de batterie:

Forme d'onde d'un tom de batterie. Après le transitoire initial, on voit apparaître un motif pseudo-périodique à 67Hz, correspondant à la résonance du fut.

Enfin tout phénomène ayant un début et une fin donc à priori tout phénomène, peut être vu comme un transitoire selon l'échelle de temps que l'on choisit pour l'observer. D'où l’importance fondamentale du facteur d’échelle (le point de vue) choisit pour observer un phénomène.
Ainsi par exemple un passage musical vu dans son ensemble ne possède généralement pas de structure répétitive; en revanche un zoom sur un instant précis à l'intérieur du morceau fera apparaître la structure répétitive de la (ou des) note(s) jouée(s) à cet instant.

Bande audible

La plage des fréquences possibles pour tout phénomène sonore s’étend théoriquement de 0Hz à l’infini; On la restreint communément aux deux extrémités, les phénomènes de variation de pression de l'air dont la période est inférieure à quelques hertz relevant plutôt de la météorologie, et ceux au-delà de 100KHz étant extrêmement rares et ténus.
En pratique on distingue trois zones principales de fréquences:
  • Infrasons: de 0 à 20 Hertz
  • Bande audible: de 20 à 20KHz
  • Ultrasons : au-delà de 20KHz
la limite des infrasons est parfois donnée à 16Hz. Ces bornes doivent de toutes façon être considérées comme indicatives, étant données les variations inter-individuelles.
La bande audible se définit en effet comme celle accessible à l’organe principal de l’audition: l’oreille. Or la fréquence la plus haute audible varie de 20kHz environ pour un individu jeune, pour descendre progressivement jusqu'à 4kHz ou moins aux âges très avancés.
La perception par l’homme de fréquences hors de cette bande est possible notamment par le biais de la conduction osseuse; Faire le lien avec l’audition sortirait assez loin du cadre de cet article.


Reproduction Audio et Haute-Fidélité

Après ces quelques rappels de base illustrés concernant le son et le son enregistré, concentrons-nous un instant sur la notion de reproduction sonore "Haute-fidélité". Quelle définition pouvons-nous donner à ce terme ?
Comme nous l'avons vu, un microphone est un capteur qui transforme la pression instantanée de l’air sur une membrane en courant électrique; A l’inverse un haut-parleur est un actuateur qui transforme le courant qui le traverse en pression instantanée communiquée à l’air.

Nous voici donc avec un système de reproduction sonore le plus simple possible, qui pourrait ressembler à cela:
Système de reproduction audio le plus simple possible.

Dans ce système le plus simple possible (et donc le plus fidèle ?), voici ce qu'il se passe:
  • le musicien joue dans une salle d'enregistrement,
  • la vibration produite par l'instrument se propage dans la pièce sous forme d'onde sonore,
  • le micro capte la pression de l'air en un point et la convertit en courant électrique,
  • ce courant est transporté par une liaison "la plus fidèle possible" (*) jusqu'au local d'écoute,
  • le haut-parleur converti le courant en vibration transmise à l'air,
  • l'onde sonore émise se propage dans le local d'écoute,
  • pour finalement parvenir aux oreilles de l'auditeur.
(*) En pratique bien évidemment, le courant produit par le micro ne peut alimenter directement un haut-parleur sans être amplifié, et le simple fil sera remplacé avantageusement par un système d'enregistrement / lecture du signal permettant une écoute différée, mais nous reviendrons sur ces détails par la suite, de même que sur la stéréophonie. Pour l'instant la question qui nous intéresse est simple:

Peut-on dans ce cadre le plus simple possible, parler de "fidélité", et à quoi ?
L'auditeur peut-il en fermant les yeux retrouver exactement la sensation auditive du concert comme si il y était ?

Question importante car on nous demande bien souvent d'évaluer le matériel audio par la référence au live: Si la chaîne est bonne, il faudrait retrouver chez soi précisément le son (voire l'émotion ?) de l'instrument entendu au concert.

Or aussi simple soit-il le système de reproduction "idéal" représenté ci-dessus va déjà déformer considérablement l'évènement sonore:
  • le placement du micro, ses caractéristiques de captation (directivité, courbe de réponse) influent considérablement sur le résultat,
  • avant de parvenir au micro, le son s'est propagé dans la salle d'enregistrement et sa réverbération s'y est donc ajoutée,
  • le haut-parleur possède des caractéristiques d'émission (directivité) qui ne correspondent pas à celle de l'instrument réel (et pour cause, on utilise le même hp pour reproduire un piano, une batterie ou un saxophone; or ces instruments ont des champs d'émission spatiale très différents),
  • avant de parvenir aux oreilles de l'auditeur, le son va se propager dans la salle d'écoute et sa réverbération s'y est donc ajoutée.
En réalité ce qu'entendra l'auditeur via ce système simpliste ne ressemble déjà plus du tout à l'évènement original.
Notre chaîne haute-fidélité repose sur les mêmes principes de base et présente donc les mêmes défauts fondamentaux. La stéréophonie améliore la situation en permettant la création d'un relief sonore, mais ne corrige aucune des failles citée hormis dans une application très marginale: la prise de son Charlin écoutée au casque:

Prise de son Charlin écoutée au casque: projection de l'auditeur dans la salle d'enregistrement.

Dans le cas précis de l'écoute d'un enregistrement Charlin au casque, les deux premiers écueils liés à la prise de son sont résolus (au moins théoriquement) par la méthode Charlin puisque le signal stéréo capté par la paire de micros se veut le plus proche possible de ce qu'auraient capté les oreilles d'un auditeur plaçé à cet endroit, tandis que l'écoute au casque tente de corriger les deux derniers écueils liés à la reproduction, en supprimant l'influence de l'acoustique du local d'écoute.

Malheureusement cette approche est restée très marginale car aussi bien la tête artificielle que le couplage casque / oreille apportent leur lot d'imperfections et désagréments.

Dans le cadre d'un système de reproduction stéréophonique utilisant une paire d'enceintes acoustiques, l'immense majorité des prises de son étant effectuées selon des principes bien différents de la tête Charlin, l'ensemble des écueils cités plus haut restent totalement valides.

Pour cette raisons le son reproduit par le système hi-fi et perçu par l'auditeur dans son local d'écoute ne peut pas être une reproduction à l'identique de celui perçu par le spectateur du concert.

Par conséquent la fidélité recherchée dans ce cadre n'est pas et ne peut pas être la stricte fidèlité à l'évènement original (et sans parler des musiques synthétiques ou amplifiées, qui échappent par nature à ce raisonnement). Lorsqu'on vous demande de juger de la qualité d'un maillon hi-fi en vous référant au son du concert, la fausse route est totale !
D'ailleurs le même piano sonnera différemment si écouté à deux endroits différents de la salle de concert; et plus encore s'il est joué dans une salle de 1000 places ou un piano-bar... Comment penser que le son de ce piano pourrait être restitué à l'identique dans notre salon ?

Pourtant on peut parfois dire "qu'on s'y croirait" ! Alors d'ou vient ce paradoxe ?

Proust a illustré que notre cerveau possède cette capacité de nous transporter et de faire revivre certaines émotions passées, par la re-création d'une sensation, même de manière très imparfaite. C'est précisément ce mécanisme psychique qui est à l'oeuvre pour nous donner l'illusion d'être au concert devant l'instrument alors que nous en écoutons une reproduction considérablement déformée.
De la même façon qu'en littérature,

"L’illusion romanesque, c’est ce fragile phénomène qui fait que, tout en lisant, nous vivons la vie racontée par le texte. Nous voyons ce qui est décrit (et même ce qui ne l’est pas), nous sentons les odeurs, nous aimons ce qui nous est donné pour aimable, et vice-versa. Le temps du livre, nous sommes le livre."

on pourrait définir l'illusion audiophile qui nous permet de percevoir l'instant musical et parfois même à travers une image très déformée, nous entraîne vers la sensation de vivre le moment avec les artistes.

Mais l'image sonore reproduite n'est pas, à l'instar de la phrase littéraire, une copie conforme de l'évènement.
C'est d'ailleurs particulièrement clair lorsqu'on s'intéresse aux techniques de prise de son et de production, dont le but n'est pas tant de capter le son de l'instrument tel qu'il est lors de l'évènement, mais de le capter de façon à pouvoir en présenter à l'auditeur une image la plus esthétique (clarté, détail, équilibre...) possible lorsqu'elle sera reproduite sur son système.
Ainsi le son enregistré et reproduit dans de bonnes conditions sera bien souvent meilleur que celui pouvant être écouté au concert:
Le micro placé à proximité immédiate de l'instrument en captera tous les détails, imperceptibles même depuis le premier rang... le micro placé sur la table d'harmonie d'une guitare fera ressortir le claquement des doigts sur le bois, inaudibles sinon... Le type et le placement du ou des micros ont autant sinon plus d'influence sur le timbre de l'instrument que le modèle d'enceinte qui en reproduira l'enregistrement !

Le travail de prise de son et de mastering ont une importance capitale pour la production d'enregistrements dont la qualité première n'est pas la fidélité absolue à l'évènement initial mais la capacité à en faire ressortir les aspects souhaités (voire en masquer certains non désirés) dans une esthétique sonore spécifique adaptée à la reproduction stéréophonique.

De quelle "haute-fidélité" doit-on alors parler ?
Une fois l'enregistrement parvenu chez l'auditeur, il ne reste qu'a l'écouter et c'est à ce niveau là seulement que nous pouvons poser une définition de la fidélité:

La chaîne "Haute fidélité" doit être fidèle à l'enregistrement... c'est à dire restituer l'enregistrement à l'auditeur en le déformant le moins possible.

Pour aller plus loin dans notre analyse il nous faut donc tenter caractériser les déformations induites par la reproduction d'un enregistrement.
Pour cela schématisons notre chaîne hi-fi intégrée dans son environnement incluant l'enregistrement à reproduire jusqu'à l'auditeur:

Schéma fonctionnel de l'écoute audiophile.

Les processus qui s'y déroulent appartiennent à 3 domaines:
  • Électroacoustique: domaine ou le son est traité en temps que signal électrique encodé de façon analogique et/ou numérique;
    Il s'agit de lire le support contenant l'enregistrement (généralement numérique de nos jours), le décoder, le filtrer, le convertir en courant électrique, l'amplifier, pour finalement générer une pression acoustique par le biais de transducteurs (haut-parleurs);
  • Acoustique: le son y existe sous forme d'onde sonore se propageant dans l'air; Le son émis par les haut-parleurs se propage dans la pièce d'écoute, y est réfléchi, diffusé, absorbé, avant de parvenir aux oreilles de l'auditeur;
  • Psychoacoustique: domaine qui relie les sons à la sensation auditive. Le son pénètre les pavillons auriculaires puis les différents organes internes de l'oreille, qui le transforme en stimuli nerveux, pour au final donner naissance à une sensation auditive.
    Mais nos sens sont interdépendants et d'autres perceptions notamment visuelle ou tactile interfèrent dans ce processus, tout comme notre vécu préalable: connaissance de l'oeuvre écoutée, de l'environnement d'écoute (auquel appartiennent en particulier le système audio et le local);

Nous allons donc nous intéresser à ces 3 domaines, pour tenter d'identifier les déformations apportées à l'enregistrement lors du processus de reproduction (bien qu'étant plutôt en marge de ce processus, le domaine de la psychoacoustique est essentiel pour cerner l'importance des déformations et notamment pour définir correctement la notion d'audibilité).


Électroacoustique

Les appareils audio que nous utilisons ont tous ou presque une structure identique: Ils reçoivent un signal d’entrée, et en dérivent une sortie. Un appareil stéréophonique peut la plupart du temps être logiquement vu comme un couple d’appareils monophoniques agissant sur deux canaux gauche et droit indépendants (avec quelques rares exceptions). On se restreindra donc dans la suite à des considérations « monophoniques ».
Schématiquement, un système de reproduction sonore est une chaîne d'appareils reliés en série et effectuant chacun une transformation T du signal e à son entrée, pour former sa sortie s; On le note:

s = T(e)

La fonction T est appelée Fonction caractéristique du système.

Systèmes Linéaires et Invariants

Un système est dit Linéaire lorsque sa sortie est proportionnelle à son entrée, ce qu'on décrit par deux équations:

T(k*e) = k*T(e)
Lorsqu'on multiplie l'entrée d'un système linéaire par une constante, sa sortie est également multipliée par la même constante.

T(e1 + e2) = T(e1) + T(e2)
Lorsque l'entrée d'un système linéaire est composée de la somme de deux signaux, la sortie du système est la somme des sorties qu'il prendrait si chacun des signaux lui était appliqué indépendamment.

En réalité, les signaux évoluant dans le temps leurs valeurs ne sont pas de simples grandeurs mais des fonctions du temps, c'est à dire que l'on devrait noter e[t] plutôt que e, s[t] plutôt que s.

Un système est dit Invariant lorsque sa sortie est identique lorsqu'on translate son entrée dans le temps, autrement dit:

T(e[t])[t] = T(e[t + t0])[t + t0]
Ou encore: les caractéristiques d'un système invariant ne dépendent pas de l'instant ou il est sollicité, ni du signal qu'on lui injecte. C'est donc un système dépourvu de mémoire, dont le comportement est entièrement déterminé par le signal qu'on lui applique.

Une caractéristique fondamentale des ondes sonores est qu'en un point de l'espace elles s'ajoutent mathématiquement: Imaginons un micro positionné en un point de l'espace et entouré de deux instruments, un violon et un piano.
Lorsque le piano joue seul, le micro génère un signal p(t).
Lorsque le violon joue seul, le micro génère un signal v(t).
On constate que, si l'on demande au violon et au piano de jouer ensemble, le micro génère le signal p(t) + v(t).

Addition de signaux sonores.

L'addition des pressions acoustiques correspond à l'addition des signaux électriques. Autrement dit, le phénomène sonore tel que capté par un micro (ou par l'audition car notre oreille est également un capteur de pression en point de l'espace) se comporte comme un système linéaire (et invariant).

Par conséquent pour qu'un appareil audio soit fidèle, il doit également se comporter comme tel !
Si ce n'est pas le cas notre appareil auditif le détecte en ne pouvant plus comprendre le son comme un phénomène sonore "naturel": le son apparaît "distordu".
De la même façon, le son d’un orchestre est la somme des sons de chacun de ses instruments: les pressions acoustiques générées en un même point de l’espace par les ondes sonores issues de plusieurs instruments s’ajoutent algébriquement. C’est ce qui nous permet de reconnaître à chacun leur son particulier au sein de la masse orchestrale.

Notons immédiatement qu’un système linéaire n’est pas forcément un système dont la sortie est une simple multiplication de son entrée par un facteur de gain constant. Certaines déformations du signal restent donc des phénomènes linéaires. Ainsi par exemple l'atténuation selon la distance de propagation du son dans l'air est plus forte pour les fréquences aiguës par rapport aux graves; le timbre d'un instrument varie donc avec sa distance à l'auditeur;
La présence d'une paroi sur laquelle le son se réfléchit ajoute un écho au signal; Mais ces phénomènes restent linéaires.
Un système peut donc déformer considérablement son entrée tout en restant strictement linéaire !
Le terme "Système Linéaire" ne doit pas être confondu avec une courbe de réponse en forme de droite horizontale.


Bande passante et réponse en fréquence

En effet, tout système « réel » non idéal possède une bande passante, c'est-à-dire que les fréquences en entrée situées en dehors de cette bande se retrouvent fortement atténuées en sortie. C'est le cas par exemple d'un amplificateur:

Exemple de courbe de réponse d'un amplificateur (fictif).

La Bande Passante est définie comme l'intervalle de fréquences dans lequel l'atténuation ne dépasse pas 3dB par rapport au niveau nominal de la réponse. Dans l'exemple ci-dessus, elle de [18Hz, 20kHz].

Principe de superposition

Nous savons maintenant ce qu’est un système linéaire, nous allons voir que ce concept est fondamental dès lors que l'on souhaite étudier et caractériser le comportement d'un tel système.
La propriété fondamentale d'un système linéaire et invariant s'appelle le principe de superposition:

La réponse d’un système linéaire à un signal d’entrée composée d'une somme de signaux est la somme des réponses du système à chacun de ces signaux.

Cette propriété est très importante car elle permet d'étudier facilement un système en étudiant sa réponse à des signaux élémentaires.
En effet si nous savons décomposer un signal quelconque en signaux élémentaires, il suffira de connaître la réponse du système à chacun de ces signaux élémentaire, pour ensuite être capable de reconstituer la réponse au signal initial par simple recomposition.
Or, nous avons vu précédemment qu'un signal audio se compose d'une somme de fréquences pures (pour approfondir:
Analyse spectrale sur Wikipédia), c'est dire qu'il peut s'écrire sous la forme d'une somme de fonction sinus (d'autres décompositions existent).

Ainsi, si nous connaissons la réponse d'un système linéaire lorsqu'un signal sinus lui est appliqué en entrée pour toutes les fréquences, nous pouvons prédire son comportement lorsqu'un signal quelconque lui est appliqué en entrée.

Systèmes réels, systèmes linéaires

Bien évidemment, aucun système « réel » n’est idéalement linéaire ni invariant. Dans la réalité le comportement d'un système physique peut se rapprocher de la linéarité dans sa plage de fonctionnement nominal, et s'en écarter franchement en dehors de cette plage; C'est le cas par exemple pour un amplificateur audio qui au delà d'une certaine puissance va saturer, ou pour un ressort qui au delà d'un certain étirement va se rompre.
Pour ce qui nous concerne, on s'intéresse bien sûr au comportement d'un système audio utilisé dans sa plage de fonctionnement nominal. L'écart par rapport à un comportement linéaire est alors caractérisé par les distorsions non-linéaires, dont il existe trois types:
  • Le bruit: c'est le signal existant en sortie du système lorsque l'entrée est à zéro;
  • La distorsion harmonique (DH): c'est le fait d'ajouter des nouvelles fréquences harmoniques de celles présentes dans le signal d'entrée;
  • La distorsion d'intermodulation (DIM): c'est le fait d'ajouter de nouvelles fréquences combinaisons de celles présentes dans le signal d'entrée.

Pour un maillon audio, on peut dire que l'écart par rapport à l'idéal de linéarité est caractérisé par les quantités de ces trois types de distorsions présentes dans le signal de sortie.

Lorsque ces distorsions sont très faibles, ont peut donc dire que le comportement du système est linéaire et par conséquent entièrement déterminé par sa réponse aux fréquences pures.
C'est précisément l'essence de la démarche de caractérisation par la mesure: en mesurant la réponse d'un système lorsque lui sont appliqués un ensemble de signaux tests bien choisis, on détermine si son comportement est linéaire ou non; et si c'est le cas (distorsions non-linéaires faibles), on le caractérise alors parfaitement.


Systèmes à phase minimale

On dit qu'un système linéaire est à phase minimale lorsqu'il restitue l'énergie du signal entrant de façon concentrée, c'est à dire lorsque sa réponse impulsionnelle est "ramassée" dans un petit intervalle temporel.
Si la véritable définition est beaucoup plus technique mais très peu intuitive, celle ci-dessus permet de comprendre et d'illustrer l'intérêt de la notion à travers des exemples:

Réponse impulsionnelle d'un système à phase non minimale: une pièce d'écoute. L'impulsion initiale est suivie de nombreuses réflexions.

Réponse impulsionnelle et réponse en fréquence d'un système à phase presque minimale: une carte son "basique" rebouclée sur elle-même. L'impulsion initiale est suivie de quelques réflexions dont la bande passante est supérieure à 10kHz.
Sur la réponse en fréquence visible à droite, on voit que la réponse en phase se confond avec la phase minimale calculée en dessous de 8kHz, et s'en écarte au delà.

En audio la notion de phase minimale correspond à l'absence de réflexions ou de décomposition / recomposition du signal: Un lecteur CD ou un amplificateur sont des systèmes à phase minimale, par contre une pièce d'écoute ne l'est pas, de même qu'une enceinte multi-voies filtrée.

L'intérêt de la notion réside dans les deux propriétés fondamentales suivantes:
  • Un système à phase minimale est inversible, c'est à dire qu'on peut retrouver exactement le signal d'entrée par une transformation inverse;
  • Le comportement d'un système à phase minimale est entièrement déterminé par sa réponse en amplitude, autrement dit la phase se déduit de l'amplitude (et vice-versa).
La notion de système à phase minimale n'est pas "absolue", beaucoup de système se rapprochent d'un comportement à phase minimale sans l'être parfaitement, ou le sont sur une certaine plage de fréquence seulement (cas d'un haut-parleur par exemple).

La grande majorité des systèmes électroniques analogiques ou numériques utilisés en audio grand public ont un comportement à phase minimale (sauf lorsque le but est explicitement autre, comme une réverbération par exemple) sur la totalité du spectre audible.

Par conséquent on peut dire qu'un maillon audio présentant très peu de distorsions non-linéaires est entièrement caractérisé par sa réponse en fréquence.


Acoustique

Ce sujet sera prochainement traité dans un article spécifique.


Psychoacoustique

Ce sujet sera prochainement traité dans un article spécifique.