AI Studiospar businessdynamite
← Blog
ia-video12 mars 2026· 18 min de lecture

Nettoyer et masteriser un son de mauvaise qualité (podcasts, interviews)

Réduction de bruit, normalisation et léger mastering pour podcasts et interviews avec l'IA : outils et workflow sans être ingé son.

Partager :

Tu as enregistré un podcast ou une interview. La prise est correcte, mais il y a du bruit de fond, des souffles, un niveau inégal entre les interlocuteurs. En post-production classique, tu passes par des plugins de réduction de bruit, un compresseur, un limiteur. Avec l'IA, des outils comme Veed, Descript ou Adobe Enhance font une grande partie du travail en un clic : réduction de bruit, normalisation, parfois séparation voix / bruit. Ce guide explique quoi faire, avec quoi, et ce qu'il ne faut pas attendre de l'IA. Pour le cadre général, améliorer un mauvais enregistrement avec l'IA et Veed pour le nettoyage audio posent les bases ; ici on se concentre sur podcasts et interviews (plusieurs voix, longue durée).

Les trois étapes : nettoyage, équilibrage, mastering léger

ÉtapeObjectifOutils type
NettoyageRéduire bruit de fond, souffles, grésillementsVeed, Descript, Adobe Enhance, Auphonic
ÉquilibrageNiveaux homogènes entre les voix, pas de picNormalisation, compression douce
Mastering légerVolume global cohérent, pas de clippingLimiteur, export -1 dB à -3 dB de marge

Tu n'as pas besoin d'être ingé son. Les outils IA proposent des presets (podcast, interview, voix seule). Tu lances, tu écoutes, tu ajustes un ou deux curseurs si besoin. Pour l'audio comme complément de la vidéo, la même logique s'applique : une piste propre avant de monter.

Comprendre chaque étape en détail

Le nettoyage consiste à isoler la voix et réduire tout ce qui n'est pas de la parole : ventilateur, climatisation, bruit de rue, souffle du micro, grésillements électriques. L'IA analyse le spectre audio, identifie les fréquences « parasites » constantes, et les atténue. Le résultat dépend de la qualité de l'enregistrement original. Un bruit de fond constant (ventilateur) se retire bien. Un bruit ponctuel (klaxon, porte qui claque) est plus difficile à éliminer proprement.

L'équilibrage uniformise les niveaux entre les différentes parties de l'enregistrement. Si un invité parle plus fort qu'un autre, ou si tu parles plus bas au début qu'à la fin, l'équilibrage corrige ces écarts. Les outils utilisent la compression (réduire les écarts entre fort et faible) et la normalisation (ramener le niveau moyen à une cible).

Le mastering léger prépare le fichier pour la diffusion. Il s'agit d'atteindre le volume standard des plateformes (Spotify, Apple Podcasts, YouTube) sans distorsion. Un limiteur empêche les pics de dépasser 0 dB (ce qui causerait du clipping), et la normalisation LUFS garantit un niveau perçu cohérent.

Types de problèmes audio et solutions

Avant de lancer un outil, identifie le type de problème que tu as :

ProblèmeDescriptionSolution IADifficulté
Bruit de fond constantVentilateur, climatisation, souffleRéduction de bruit standardFacile
Souffle de microBruit « fff » au niveau du microRéduction de bruit + gateFacile
Écho / réverbérationPièce trop réverbéranteDereverb (Descript, iZotope)Moyen
Plosives« P » et « B » qui saturentDe-plosive ou EQ basse fréquenceMoyen
Sibilance« S » trop aigusDe-esserMoyen
Niveaux déséquilibrésUn invité fort, l'autre faibleNormalisation par pisteFacile
Clipping / saturationAudio qui a saturé à l'enregistrementDeclipping (résultat partiel)Difficile
Bruits ponctuelsKlaxon, toux, téléphoneÉdition manuelle ou outil spécialiséDifficile

Ce que l'IA fait bien

Bruit constant : Les outils IA excellent à retirer les bruits de fond constants (ventilateur, climatisation, souffle). Ils analysent quelques secondes de « silence » (où seul le bruit est présent) et soustraient ce profil du reste de l'audio.

Normalisation automatique : L'IA détecte les passages parlés et ajuste le niveau pour qu'ils soient tous à la même intensité perçue.

Amélioration de la clarté : Certains outils (Adobe Enhance) rehaussent les fréquences de la voix pour la rendre plus intelligible.

Ce que l'IA fait mal (ou pas du tout)

Audio très dégradé : Si l'enregistrement original est saturé, étouffé, ou avec un bruit plus fort que la voix, l'IA ne fera pas de miracles. Tu auras au mieux un résultat « moins pire ».

Bruits ponctuels complexes : Une porte qui claque, un chien qui aboie, un téléphone qui sonne, ces bruits se superposent aux fréquences de la voix. L'IA peut les atténuer mais rarement les supprimer complètement sans affecter la voix.

Réverbération forte : Une pièce très réverbérante (salle de bain, hall) donne un son « éloigné ». Les outils de dereverb améliorent la situation, mais ne la résolvent pas totalement.

Workflow type : podcast ou interview 1 h

1. Importer l'audio (ou la vidéo)

Ouvre Veed, Descript ou Auphonic. Importe ton fichier (WAV, MP3 ou vidéo). L'outil va analyser la piste (voix, bruit). Selon l'outil, tu choisis un mode : « Podcast », « Interview », « Voice only ».

Conseil : Importe en qualité maximale. Si tu as enregistré en WAV, garde le WAV. Les conversions successives dégradent le son.

2. Lancer le nettoyage IA

Active « Reduce noise », « Clean audio » ou « Enhance speech ». L'IA isole la voix et réduit le bruit de fond (ventilateur, rue, réverb). Réglage conseillé : ne pousse pas le curseur au maximum. Un nettoyage trop agressif donne un effet robot ou sous l'eau. Reste à 60–80 % et écoute. Pour Descript et le montage par texte, tu peux enchaîner avec la suppression des silences après le nettoyage.

Technique du « test rapide » : Avant de traiter tout le fichier, applique le nettoyage sur un extrait de 30 secondes représentatif. Écoute attentivement. Ajuste les réglages. Une fois satisfait, applique à l'ensemble.

3. Équilibrer les niveaux entre interlocuteurs

Si tu as plusieurs voix avec des niveaux différents, deux approches :

Pistes séparées (recommandé) : Si tu as enregistré chaque personne sur une piste distincte (micro séparé), normalise chaque piste indépendamment à la même cible (ex. -16 LUFS).

Piste unique : Si tout est sur une seule piste, utilise un compresseur avec un ratio modéré (3:1 à 4:1), un seuil bas (pour capturer les passages faibles), et un attack/release moyen. Certains outils (Auphonic) font cela automatiquement.

4. Normaliser et limiter (mastering léger)

Normalisation : ramener le volume moyen à un niveau cible (ex. -16 LUFS pour le podcast, -14 pour YouTube). Limiteur : éviter les pics qui dépassent 0 dB. Beaucoup d'outils (Veed, Auphonic, Descript) proposent un preset « Podcast » ou « Loudness » qui fait les deux. Tu exportes en WAV ou MP3 (320 kbps pour le podcast). Pour un workflow post-production vidéo, tu peux aussi faire cette étape dans DaVinci Resolve après import de la piste nettoyée.

Un son « masterisé » ne veut pas dire « compressé à mort ». Garde de la dynamique. L'objectif est d'être écoutable partout (casque, voiture, téléphone), pas d'être le plus fort possible.

5. Contrôle qualité final

Avant d'exporter définitivement :

Écoute complète (ou échantillonnée) : Si le fichier fait 1 h, écoute au moins le début (5 min), le milieu (5 min), et la fin (5 min). Cherche les artefacts, les passages trop faibles ou trop forts.

Test multi-support : Écoute sur casque, sur enceinte, sur téléphone. Le son doit être clair dans toutes les situations.

Vérification des niveaux : Utilise un meter LUFS pour confirmer que tu es dans la cible (-16 LUFS pour podcast, -14 LUFS pour YouTube).

Workflow détaillé par outil

Workflow avec Veed

  1. Importer : Glisse ton fichier audio ou vidéo dans l'interface Veed
  2. Activer Clean Audio : Dans les paramètres audio, active « Clean Audio » ou « Remove Background Noise »
  3. Ajuster l'intensité : Un curseur permet de régler la force du nettoyage. Commence à 50-70%
  4. Prévisualiser : Écoute un extrait avant d'appliquer à tout le fichier
  5. Exporter : Choisis MP3 ou WAV, qualité haute

Avantage Veed : Interface simple, combine nettoyage audio et sous-titrage dans le même outil.

Workflow avec Descript

  1. Créer un projet : Importe ton fichier audio ou vidéo
  2. Transcription automatique : Descript transcrit automatiquement (utile pour éditer par texte)
  3. Studio Sound : Active « Studio Sound » pour le nettoyage IA
  4. Ajuster par section : Tu peux appliquer des réglages différents à des sections spécifiques
  5. Filler word removal : Optionnellement, supprime les « euh », « hum » automatiquement
  6. Exporter : WAV ou MP3 haute qualité

Avantage Descript : Édition par transcription, suppression des fillers, excellent pour les podcasts où tu veux aussi éditer le contenu.

Workflow avec Auphonic

1. Uploader le fichier : Via l'interface web ou l'API 2. Choisir un preset : « Podcast », « Loudness normalization », etc. 3. Paramétrer : Cible LUFS, réduction de bruit (auto ou manuelle), multitrack si plusieurs pistes 4. Lancer le traitement : Auphonic traite le fichier (généralement plus rapide que le temps réel) 5. Télécharger : Récupère le fichier traité

Avantage Auphonic : Spécialisé podcast, presets précis pour Spotify/Apple, traitement par lot.

Workflow avec Adobe Podcast Enhance

  1. Accéder à l'outil : Via Adobe Podcast (gratuit pour les fichiers courts)
  2. Uploader : Glisse ton fichier
  3. Traitement automatique : L'IA améliore la clarté vocale et réduit le bruit
  4. Télécharger : Récupère le fichier amélioré

Avantage Adobe : Très simple, un seul clic, bon pour les tests rapides. Limité en durée pour la version gratuite.

Outils adaptés podcasts et interviews

OutilNettoyage IANormalisation / LUFSLongueurPrixMeilleur pour
VeedOuiOui (preset)Selon aboFreemiumVidéo + sous-titres + audio
DescriptOuiOuiProjet illimité (selon abo)AboÉdition par transcription
Adobe EnhanceOui (voix)PartielFichier par fichierAdobeTests rapides, fichiers courts
AuphonicOuiOui (LUFS podcast)Illimité (quotas)FreemiumPodcast pro, traitement par lot
iZotope RXOui (avancé)OuiIllimitéPayantRestauration professionnelle
CleanvoiceOuiOuiSelon aboFreemiumSuppression des fillers

Pour des interviews longues (1 h+), Auphonic ou Descript sont souvent plus adaptés (traitement par lot, pas de limite stricte par fichier). Pour des sous-titres et nettoyage dans le même outil, Veed est pratique si ta sortie est une vidéo.

Réglages techniques recommandés

Cibles LUFS par plateforme

PlateformeLUFS recommandéTrue Peak max
Spotify-14 LUFS-1 dB
Apple Podcasts-16 LUFS-1 dB
YouTube-14 LUFS-1 dB
Amazon Music-14 LUFS-2 dB
Standard podcast-16 LUFS-1 dB

Pourquoi ces valeurs ? Les plateformes normalisent automatiquement le volume. Si ton fichier est trop fort (-8 LUFS), il sera baissé. S'il est trop faible (-24 LUFS), il sera monté (mais le bruit de fond aussi). Viser la cible native évite ces ajustements.

Réglages de compression recommandés

Pour un podcast ou une interview, une compression douce suffit :

ParamètreValeur recommandée
Ratio2:1 à 4:1
Threshold-20 dB à -12 dB
Attack10–30 ms
Release100–300 ms
Makeup gainAjuster pour compenser

L'objectif est de réduire les écarts sans écraser la dynamique. Une voix trop compressée sonne « plate » et fatigante à écouter.

Fréquences clés pour la voix

Si tu fais de l'EQ manuel :

FréquenceActionRaison
< 80 HzCouper (high-pass)Rumbles, bruits de manipulation
100–250 HzAtténuer si besoinRéduire le « boom » sur certaines voix
1–4 kHzBooster légèrementPrésence, intelligibilité
6–10 kHzBooster légèrementClarté, air
> 12 kHzAtténuer si sibilantRéduire les « S » agressifs

Ce que les débutants font mal

Nettoyage trop fort. Ils mettent la réduction de bruit à 100 %. La voix devient métallique ou étouffée. Correction : 60–80 % max, puis écoute. Mieux vaut un peu de bruit résiduel qu'une voix dénaturée.

Ignorer les niveaux entre interlocuteurs. L'un est fort, l'autre faible. Correction : Normalisation par piste si tu as plusieurs pistes (un par invité). Sinon, utiliser un compresseur doux ou un outil qui « égalise » les niveaux (certains presets « Interview » le font).

Exporter en trop basse qualité. MP3 128 kbps pour un podcast, ça se dégrade à l'écoute. Correction : Export MP3 256 ou 320 kbps, ou WAV pour l'archive. Pour la diffusion podcast, 128–192 kbps peut suffire selon les plateformes, mais 256 donne une marge.

Ne pas écouter le résultat. Ils lancent le traitement et publient sans réécouter. Correction : Écoute au moins un extrait (début, milieu, fin) sur casque et sur enceinte (ou téléphone) pour vérifier qu'il n'y a pas d'artefacts.

Traiter tout en une seule passe. Appliquer nettoyage + compression + EQ + normalisation en un seul effet. Correction : Traite par étapes. D'abord le nettoyage, puis l'équilibrage, puis le mastering. Tu contrôles mieux le résultat.

Oublier le high-pass filter. Les rumbles basse fréquence (inaudibles sur de petites enceintes) consomment du headroom et peuvent causer des problèmes. Correction : Applique un high-pass à 80 Hz systématiquement sur les voix.

Négliger l'environnement d'écoute. Mixer sur des enceintes d'ordinateur ou dans une pièce très réverbérante fausse ton jugement. Correction : Utilise un casque fermé de qualité pour l'écoute critique.

ErreurConséquenceSolution
Nettoyage à 100 %Voix robot, étoufféeRester à 60–80 %, écouter
Niveaux déséquilibrésUn invité inaudibleNormalisation par piste ou preset Interview
Export basse qualitéSon dégradéMP3 256–320 kbps ou WAV
Pas d'écoute finaleArtefacts, erreursRéécouter extraits début / milieu / fin
Tout en une passeRésultat imprévisibleTraiter par étapes
Pas de high-passRumbles, headroom perduHigh-pass à 80 Hz sur les voix

Avant / après nettoyage et niveau

Cas particuliers et solutions

Interview à distance (Zoom, Meet, Skype)

Les appels vidéo compressent l'audio et ajoutent souvent des artefacts. Conseils :

Avant l'enregistrement : Demande à chaque participant d'enregistrer localement avec un logiciel comme Audacity ou QuickTime. Tu récupères les fichiers locaux de meilleure qualité après l'appel.

Après l'enregistrement : Si tu n'as que l'audio Zoom, utilise un outil comme Adobe Enhance ou Descript. Le gain sera limité car l'audio est déjà dégradé par la compression.

Outil dédié : Riverside.fm, Zencastr enregistrent chaque participant en local et synchronisent automatiquement.

Enregistrement en extérieur (vent, trafic)

Le vent est particulièrement difficile à traiter en post :

Prévention : Utilise une bonnette (deadcat) sur le micro. C'est la solution la plus efficace.

Post-production : Un high-pass agressif (jusqu'à 150-200 Hz) peut réduire le vent, mais affecte aussi les basses de la voix. Certains outils (iZotope RX) ont un « De-wind » dédié.

Enregistrement avec écho (grande pièce)

L'écho (réverbération) est difficile à retirer complètement :

Prévention : Enregistre dans une pièce meublée (tapis, rideaux, canapé). Évite les pièces vides ou carrelées.

Post-production : Utilise un outil de dereverb (Descript, iZotope RX). Le résultat est souvent un compromis : moins d'écho mais une voix légèrement altérée.

Plusieurs personnes sur un seul micro

Si deux personnes parlent dans le même micro, les niveaux seront inégaux selon la distance :

Solution 1 : Demande aux participants de rester à distance égale du micro.

Solution 2 : En post, utilise un compresseur plus agressif pour uniformiser, puis normalise.

Solution idéale : Un micro par personne, pistes séparées.

Foire aux questions

Quelle cible LUFS pour un podcast ?

Souvent -16 LUFS (Spotify, Apple Podcasts) ou -14 LUFS (YouTube). Vérifie les recommandations de ta plateforme. Les outils comme Auphonic proposent des presets « Podcast » qui appliquent la bonne cible.

L'IA peut-elle séparer deux voix qui parlent en même temps ?

Partiellement. Certains outils (Descript, Adobe) peuvent isoler une voix dans un mix. Pour séparer deux voix qui se chevauchent sans perte, c'est encore limité. Mieux vaut éviter les dialogues qui se coupent à la prise de son.

Combien de temps pour nettoyer 1 h d'interview ?

Avec un outil IA (Veed, Descript, Auphonic) : 5 à 15 min (import, réglages, export). Le traitement lui-même est souvent plus rapide que la durée du fichier (temps réel ou moins). Sans IA (plugins manuels), compte 1 à 2 h pour un débutant.

Le nettoyage dégrade-t-il la voix ?

Si tu restes sur des réglages modérés, non. Si tu pousses trop la réduction de bruit, la voix peut perdre des harmoniques (son « plat ») ou prendre un effet de phasing. Toujours écouter avant de valider.

Quelle différence entre normalisation et compression ?

La normalisation ajuste le volume global pour atteindre une cible (ex. -16 LUFS). La compression réduit l'écart entre les passages forts et faibles. Les deux sont complémentaires : compresse d'abord pour uniformiser, puis normalise pour atteindre le niveau cible.

Faut-il traiter chaque épisode individuellement ?

Oui. Chaque enregistrement a ses propres caractéristiques (niveau de bruit, équilibre des voix). Les réglages qui fonctionnent pour un épisode peuvent être inadaptés pour un autre.

Puis-je automatiser le traitement pour gagner du temps ?

Oui. Auphonic propose des presets sauvegardés et un traitement par lot. Descript permet de créer des templates. Tu peux ainsi appliquer les mêmes réglages de base à chaque épisode, puis ajuster si nécessaire.

Quel format d'export pour les plateformes podcast ?

MP3 est le standard pour la diffusion (128-320 kbps selon la plateforme). Garde un export WAV comme archive avant compression. Pour YouTube, MP4 ou WAV intégré à la vidéo.

Comment gérer les silences dans un podcast ?

Les silences sont normaux en conversation. Ne les supprime pas tous. Un silence de 1-2 secondes entre les phrases est naturel. Par contre, des silences de 5+ secondes peuvent être raccourcis. Descript permet de supprimer automatiquement les silences longs.

Réglages de réduction de bruit et LUFS

Prompt: Cinematic stills, cinema photography, mixing console faders and LUFS meter on dark surface, soft light, shallow depth of field, natural film grain, moody volumetric lighting, professional cinema photography, pure black background. No futuristic UI, no holograms, no 3D render, no plastic AI look. --ar 16:9

Puis-je faire ça dans mon logiciel de montage ?

Oui. DaVinci Resolve et Premiere ont des effets de réduction de bruit et de normalisation. Pour un workflow tout-en-un (montage + sous-titres + nettoyage), Veed ou Descript peuvent suffire sans passer par un DAW.

Quelle est la limite de l'IA pour le nettoyage audio ?

L'IA ne peut pas créer d'information qui n'existe pas. Si l'enregistrement original est saturé ou si le bruit couvre complètement la voix, même la meilleure IA ne pourra pas récupérer un son propre. La qualité de l'enregistrement original reste déterminante.

Dois-je investir dans du matériel ou l'IA suffit ?

L'IA est un filet de sécurité, pas une solution de remplacement. Un bon micro (100-200€) et un environnement calme donneront de meilleurs résultats bruts que n'importe quel outil IA sur un enregistrement médiocre. Investis dans le matériel, utilise l'IA pour peaufiner.

Checklist avant publication

Avant de publier ton podcast ou ton interview :

  • Nettoyage : Bruit de fond réduit sans artefacts
  • Niveaux : Tous les interlocuteurs au même volume perçu
  • LUFS : Niveau conforme à la plateforme cible (-16 ou -14)
  • True Peak : Pas de dépassement (max -1 dB)
  • High-pass : Appliqué à 80 Hz minimum
  • Écoute casque : Pas d'artefacts audibles
  • Écoute enceinte/téléphone : Son clair dans toutes les conditions
  • Format : MP3 256-320 kbps ou WAV selon la plateforme
  • Métadonnées : Titre, artiste, album renseignés (pour les plateformes podcast)

Ressource externe : Auphonic (nofollow), mastering audio pour podcasts.

Frank Houbre - expert IA vidéo et Image

Frank Houbre - expert IA vidéo et Image

Frank Houbre est un expert en IA vidéo et image, artiste IA et filmmaker récompensé aux Seoul International AI Film Festival et aux Mondial Chroma Awards. Avec plus de 10 ans d'expérience en entrepreneuriat digital, il crée des courts-métrages et animés entièrement générés par IA (Midjourney, Kling, Adobe Firefly). Co-Fondateur de Screenweaver et de la communauté #AIStudios, il partage des tutoriels gratuits et avis d'outils sur Business Dynamite pour aider les créateurs à automatiser leur production.

Continuer la lecture