Transformer un script ChatGPT en storyboard visuel automatique
Workflow pour passer d'un script ou d'un synopsis à un storyboard d'images générées en IA : prompts par scène, cohérence, export.

Tu as un script ou un synopsis. Tu veux le voir en images avant de lancer la génération vidéo. Un storyboard visuel automatique, c'est possible : ChatGPT (ou un LLM) pour décomposer le script en scènes et rédiger des prompts, puis un générateur d'images pour produire une planche par scène. Ce guide détaillé couvre le workflow complet (script, découpage, prompts, génération, export), les techniques avancées de cohérence visuelle, l'automatisation, et tous les pièges à éviter pour un résultat professionnel.
Pourquoi créer un storyboard visuel avec l'IA
Avant de plonger dans le workflow, comprendre les avantages d'un storyboard généré par IA t'aidera à optimiser ton processus créatif.
Visualisation rapide des idées : Passer d'un texte abstrait à des images concrètes en quelques minutes permet de valider ton concept avant d'investir du temps en production. Tu identifies les problèmes de narration, les incohérences visuelles ou les transitions bancales dès le départ.
Communication avec l'équipe ou le client : Un storyboard visuel parle mieux qu'un script. Que tu travailles avec un monteur, un réalisateur, ou un client non technique, les images transmettent l'intention créative instantanément.
Base pour la génération vidéo IA : Les générateurs vidéo comme Runway, Pika ou Sora fonctionnent mieux avec une référence visuelle claire. Ton storyboard devient le blueprint pour chaque plan généré.
Itération sans coût : Contrairement à un storyboard dessiné à la main ou commandé à un artiste, tu peux régénérer, modifier, et expérimenter autant que nécessaire sans budget supplémentaire.
Principe du workflow complet
Le workflow se décompose en quatre phases distinctes, chacune avec ses outils et bonnes pratiques.
Phase 1 : Préparation du script Entrée : un script ou un synopsis (même court). Tu nettoies le texte, identifies les moments visuels clés, et structures la narration en segments logiques. Un script de 30 secondes peut donner 5 à 8 plans, un script d'une minute 10 à 15 plans.
Phase 2 : Découpage et génération de prompts Tu soumets le script à ChatGPT avec des instructions précises. Le LLM décompose le texte en scènes ou plans (titre + description visuelle en 1–2 phrases). Pour chaque plan, il rédige un prompt image IA complet (sujet, angle, lumière, style).
Phase 3 : Génération des images Chaque prompt passe dans un générateur d'images (DALL·E, Midjourney, Stable Diffusion, ou Flux). Tu obtiens une image par plan. L'étape critique est de maintenir la cohérence visuelle entre les images.
Phase 4 : Assemblage et export Tu assembles les images en storyboard via Figma, Canva, ou un PDF. Tu ajoutes les numéros de plan, les dialogues, les notes de mouvement caméra. Sortie : une planche visuelle qui sert de référence pour la génération vidéo ou le tournage réel.
| Étape | Entrée | Sortie | Temps estimé |
|---|---|---|---|
| 1 | Script / synopsis | Liste de N plans avec titre + description | 5–10 min |
| 2 | Descriptions | Prompts image par plan | 5–15 min |
| 3 | Prompts | N images générées | 10–30 min |
| 4 | Images | Planche storyboard (PDF ou timeline) | 10–20 min |
Utiliser ChatGPT pour le découpage et les prompts
La qualité de ton storyboard dépend directement de la qualité de ton prompt initial à ChatGPT. Voici comment structurer ta demande pour des résultats exploitables.
Prompt de base pour découpage de script
Tu es un storyboarder professionnel pour le cinéma. Voici mon script :
[COLLER LE SCRIPT ICI]
Découpe ce script en [N] plans visuels. Pour chaque plan, fournis :
1. Numéro du plan
2. Titre court (3-5 mots)
3. Description visuelle (une phrase : qui, quoi, où, ambiance, action)
4. Type de plan (large, moyen, gros plan, insert)
5. Prompt complet pour Midjourney/DALL·E en style cinéma
Utilise systématiquement les termes "cinematic stills", "natural film grain", "cinema photography" dans chaque prompt. Format ratio 16:9.
Prompt avancé avec paramètres de style
Pour un contrôle plus fin, enrichis ta demande avec des paramètres de style globaux :
Tu es un directeur de la photographie qui crée des storyboards visuels.
SCRIPT :
[COLLER LE SCRIPT]
PARAMÈTRES VISUELS GLOBAUX :
- Style : réaliste cinématographique, années 2020
- Palette : tons chauds, contraste moyen
- Lumière dominante : lumière naturelle dorée, heure dorée
- Focale préférée : 35mm et 50mm
- Ambiance : dramatique mais accessible
Génère [N] plans. Pour chaque plan :
- Numéro et titre
- Description visuelle détaillée (personnages, action, décor, émotion)
- Valeur de plan (très large, large, moyen, américain, rapproché, gros plan, insert)
- Direction du regard ou du mouvement
- Prompt image complet intégrant les paramètres globaux ci-dessus
Les prompts doivent inclure : "cinematic stills, 35mm lens, natural film grain, cinema photography, [lumière spécifique], --ar 16:9"
Exemple concret de découpage
Imaginons ce mini-script : "Sarah entre dans le café désert. Elle repère un homme assis au fond, le visage caché par un journal. Elle hésite, puis s'avance vers lui."
ChatGPT pourrait retourner :
Plan 1 : Entrée dans le café Description : Sarah pousse la porte vitrée d'un café vide, lumière tamisée, comptoir en bois à gauche. Type : Plan large Prompt : "Cinematic stills, wide shot, 35mm lens, young woman entering an empty vintage café, glass door, wooden counter, soft diffused morning light, natural film grain, cinema photography, moody atmosphere --ar 16:9"
Plan 2 : Regard vers le fond Description : Point de vue de Sarah, on voit l'homme au fond, silhouette floue derrière un journal. Type : Plan moyen subjectif Prompt : "Cinematic stills, medium shot, 50mm lens, POV shot of a mysterious man sitting alone in café background, newspaper hiding face, shallow depth of field, warm ambient lighting, natural film grain, cinema photography --ar 16:9"
Plan 3 : Hésitation Description : Gros plan sur le visage de Sarah, sourcils légèrement froncés, regard incertain. Type : Gros plan Prompt : "Cinematic stills, close-up shot, 85mm lens, young woman's face showing hesitation, subtle frown, soft side lighting, natural film grain, cinema photography, emotional portrait --ar 16:9"
Plan 4 : Premier pas Description : Plan moyen de Sarah qui s'avance, café en arrière-plan flou, démarche décidée. Type : Plan moyen Prompt : "Cinematic stills, medium shot, 50mm lens, young woman walking forward confidently in empty café, shallow depth of field, warm golden hour light through windows, natural film grain, cinema photography --ar 16:9"
Exemples de prompts image par type de scène
Selon le genre et le type de scène, tes prompts doivent s'adapter. Voici des templates réutilisables.
Scène d'action
Cinematic stills, dynamic wide shot, 24mm lens, [PERSONNAGE] in mid-action [ACTION SPÉCIFIQUE], motion blur on background, high contrast lighting, dust particles in air, natural film grain, cinema photography, intense atmosphere --ar 16:9
Exemple concret : "Cinematic stills, dynamic wide shot, 24mm lens, man in leather jacket diving behind car, motion blur on background, high contrast street lighting at night, dust particles in air, natural film grain, cinema photography, intense action atmosphere --ar 16:9"
Scène de dialogue intime
Cinematic stills, medium two-shot, 50mm lens, [PERSONNAGE A] and [PERSONNAGE B] facing each other in [LIEU], soft diffused lighting, shallow depth of field, natural film grain, cinema photography, intimate emotional tone --ar 16:9
Scène de paysage ou establishing shot
Cinematic stills, extreme wide shot, 16mm lens, [LIEU DÉTAILLÉ] at [MOMENT DE LA JOURNÉE], epic scale, atmospheric haze, dramatic sky, natural film grain, cinema photography, establishing shot mood --ar 16:9
Scène de tension ou thriller
Cinematic stills, low angle shot, 35mm lens, [PERSONNAGE OU ÉLÉMENT] in shadows, hard key light creating stark contrast, deep blacks, hints of red or blue accent lighting, natural film grain, cinema photography, suspenseful noir atmosphere --ar 16:9
Scène de flashback ou souvenir
Cinematic stills, soft focus shot, 50mm lens, [SCÈNE DÉCRITE], hazy dreamlike quality, desaturated warm tones, light leaks on edges, gentle overexposure, natural film grain, cinema photography, nostalgic memory feeling --ar 16:9
Insert ou détail
Cinematic stills, extreme close-up, 100mm macro lens, [OBJET OU DÉTAIL] with precise focus, background completely blurred, dramatic side lighting revealing texture, natural film grain, cinema photography --ar 16:9
Maintenir la cohérence visuelle du storyboard
Le défi majeur d'un storyboard généré par IA est la cohérence entre les images. Voici les techniques avancées pour y parvenir.
Créer un "prompt racine" de style
Avant de générer tes images, définis un préfixe de style que tu ajouteras à chaque prompt :
PRÉFIXE STYLE : "Cinematic stills, 35mm anamorphic lens, natural film grain, warm golden hour lighting, cinema photography, slight desaturation, "
Ce préfixe s'ajoute au début de chaque prompt de scène.
En gardant ce préfixe identique, tu forces une cohérence de rendu, température de couleur, et style photographique.
Cohérence des personnages
Pour que le même personnage soit reconnaissable d'une image à l'autre, utilise une description textuelle identique à chaque apparition :
PERSONNAGE SARAH : "young woman, early 30s, short auburn hair, pale skin, wearing dark green wool coat, determined expression"
Intègre cette description mot pour mot dans chaque prompt où Sarah apparaît. Pour plus de détails, consulte personnages BD cohérents.
Si ton générateur le permet (Midjourney avec références, Stable Diffusion avec IP-Adapter), utilise une image de référence générée une fois comme ancre visuelle pour les plans suivants.
Cohérence de la lumière
Choisis une direction et qualité de lumière pour ta séquence et maintiens-la :
- Source : lumière naturelle fenêtre, néons, lampe de bureau, soleil direct
- Direction : contre-jour, latérale gauche, zénithale, frontale douce
- Température : chaude (golden hour), neutre (jour couvert), froide (néons, nuit)
- Contraste : dur (ombres marquées) ou doux (diffus)
Consulte mots magiques de lumière pour les termes précis à utiliser.
Cohérence des cadrages
Un storyboard professionnel alterne intelligemment les valeurs de plan, mais évite les sauts brutaux. Une séquence typique :
- Plan large (establishing)
- Plan moyen (action principale)
- Plan rapproché (réaction)
- Insert (détail)
- Retour plan moyen
Évite de passer d'un gros plan à un plan très large sans transition. Note les raccords regard (direction du regard d'un plan à l'autre) et raccords mouvement dans tes descriptions pour la suite du workflow.
Automatiser le workflow complet
Pour les projets répétitifs ou les pipelines de production, tu peux automatiser l'ensemble du processus.
Architecture d'automatisation
Script (texte)
↓ API OpenAI/Claude
Découpage + Prompts (JSON)
↓ API DALL·E/Midjourney/Replicate
Images générées (fichiers)
↓ Script Python/Node
Storyboard PDF assemblé
Script Python minimal
Voici la logique de base :
import openai
import requests
from PIL import Image
from reportlab.pdfgen import canvas
# 1. Envoyer le script à GPT pour découpage
def decompose_script(script_text, num_plans):
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[{
"role": "user",
"content": f"""Découpe ce script en {num_plans} plans.
Retourne un JSON avec pour chaque plan :
- numero
- titre
- description
- prompt_image
Script : {script_text}"""
}]
)
return response.choices[0].message.content
# 2. Générer les images via DALL·E
def generate_image(prompt):
response = openai.Image.create(
model="dall-e-3",
prompt=prompt,
size="1792x1024",
quality="hd"
)
return response.data[0].url
# 3. Assembler en PDF (simplifié)
def create_storyboard_pdf(plans, images):
c = canvas.Canvas("storyboard.pdf")
# Logique de mise en page...
c.save()
Automatisation no-code avec n8n ou Make
Si tu ne codes pas, utilise un outil comme n8n, Make (ex-Integromat), ou Zapier :
- Trigger : réception du script (formulaire, email, webhook)
- Action 1 : appel API OpenAI pour découpage et génération de prompts
- Action 2 : boucle sur chaque prompt, appel API de génération d'image
- Action 3 : téléchargement des images dans un dossier cloud
- Action 4 : génération d'un PDF via service comme PDFMonkey ou Carbone
Le workflow complet peut tourner en 2-3 minutes pour un storyboard de 10 plans.
Batch processing pour gros volumes
Pour des projets avec beaucoup de plans ou plusieurs versions :
- Lance les générations d'images en parallèle (pas séquentiellement)
- Utilise un système de cache pour ne pas régénérer les images déjà validées
- Stocke les prompts dans une base de données pour réutilisation
- Implémente un système de versioning (v1, v2, etc.) pour les itérations
Export et présentation du storyboard
Un storyboard bien présenté facilite la communication et le travail en équipe.
Formats d'export recommandés
PDF planche classique Le format standard : 2 à 4 images par page, avec numéro de plan, titre, description courte, et une colonne pour les notes (mouvement caméra, dialogue, SFX). Idéal pour impression, envoi client, ou archivage.
Figma ou Miro Pour le travail collaboratif en temps réel. Tu peux annoter, commenter, déplacer les plans, et itérer avec l'équipe. Exporte ensuite en PDF quand le storyboard est finalisé.
Timeline de montage (Premiere, DaVinci) Importe directement les images sur une timeline. Chaque image = 2 à 3 secondes. Tu obtiens une animatique basique qui montre le rythme du montage avant génération vidéo.
Slideshow Keynote/PowerPoint Une image par slide, plein écran. Parfait pour présentation client ou pitch. Ajoute les transitions dissolve pour simuler le flow du film.
Modèle de mise en page PDF
Structure recommandée pour chaque page :
┌─────────────────────────────────────────────┐
│ PROJET : [Nom] PAGE : X/Y │
├───────────────────┬─────────────────────────┤
│ │ Plan 1 : [Titre] │
│ [IMAGE 1] │ Type : Plan large │
│ │ Description : ... │
│ │ Dialogue : "..." │
│ │ Notes : panoramique G→D │
├───────────────────┼─────────────────────────┤
│ │ Plan 2 : [Titre] │
│ [IMAGE 2] │ Type : Plan moyen │
│ │ Description : ... │
│ │ Dialogue : — │
│ │ Notes : focus pull │
└───────────────────┴─────────────────────────┘
Annotations essentielles
Pour chaque plan, inclus au minimum :
- Numéro de plan : séquence logique
- Valeur de plan : large, moyen, gros plan, etc.
- Mouvement caméra : panoramique, travelling, zoom, steadicam, fixe
- Dialogue ou VO : les lignes prononcées pendant ce plan
- SFX/Musique : indications sonores
- Durée estimée : 2s, 4s, etc.
- Notes de raccord : direction du regard, continuité de mouvement
Erreurs fréquentes et solutions
Prompts trop différents entre les plans
Problème : chaque image a un style, une lumière, ou un grain différent. Solution : utilise un préfixe de style commun à tous les prompts. Régénère les images incohérentes avec le même seed (si disponible) ou les mêmes paramètres.
Trop de plans pour la durée
Problème : un storyboard de 30 plans pour une vidéo de 30 secondes. Solution : 5 à 12 plans pour une séquence courte (30s à 1min). Au-delà, le storyboard devient illisible et tu perds la vue d'ensemble. Fusionne les plans redondants.
Oubli des raccords
Problème : un personnage regarde à gauche au plan 1, à droite au plan 2, sans justification. Solution : note systématiquement la direction du regard et du mouvement dans tes descriptions. Applique la règle des 180° pour les séquences de dialogue.
ChatGPT invente des détails
Problème : le LLM ajoute des éléments absents du script (personnages, objets, lieux). Solution : relis chaque description et prompt avant génération. Corrige ou supprime les inventions. Sois explicite dans ton prompt initial : "n'ajoute aucun élément qui n'est pas mentionné dans le script".
Images inutilisables
Problème : personnages déformés, texte incohérent, éléments non voulus. Solution : ajoute des négatives ("no text", "no extra characters", "no watermark"). Utilise des contraintes de composition plus strictes. Régénère avec un angle ou cadrage légèrement différent.
Perte de temps en itérations
Problème : tu régénères la même image 20 fois sans amélioration. Solution : après 3-4 essais infructueux, reformule le prompt plutôt que de relancer. Souvent, un changement de structure ou de vocabulaire débloque le résultat.
Pro Tip : Exporte le storyboard en PDF avec numéros de plan et une colonne "notes" (mouvement caméra, dialogue) pour le montage et la génération vidéo avancée.
Workflow avancé : du storyboard à la vidéo IA
Ton storyboard devient le blueprint pour la génération vidéo. Voici comment enchaîner.
Image-to-video avec Runway ou Pika
Chaque image de ton storyboard peut devenir le premier frame d'un plan vidéo :
- Exporte l'image en pleine résolution
- Importe dans Runway Gen-3 ou Pika
- Ajoute un prompt de mouvement basé sur tes notes storyboard
- Génère une vidéo de 4 à 10 secondes
- Répète pour chaque plan
Prompt de mouvement basé sur le storyboard
Si ton storyboard indique "panoramique gauche-droite", ton prompt vidéo devient :
Camera slowly pans from left to right, revealing the entire room, smooth steady movement
Les notes que tu as ajoutées au storyboard (mouvement, rythme, émotion) se transforment en prompts de génération.
Montage de l'animatique
Avant de générer toutes les vidéos, crée une animatique :
- Importe les images storyboard sur une timeline
- Attribue une durée à chaque plan (selon tes notes)
- Ajoute la musique ou les dialogues provisoires
- Vérifie le rythme et les transitions
- Ajuste avant de lancer la génération vidéo coûteuse
Liens utiles
Storyboard première vidéo IA, importance du storyboard, workflow préproduction, génération vidéo. Storyboard That (outil classique pour comparer).
Foire aux questions
Quel modèle LLM utiliser pour décomposer le script ?
ChatGPT (GPT-4 ou GPT-4o), Claude, ou tout LLM capable de suivre des instructions structurées. GPT-4 excelle pour le format JSON structuré. Claude est plus créatif sur les descriptions visuelles. Donne-lui le script, le nombre de plans souhaité, et le format de sortie précis (titre, description, prompt).
Combien de plans pour un storyboard utile ?
Pour 30 secondes à 1 minute, 5 à 12 plans. Assez pour voir la structure narrative, pas trop pour garder une vue d'ensemble. Pour une pub de 15 secondes, 4 à 6 plans suffisent. Pour un court-métrage de 5 minutes, compte 40 à 60 plans répartis par séquence.
Comment garder le même personnage sur toutes les images ?
Utilise une description textuelle identique à chaque apparition (personnages cohérents). Midjourney supporte les images de référence (--cref), Stable Diffusion propose IP-Adapter, et DALL·E 3 fonctionne bien avec des descriptions très détaillées. La clé est la constance du vocabulaire descriptif.
Storyboard en style rough ou réaliste ?
Ça dépend de la phase du projet. Rough (crayon, sketch) pour itérer vite et explorer des options. Réaliste (cinematic stills) pour valider le rendu final avant génération vidéo ou présenter à un client. Tu peux même faire les deux : rough pour l'exploration, réaliste pour la validation.
Les prompts générés par le LLM sont-ils directement utilisables ?
Souvent oui après vérification rapide. Ajuste les détails techniques (ratio 16:9, "no text", température de lumière) et vérifie la cohérence avec tes autres choix (préfixe de style, paramètres de lumière). Compte 1 à 2 minutes de relecture par prompt.
Le storyboard ne sert que pour la vidéo IA ?
Non. Un storyboard visuel IA sert aussi pour un tournage réel (repérage de cadres), une animatique client, une présentation de pitch, ou une bible visuelle de projet. Le format (PDF, planche) reste universel dans l'industrie.
Peut-on automatiser complètement le workflow script → planche ?
Oui. Un script Python ou Node peut enchaîner : LLM pour découpage + prompts, appel API de génération d'images, assemblage en PDF. Tu peux aussi utiliser des outils no-code (Zapier, n8n, Make) si tu ne codes pas. Le workflow complet prend 2 à 5 minutes pour 10 plans.
Storyboard pour documentaire ou docu-fiction ?
Oui, très utile. Découpe ton projet en "séquences" (interview, archives, B-roll, reconstitution). Chaque séquence peut avoir 1 à 3 images clés. Pour les fausses archives, consulte documentaire avec fausses archives.
Quel générateur d'images choisir pour le storyboard ?
,
Comment gérer les modifications de dernière minute ?
Conserve tous tes prompts dans un document ou une base de données. Si un plan change, tu régénères uniquement ce plan avec un prompt modifié. Utilise un système de versioning (v1, v2) pour suivre l'historique. Ne supprime jamais les anciennes versions avant validation finale.
Quelle résolution pour les images du storyboard ?
Pour l'affichage et le PDF, 1920x1080 (Full HD) suffit. Si tu prévois d'utiliser les images comme base pour de la génération vidéo, monte à la résolution maximale du générateur (DALL·E 3 : 1792x1024, Midjourney : jusqu'à 2048px). Tu pourras toujours réduire ensuite.
Combien de temps pour créer un storyboard complet ?
Pour un projet de 10 plans, compte 30 à 60 minutes en incluant le découpage, la génération, et l'assemblage. Avec l'automatisation, tu peux descendre à 10-15 minutes. Le temps principal est dans la validation et les ajustements créatifs, pas dans l'exécution technique.

Frank Houbre - expert IA vidéo et Image
Frank Houbre est un expert en IA vidéo et image, artiste IA et filmmaker récompensé aux Seoul International AI Film Festival et aux Mondial Chroma Awards. Avec plus de 10 ans d'expérience en entrepreneuriat digital, il crée des courts-métrages et animés entièrement générés par IA (Midjourney, Kling, Adobe Firefly). Co-Fondateur de Screenweaver et de la communauté #AIStudios, il partage des tutoriels gratuits et avis d'outils sur Business Dynamite pour aider les créateurs à automatiser leur production.
Continuer la lecture

Ajouter des émotions (rire, pleurs, chuchotements) à une voix off IA
Rendre une voix synthétique plus vivante : rire, tristesse, chuchotement, colère avec ElevenLabs, réglages et bonnes pratiques.

Audio et voix pour la vidéo : complément indispensable
Pourquoi le son fait 50 % d'une vidéo IA : voix off, musique, bruitages. Vue d'ensemble des outils et du workflow pour les créateurs.

Cloner sa propre voix pour des tutoriels sans micro
Produire des tutoriels et formations en voix off avec ta voix clonée par IA : enregistrement, outils, script et montage sans micro.
