Vidéo IA11 mars 2026· 18 min de lecture

Transformer un script ChatGPT en storyboard visuel automatique

Q: Storyboard en style rough ou réaliste ?

Ça dépend de la phase du projet. Rough (crayon, sketch) pour itérer vite et explorer des options. Réaliste (cinematic stills) pour valider le rendu final avant génération vidéo ou présenter à un client. Tu peux même faire les deux : rough pour l'exploration, réaliste pour la validation.

Workflow pour passer d'un script ou d'un synopsis à un storyboard d'images générées en IA : prompts par scène, cohérence, export.

Note

4,94 / 5

Transformer un script ChatGPT en storyboard visuel automatique

Tu as un script ou un synopsis. Tu veux le voir en images avant de lancer la génération vidéo. Un storyboard visuel automatique, c'est possible : ChatGPT (ou un LLM) pour décomposer le script en scènes et rédiger des prompts, puis un générateur d'images pour produire une planche par scène. Ce guide détaillé couvre le workflow complet (script, découpage, prompts, génération, export), les techniques avancées de cohérence visuelle, l'automatisation, et tous les pièges à éviter pour un résultat professionnel.

Pour aller plus loin avec une demonstration pratique, cette video est directement liee au sujet.

🎲 Créez Votre Jeu de Société avec l’IA (ChatGPT + MidJourney + DALL·E) – De l’Idée à la Vente !

Pourquoi créer un storyboard visuel avec l'IA

Avant de plonger dans le workflow, comprendre les avantages d'un storyboard généré par IA t'aidera à optimiser ton processus créatif.

Visualisation rapide des idées : Passer d'un texte abstrait à des images concrètes en quelques minutes permet de valider ton concept avant d'investir du temps en production. Tu identifies les problèmes de narration, les incohérences visuelles ou les transitions bancales dès le départ.

Communication avec l'équipe ou le client : Un storyboard visuel parle mieux qu'un script. Que tu travailles avec un monteur, un réalisateur, ou un client non technique, les images transmettent l'intention créative instantanément.

Base pour la génération vidéo IA : Les générateurs vidéo comme Runway, Pika ou Sora fonctionnent mieux avec une référence visuelle claire. Ton storyboard devient le blueprint pour chaque plan généré.

Itération sans coût : Contrairement à un storyboard dessiné à la main ou commandé à un artiste, tu peux régénérer, modifier, et expérimenter autant que nécessaire sans budget supplémentaire.

Principe du workflow complet

Le workflow se décompose en quatre phases distinctes, chacune avec ses outils et bonnes pratiques.

Phase 1 : Préparation du script Entrée : un script ou un synopsis (même court). Tu nettoies le texte, identifies les moments visuels clés, et structures la narration en segments logiques. Un script de 30 secondes peut donner 5 à 8 plans, un script d'une minute 10 à 15 plans.

Phase 2 : Découpage et génération de prompts Tu soumets le script à ChatGPT avec des instructions précises. Le LLM décompose le texte en scènes ou plans (titre + description visuelle en 1–2 phrases). Pour chaque plan, il rédige un prompt image IA complet (sujet, angle, lumière, style).

Phase 3 : Génération des images Chaque prompt passe dans un générateur d'images (DALL·E, Midjourney, Stable Diffusion, ou Flux). Tu obtiens une image par plan. L'étape critique est de maintenir la cohérence visuelle entre les images.

Phase 4 : Assemblage et export Tu assembles les images en storyboard via Figma, Canva, ou un PDF. Tu ajoutes les numéros de plan, les dialogues, les notes de mouvement caméra. Sortie : une planche visuelle qui sert de référence pour la génération vidéo ou le tournage réel.

Étape	Entrée	Sortie	Temps estimé
1	Script / synopsis	Liste de N plans avec titre + description	5–10 min
2	Descriptions	Prompts image par plan	5–15 min
3	Prompts	N images générées	10–30 min
4	Images	Planche storyboard (PDF ou timeline)	10–20 min

Utiliser ChatGPT pour le découpage et les prompts

La qualité de ton storyboard dépend directement de la qualité de ton prompt initial à ChatGPT. Voici comment structurer ta demande pour des résultats exploitables.

Prompt de base pour découpage de script

Tu es un storyboarder professionnel pour le cinéma. Voici mon script :

[COLLER LE SCRIPT ICI]

Découpe ce script en [N] plans visuels. Pour chaque plan, fournis :
1. Numéro du plan
2. Titre court (3-5 mots)
3. Description visuelle (une phrase : qui, quoi, où, ambiance, action)
4. Type de plan (large, moyen, gros plan, insert)
5. Prompt complet pour Midjourney/DALL·E en style cinéma

Utilise systématiquement les termes "cinematic stills", "natural film grain", "cinema photography" dans chaque prompt. Format ratio 16:9.

Prompt avancé avec paramètres de style

Pour un contrôle plus fin, enrichis ta demande avec des paramètres de style globaux :

Tu es un directeur de la photographie qui crée des storyboards visuels. 

SCRIPT :
[COLLER LE SCRIPT]

PARAMÈTRES VISUELS GLOBAUX :
- Style : réaliste cinématographique, années 2020
- Palette : tons chauds, contraste moyen
- Lumière dominante : lumière naturelle dorée, heure dorée
- Focale préférée : 35mm et 50mm
- Ambiance : dramatique mais accessible

Génère [N] plans. Pour chaque plan :
- Numéro et titre
- Description visuelle détaillée (personnages, action, décor, émotion)
- Valeur de plan (très large, large, moyen, américain, rapproché, gros plan, insert)
- Direction du regard ou du mouvement
- Prompt image complet intégrant les paramètres globaux ci-dessus

Les prompts doivent inclure : "cinematic stills, 35mm lens, natural film grain, cinema photography, [lumière spécifique], --ar 16:9"

Exemple concret de découpage

Imaginons ce mini-script : "Sarah entre dans le café désert. Elle repère un homme assis au fond, le visage caché par un journal. Elle hésite, puis s'avance vers lui."

ChatGPT pourrait retourner :

Plan 1 : Entrée dans le café Description : Sarah pousse la porte vitrée d'un café vide, lumière tamisée, comptoir en bois à gauche. Type : Plan large Prompt : "Cinematic stills, wide shot, 35mm lens, young woman entering an empty vintage café, glass door, wooden counter, soft diffused morning light, natural film grain, cinema photography, moody atmosphere --ar 16:9"

Plan 2 : Regard vers le fond Description : Point de vue de Sarah, on voit l'homme au fond, silhouette floue derrière un journal. Type : Plan moyen subjectif Prompt : "Cinematic stills, medium shot, 50mm lens, POV shot of a mysterious man sitting alone in café background, newspaper hiding face, shallow depth of field, warm ambient lighting, natural film grain, cinema photography --ar 16:9"

Plan 3 : Hésitation Description : Gros plan sur le visage de Sarah, sourcils légèrement froncés, regard incertain. Type : Gros plan Prompt : "Cinematic stills, close-up shot, 85mm lens, young woman's face showing hesitation, subtle frown, soft side lighting, natural film grain, cinema photography, emotional portrait --ar 16:9"

Plan 4 : Premier pas Description : Plan moyen de Sarah qui s'avance, café en arrière-plan flou, démarche décidée. Type : Plan moyen Prompt : "Cinematic stills, medium shot, 50mm lens, young woman walking forward confidently in empty café, shallow depth of field, warm golden hour light through windows, natural film grain, cinema photography --ar 16:9"

Exemples de prompts image par type de scène

Selon le genre et le type de scène, tes prompts doivent s'adapter. Voici des templates réutilisables.

Scène d'action

Cinematic stills, dynamic wide shot, 24mm lens, [PERSONNAGE] in mid-action [ACTION SPÉCIFIQUE], motion blur on background, high contrast lighting, dust particles in air, natural film grain, cinema photography, intense atmosphere --ar 16:9

Exemple concret : "Cinematic stills, dynamic wide shot, 24mm lens, man in leather jacket diving behind car, motion blur on background, high contrast street lighting at night, dust particles in air, natural film grain, cinema photography, intense action atmosphere --ar 16:9"

Scène de dialogue intime

Cinematic stills, medium two-shot, 50mm lens, [PERSONNAGE A] and [PERSONNAGE B] facing each other in [LIEU], soft diffused lighting, shallow depth of field, natural film grain, cinema photography, intimate emotional tone --ar 16:9

Scène de paysage ou establishing shot

Cinematic stills, extreme wide shot, 16mm lens, [LIEU DÉTAILLÉ] at [MOMENT DE LA JOURNÉE], epic scale, atmospheric haze, dramatic sky, natural film grain, cinema photography, establishing shot mood --ar 16:9

Scène de tension ou thriller

Cinematic stills, low angle shot, 35mm lens, [PERSONNAGE OU ÉLÉMENT] in shadows, hard key light creating stark contrast, deep blacks, hints of red or blue accent lighting, natural film grain, cinema photography, suspenseful noir atmosphere --ar 16:9

Scène de flashback ou souvenir

Cinematic stills, soft focus shot, 50mm lens, [SCÈNE DÉCRITE], hazy dreamlike quality, desaturated warm tones, light leaks on edges, gentle overexposure, natural film grain, cinema photography, nostalgic memory feeling --ar 16:9

Insert ou détail

Cinematic stills, extreme close-up, 100mm macro lens, [OBJET OU DÉTAIL] with precise focus, background completely blurred, dramatic side lighting revealing texture, natural film grain, cinema photography --ar 16:9

Maintenir la cohérence visuelle du storyboard

Le défi majeur d'un storyboard généré par IA est la cohérence entre les images. Voici les techniques avancées pour y parvenir.

Créer un "prompt racine" de style

Avant de générer tes images, définis un préfixe de style que tu ajouteras à chaque prompt :

PRÉFIXE STYLE : "Cinematic stills, 35mm anamorphic lens, natural film grain, warm golden hour lighting, cinema photography, slight desaturation, "

Ce préfixe s'ajoute au début de chaque prompt de scène.

En gardant ce préfixe identique, tu forces une cohérence de rendu, température de couleur, et style photographique.

Cohérence des personnages

Pour que le même personnage soit reconnaissable d'une image à l'autre, utilise une description textuelle identique à chaque apparition :

PERSONNAGE SARAH : "young woman, early 30s, short auburn hair, pale skin, wearing dark green wool coat, determined expression"

Intègre cette description mot pour mot dans chaque prompt où Sarah apparaît. Pour plus de détails, consulte personnages BD cohérents.

Si ton générateur le permet (Midjourney avec références, Stable Diffusion avec IP-Adapter), utilise une image de référence générée une fois comme ancre visuelle pour les plans suivants.

Cohérence de la lumière

Choisis une direction et qualité de lumière pour ta séquence et maintiens-la :

Source : lumière naturelle fenêtre, néons, lampe de bureau, soleil direct
Direction : contre-jour, latérale gauche, zénithale, frontale douce
Température : chaude (golden hour), neutre (jour couvert), froide (néons, nuit)
Contraste : dur (ombres marquées) ou doux (diffus)

Consulte mots magiques de lumière pour les termes précis à utiliser.

Cohérence des cadrages

Un storyboard professionnel alterne intelligemment les valeurs de plan, mais évite les sauts brutaux. Une séquence typique :

Plan large (establishing)
Plan moyen (action principale)
Plan rapproché (réaction)
Insert (détail)
Retour plan moyen

Évite de passer d'un gros plan à un plan très large sans transition. Note les raccords regard (direction du regard d'un plan à l'autre) et raccords mouvement dans tes descriptions pour la suite du workflow.

Automatiser le workflow complet

Pour les projets répétitifs ou les pipelines de production, tu peux automatiser l'ensemble du processus.

Architecture d'automatisation

Script (texte) 
    ↓ API OpenAI/Claude
Découpage + Prompts (JSON)
    ↓ API DALL·E/Midjourney/Replicate
Images générées (fichiers)
    ↓ Script Python/Node
Storyboard PDF assemblé

Script Python minimal

Voici la logique de base :

import openai
import requests
from PIL import Image
from reportlab.pdfgen import canvas

# 1. Envoyer le script à GPT pour découpage
def decompose_script(script_text, num_plans):
    response = openai.ChatCompletion.create(
        model="gpt-4",
        messages=[{
            "role": "user",
            "content": f"""Découpe ce script en {num_plans} plans.
            Retourne un JSON avec pour chaque plan :
            - numero
            - titre
            - description
            - prompt_image
            
            Script : {script_text}"""
        }]
    )
    return response.choices[0].message.content

# 2. Générer les images via DALL·E
def generate_image(prompt):
    response = openai.Image.create(
        model="dall-e-3",
        prompt=prompt,
        size="1792x1024",
        quality="hd"
    )
    return response.data[0].url

# 3. Assembler en PDF (simplifié)
def create_storyboard_pdf(plans, images):
    c = canvas.Canvas("storyboard.pdf")
    # Logique de mise en page...
    c.save()

Automatisation no-code avec n8n ou Make

Si tu ne codes pas, utilise un outil comme n8n, Make (ex-Integromat), ou Zapier :

Trigger : réception du script (formulaire, email, webhook)
Action 1 : appel API OpenAI pour découpage et génération de prompts
Action 2 : boucle sur chaque prompt, appel API de génération d'image
Action 3 : téléchargement des images dans un dossier cloud
Action 4 : génération d'un PDF via service comme PDFMonkey ou Carbone

Le workflow complet peut tourner en 2-3 minutes pour un storyboard de 10 plans.

Batch processing pour gros volumes

Pour des projets avec beaucoup de plans ou plusieurs versions :

Lance les générations d'images en parallèle (pas séquentiellement)
Utilise un système de cache pour ne pas régénérer les images déjà validées
Stocke les prompts dans une base de données pour réutilisation
Implémente un système de versioning (v1, v2, etc.) pour les itérations

Export et présentation du storyboard

Un storyboard bien présenté facilite la communication et le travail en équipe.

Formats d'export recommandés

PDF planche classique Le format standard : 2 à 4 images par page, avec numéro de plan, titre, description courte, et une colonne pour les notes (mouvement caméra, dialogue, SFX). Idéal pour impression, envoi client, ou archivage.

Figma ou Miro Pour le travail collaboratif en temps réel. Tu peux annoter, commenter, déplacer les plans, et itérer avec l'équipe. Exporte ensuite en PDF quand le storyboard est finalisé.

Timeline de montage (Premiere, DaVinci) Importe directement les images sur une timeline. Chaque image = 2 à 3 secondes. Tu obtiens une animatique basique qui montre le rythme du montage avant génération vidéo.

Slideshow Keynote/PowerPoint Une image par slide, plein écran. Parfait pour présentation client ou pitch. Ajoute les transitions dissolve pour simuler le flow du film.

Modèle de mise en page PDF

Structure recommandée pour chaque page :

┌─────────────────────────────────────────────┐
│  PROJET : [Nom]     PAGE : X/Y              │
├───────────────────┬─────────────────────────┤
│                   │ Plan 1 : [Titre]        │
│   [IMAGE 1]       │ Type : Plan large       │
│                   │ Description : ...       │
│                   │ Dialogue : "..."        │
│                   │ Notes : panoramique G→D │
├───────────────────┼─────────────────────────┤
│                   │ Plan 2 : [Titre]        │
│   [IMAGE 2]       │ Type : Plan moyen       │
│                   │ Description : ...       │
│                   │ Dialogue : (aucun)      │
│                   │ Notes : focus pull      │
└───────────────────┴─────────────────────────┘

Annotations essentielles

Pour chaque plan, inclus au minimum :

Numéro de plan : séquence logique
Valeur de plan : large, moyen, gros plan, etc.
Mouvement caméra : panoramique, travelling, zoom, steadicam, fixe
Dialogue ou VO : les lignes prononcées pendant ce plan
SFX/Musique : indications sonores
Durée estimée : 2s, 4s, etc.
Notes de raccord : direction du regard, continuité de mouvement

Erreurs fréquentes et solutions

Prompts trop différents entre les plans

Problème : chaque image a un style, une lumière, ou un grain différent. Solution : utilise un préfixe de style commun à tous les prompts. Régénère les images incohérentes avec le même seed (si disponible) ou les mêmes paramètres.

Trop de plans pour la durée

Problème : un storyboard de 30 plans pour une vidéo de 30 secondes. Solution : 5 à 12 plans pour une séquence courte (30s à 1min). Au-delà, le storyboard devient illisible et tu perds la vue d'ensemble. Fusionne les plans redondants.

Oubli des raccords

Problème : un personnage regarde à gauche au plan 1, à droite au plan 2, sans justification. Solution : note systématiquement la direction du regard et du mouvement dans tes descriptions. Applique la règle des 180° pour les séquences de dialogue.

ChatGPT invente des détails

Problème : le LLM ajoute des éléments absents du script (personnages, objets, lieux). Solution : relis chaque description et prompt avant génération. Corrige ou supprime les inventions. Sois explicite dans ton prompt initial : "n'ajoute aucun élément qui n'est pas mentionné dans le script".

Images inutilisables

Problème : personnages déformés, texte incohérent, éléments non voulus. Solution : ajoute des négatives ("no text", "no extra characters", "no watermark"). Utilise des contraintes de composition plus strictes. Régénère avec un angle ou cadrage légèrement différent.

Perte de temps en itérations

Problème : tu régénères la même image 20 fois sans amélioration. Solution : après 3-4 essais infructueux, reformule le prompt plutôt que de relancer. Souvent, un changement de structure ou de vocabulaire débloque le résultat.

Pro Tip : Exporte le storyboard en PDF avec numéros de plan et une colonne "notes" (mouvement caméra, dialogue) pour le montage et la génération vidéo avancée.

Workflow avancé : du storyboard à la vidéo IA

Ton storyboard devient le blueprint pour la génération vidéo. Voici comment enchaîner.

Image-to-video avec Runway ou Pika

Chaque image de ton storyboard peut devenir le premier frame d'un plan vidéo :

Exporte l'image en pleine résolution
Importe dans Runway Gen-3 ou Pika
Ajoute un prompt de mouvement basé sur tes notes storyboard
Génère une vidéo de 4 à 10 secondes
Répète pour chaque plan

Prompt de mouvement basé sur le storyboard

Si ton storyboard indique "panoramique gauche-droite", ton prompt vidéo devient :

Camera slowly pans from left to right, revealing the entire room, smooth steady movement

Les notes que tu as ajoutées au storyboard (mouvement, rythme, émotion) se transforment en prompts de génération.

Montage de l'animatique

Avant de générer toutes les vidéos, crée une animatique :

Importe les images storyboard sur une timeline
Attribue une durée à chaque plan (selon tes notes)
Ajoute la musique ou les dialogues provisoires
Vérifie le rythme et les transitions
Ajuste avant de lancer la génération vidéo coûteuse

Liens utiles

Storyboard première vidéo IA, importance du storyboard, workflow préproduction, génération vidéo. Storyboard That (outil classique pour comparer).

Foire aux questions

Quel modèle LLM utiliser pour décomposer le script ?

ChatGPT (GPT-4 ou GPT-4o), Claude, ou tout LLM capable de suivre des instructions structurées. GPT-4 excelle pour le format JSON structuré. Claude est plus créatif sur les descriptions visuelles. Donne-lui le script, le nombre de plans souhaité, et le format de sortie précis (titre, description, prompt).

Combien de plans pour un storyboard utile ?

Pour 30 secondes à 1 minute, 5 à 12 plans. Assez pour voir la structure narrative, pas trop pour garder une vue d'ensemble. Pour une pub de 15 secondes, 4 à 6 plans suffisent. Pour un court-métrage de 5 minutes, compte 40 à 60 plans répartis par séquence.

Comment garder le même personnage sur toutes les images ?

Utilise une description textuelle identique à chaque apparition (personnages cohérents). Midjourney supporte les images de référence (--cref), Stable Diffusion propose IP-Adapter, et DALL·E 3 fonctionne bien avec des descriptions très détaillées. La clé est la constance du vocabulaire descriptif.

Storyboard en style rough ou réaliste ?

Ça dépend de la phase du projet. Rough (crayon, sketch) pour itérer vite et explorer des options. Réaliste (cinematic stills) pour valider le rendu final avant génération vidéo ou présenter à un client. Tu peux même faire les deux : rough pour l'exploration, réaliste pour la validation.

Les prompts générés par le LLM sont-ils directement utilisables ?

Souvent oui après vérification rapide. Ajuste les détails techniques (ratio 16:9, "no text", température de lumière) et vérifie la cohérence avec tes autres choix (préfixe de style, paramètres de lumière). Compte 1 à 2 minutes de relecture par prompt.

Le storyboard ne sert que pour la vidéo IA ?

Non. Un storyboard visuel IA sert aussi pour un tournage réel (repérage de cadres), une animatique client, une présentation de pitch, ou une bible visuelle de projet. Le format (PDF, planche) reste universel dans l'industrie.

Peut-on automatiser complètement le workflow script → planche ?

Oui. Un script Python ou Node peut enchaîner : LLM pour découpage + prompts, appel API de génération d'images, assemblage en PDF. Tu peux aussi utiliser des outils no-code (Zapier, n8n, Make) si tu ne codes pas. Le workflow complet prend 2 à 5 minutes pour 10 plans.

Storyboard pour documentaire ou docu-fiction ?

Oui, très utile. Découpe ton projet en "séquences" (interview, archives, B-roll, reconstitution). Chaque séquence peut avoir 1 à 3 images clés. Pour les fausses archives, consulte documentaire avec fausses archives.

Quel générateur d'images choisir pour le storyboard ?

Comment gérer les modifications de dernière minute ?

Conserve tous tes prompts dans un document ou une base de données. Si un plan change, tu régénères uniquement ce plan avec un prompt modifié. Utilise un système de versioning (v1, v2) pour suivre l'historique. Ne supprime jamais les anciennes versions avant validation finale.

Quelle résolution pour les images du storyboard ?

Pour l'affichage et le PDF, 1920x1080 (Full HD) suffit. Si tu prévois d'utiliser les images comme base pour de la génération vidéo, monte à la résolution maximale du générateur (DALL·E 3 : 1792x1024, Midjourney : jusqu'à 2048px). Tu pourras toujours réduire ensuite.

Combien de temps pour créer un storyboard complet ?

Pour un projet de 10 plans, compte 30 à 60 minutes en incluant le découpage, la génération, et l'assemblage. Avec l'automatisation, tu peux descendre à 10-15 minutes. Le temps principal est dans la validation et les ajustements créatifs, pas dans l'exécution technique.

Votre avis

Chargement…