Warum konsistente Figuren in KI-Filmen zerbrechen
Figureninkonsistenz ist einer der schnellsten Wege, wie ein KI-Film wie ein Demo statt wie eine echte Geschichte wirkt. Zuschauer verzeihen für einen Moment einen leicht unscharfen Hintergrund oder eine seltsame Hand, aber sie merken sofort, wenn dieselbe Figur von Einstellung zu Einstellung plötzlich eine andere Gesichtsform, ein anderes Alter, eine andere Kleidung oder einen anderen Körpertyp hat. In narrativen Arbeiten zerstört das die Immersion.
Das Kernproblem ist, dass die meisten KI-Tools darauf optimiert sind, ein gutes Einzelbild zu erzeugen, nicht eine Identität über eine Sequenz hinweg zu schützen. Jedes neue Bild oder jeder neue Clip wird von Zufall, Prompt-Wortlaut, Referenzqualität, Beleuchtung und Stiländerungen beeinflusst. Selbst wenn eine Figur in einer Einstellung richtig aussieht, kann das Modell dieselbe Figur in der nächsten Einstellung neu interpretieren, wenn der Workflow nicht kontrolliert wird.
Die echten Gründe, warum Figuren abweichen
1. Zufall in der Generierung KI-Modelle „merken“ sich eine Figur nicht so, wie es ein menschlicher Filmemacher tut. Wenn du denselben Prompt zweimal generierst, kannst du trotzdem eine andere Gesichtsstruktur, Haarplatzierung, Kleidungsdetails oder Proportionen erhalten. Dieser Zufall ist für Kreativität nützlich, aber für Kontinuität ein Problem.
2. Wechselnde Referenzen Wenn du für jede Einstellung ein anderes Referenzbild verwendest, beginnt das Modell, jede Referenz als leicht andere Person zu behandeln. Eine Referenz bevorzugt vielleicht eine kantigere Kieferlinie, eine andere ein weicheres Gesicht, eine dritte eine andere Frisur. Schon kleine Änderungen an der Referenz können zu einem sichtbaren Identitätswechsel führen.
3. Lichtwechsel Eine Figur kann in einer hellen Frontalbeleuchtung konsistent wirken und in Seitenlicht, Rim Light oder düsterer Low-Key-Nachtbeleuchtung plötzlich wie eine andere Person erscheinen. KI-Modelle interpretieren Gesichtszüge oft neu, wenn sich die Beleuchtung ändert – besonders um Augen, Nase und Hautton herum.
4. Stil-Drift Wenn eine Einstellung wie ein realistischer Filmstill gerendert wird und die nächste stärker stilisiert oder malerisch wirkt, kann die Figur ihre visuelle Identität verlieren, selbst wenn der Prompt denselben Namen nennt. Der Stil beeinflusst Gesichtsstruktur, Farbgebung, Textur und wie viel Detail das Modell bewahrt.
5. Isolierte Neugenerierung von Einstellungen Ein häufiger Fehler ist, eine Einstellung neu zu generieren, ohne die Szene darum herum zu prüfen. Die Einstellung sieht für sich genommen gut aus, passt aber nicht mehr zur vorherigen oder nächsten Einstellung in Kleidung, Blickrichtung, Bildachse oder Performance-Ton.
6. Prompt-Variationen innerhalb der Sequenz Creator versuchen oft, Drift zu „beheben“, indem sie den Prompt bei jeder Einstellung detaillierter machen. Das Problem: Mehr Text erzeugt nicht automatisch mehr Konsistenz. Tatsächlich können zu viele Prompt-Änderungen neue visuelle Unterschiede einführen. Wenn der Prompt instabil ist, wird die Figur instabil.
Was „konsistente Figur“ eigentlich bedeutet
Konsistenz ist mehr als ein passendes Gesicht. In einem Film sollte dieselbe Figur über mehrere Dimensionen hinweg stabil bleiben:
- Gesicht: Identität, Knochenstruktur, Augen, Nase, Mund und Gesichtsproportionen - Kostüm: gleiches Outfit, gleiche Accessoires und gleicher Garderobenstatus, außer die Story verändert ihn - Silhouette: die Person sollte aus verschiedenen Winkeln als dieselbe Form lesbar bleiben - Alter: kein unbeabsichtigtes Älter- oder Jüngerwerden zwischen Einstellungen - Körpertyp: Größe, Statur, Schulterbreite und Haltung sollten zusammenpassen - Lichtreaktion: Haut und Gesichtszüge sollten auch unter anderem Licht als dieselbe Person lesbar bleiben - Performance: Emotion, Energie und Körpersprache sollten wie eine zusammenhängende Rolle wirken - Stil: die visuelle Behandlung sollte von Einstellung zu Einstellung übereinstimmen
Darum ist Figurenkontinuität nicht nur ein Problem der Bilderzeugung. Es ist ein Filmproblem.
Warum ein einzelner Prompt nicht reicht
Ein einzelner Prompt kann eine Figur beschreiben, aber er kann die Identität nicht zuverlässig über eine ganze Szene oder einen Kurzfilm hinweg erzwingen. Prompting hilft, die Absicht festzulegen. Es ersetzt keine Produktionskontrolle.
Wenn du dich nur auf Prompts verlässt, wird jede Einstellung zu einem neuen Versuch. Du kannst in jedem Prompt „dieselbe Frau, rote Jacke, kurze schwarze Haare“ schreiben und trotzdem subtile Abweichungen im Gesicht, Alter oder in der Kleidung erhalten. Das Modell erzeugt jedes Mal eine neue Interpretation.
Deshalb lösen Prompt-Anpassungen allein keine Kontinuität. Sie können ein einzelnes Bild verbessern, aber sie schaffen kein wiederholbares System für die gesamte Sequenz.
Der Workflow, den Filmemacher stattdessen nutzen
Ein zuverlässiger Ansatz ist, Konsistenz wie eine Produktionspipeline zu behandeln:
1. Zuerst eine Figurenreferenz aufbauen Erstelle Charakter-Sheets, Front- und Seitenansichten, Expressions-Referenzen und Wardrobe-Lockups, bevor du Szenen generierst.
2. Stabile Figurenbeschreibungen schreiben Halte die zentrale Identitätssprache unverändert. Schreibe die Figur nicht jedes Mal komplett neu, wenn du eine neue Einstellung erstellst.
3. Shots vor der Generierung planen Nutze Szenenbreakdowns, Shotlists und Storyboards, damit du weißt, welche Winkel, Emotionen und Licht-Setups benötigt werden.
4. Dieselben Referenzen konsequent nutzen Verwende dieselben Bildreferenzen, trainierten Figuren, Requisiten und Garderobenreferenzen über die gesamte Sequenz hinweg.
5. Kontinuität zwischen Einstellungen prüfen Prüfe Gesicht, Kostüm, Silhouette, Geografie, Blickachsen, Lichtführung und Performance, bevor du eine Szene als fertig ansiehst.
Dieser workflow-orientierte Ansatz kommt der echten Produktion viel näher. Wenn du versuchst, mit KI einen Kurzfilm erstellen zu wollen, wird der Unterschied zwischen einem lockeren Prompt-Workflow und einem strukturierten Kontinuitäts-Workflow sehr schnell deutlich.
Ein einfaches Beispiel: eine Dialogszene über mehrere Einstellungen
Stell dir ein Gespräch zwischen zwei Figuren in einer Küche vor:
- Einstellung 1: weite Establishing Shot - Einstellung 2: Halbnahe auf Figur A - Einstellung 3: Halbnahe auf Figur B - Einstellung 4: Nahaufnahme auf Figur A - Einstellung 5: Nahaufnahme auf Figur B - Einstellung 6: Over-the-Shoulder auf Figur A - Einstellung 7: Over-the-Shoulder auf Figur B - Einstellung 8: Reaktionsinsert oder finaler Beat
Wenn du jede Einstellung unabhängig und ohne Character Bible generierst, können leicht Probleme entstehen wie:
- Die Jacke von Figur A wechselt von Rot zu Orange - Das Gesicht von Figur B wirkt in der Nahaufnahme älter - Die Silhouette verschiebt sich, weil das Modell die Körperproportionen verändert - Das Key Light springt zwischen den Einstellungen auf die andere Seite - Die emotionale Performance wirkt in der Gegenperspektive anders - Ein Requisit verschwindet oder verändert seine Position
Ein besserer Prozess wäre:
- die Garderobe vor der Shot-Generierung fixieren - Gesicht, Haare und Körpertyp in einem Character Sheet definieren - für jede Figur ein einziges Referenzbild-Set verwenden - das ganze Gespräch zuerst storyboarden - den Prompt-Wortlaut für identitätskritische Details stabil halten - nur die shotspezifischen Elemente variieren: Bildausschnitt, Kamerawinkel, Aktion und Emotion
Genau diese Art von Kontinuitätsdisziplin nutzen Filmemacher auch im Live-Action-Bereich. KI macht den Bedarf nur sichtbarer.
Warum Licht und Performance so wichtig sind
Viele Creator konzentrieren sich nur auf die Gesichtsgleichheit, aber Licht und Performance sind genauso wichtig.
Eine Figur kann technisch „dieselbe Person“ sein und sich trotzdem inkonsistent anfühlen, wenn:
- die Lichtführung ohne Motivation wechselt - der Gesichtsausdruck sich zu stark von den umliegenden Einstellungen unterscheidet - die Körperhaltung nicht mehr zum emotionalen Zustand der Figur passt - das Energieniveau zwischen den Takes springt
In der Filmsprache ist Konsistenz nicht nur visuelle Identität. Es ist emotionale Kontinuität. Wenn eine Figur in einer Einstellung angespannt und in der nächsten ohne erzählerischen Grund ruhig ist, wirkt die Szene gebrochen, selbst wenn das Gesicht perfekt ist.
Häufige Fehler, die Konsistenz verschlechtern
- Zu starke Prompt-Änderungen von Einstellung zu Einstellung - Jede Einstellung überbeschreiben, bis das Modell neue Details erfindet - Inkonsistente Referenzen für dieselbe Figur verwenden - Den Stil mitten in der Szene ändern und erwarten, dass die Identität erhalten bleibt - Shots neu generieren, ohne Kontinuitätsprüfung - Jede Einstellung als Einzelbild behandeln statt als Teil einer Sequenz - Wardrobe-Locks vergessen und Kleidung abweichen lassen - Körpertyp und Silhouette ignorieren, nicht nur das Gesicht
Die wichtigste Erkenntnis
KI-Figuren zerbrechen, weil Generierung probabilistisch ist, Referenzen abweichen und Szenen oft ohne Produktionsstruktur erstellt werden. Prompting ist hilfreich, aber für vollständige Sequenzkontinuität nicht genug.
Wenn du Figuren willst, die in einem Film über mehrere Einstellungen hinweg bestehen, brauchst du dieselben Dinge, auf die auch Live-Action-Produktionen setzen: stabile Beschreibungen, kontrollierte Referenzen, Shot-Planung, Storyboards und Kontinuitätsprüfung.
Darum sind konsistente Figuren letztlich eine filmische Disziplin und nicht nur ein Prompt-Engineering-Trick. Tools wie Ciaro Pro sind genau auf diesen Workflow ausgelegt, damit Filmemacher Figuren, Referenzen, Shots und Storyboards in einem verbundenen Produktionssystem organisieren können, statt Kontinuität per Hand über verstreute Prompts und Ordner zu verwalten.
Baue zuerst eine Charakter-Bibel auf, bevor du generierst
Wenn du konsistente Figuren in einem KI-Film willst, beginne nicht mit dem Prompt. Beginne mit einer Charakter-Bibel.
Ein Prompt kann jemanden beschreiben, aber eine Charakter-Bibel gibt dir eine wiederholbare Quelle der Wahrheit für jede Einstellung. Das ist wichtig, weil KI-Modelle abweichen. Gesichter verändern sich. Garderoben mutieren. Silhouetten werden schmaler oder breiter. Lichtwechsel können dieselbe Figur wie eine andere Person wirken lassen. Und wenn du Shots einzeln neu generierst, ohne ein Kontinuitätssystem, summieren sich die Unterschiede schnell.
Für Filmemacher geht es bei Konsistenz nicht nur darum, ein „gutes Bild“ zu bekommen. Es geht darum, dieselbe Figur über Szenen, Winkel, Emotionen, Kostüme und Schnitte hinweg wiedererkennbar zu halten – genau wie am echten Set.
Was in eine Charakter-Bibel gehört
Betrachte die Bibel als dein zentrales Referenzpaket. Sie sollte enthalten:
- Character Sheet: Frontansicht, Seitenansicht, 3/4-Ansicht und wichtige Expressions - Visuelle Bibel: Welt der Figur, Tonalität, Farbpalette und stilistische Regeln - Referenzbilder: die stärksten freigegebenen Gesichter, Outfits und Posen - Fixierte Garderobenreferenzen: die exakten Kostümdetails, die sich in einer Szene nicht ändern dürfen - Kontinuitätsnotizen: Alter, Körpertyp, Haare, Accessoires, Haltung und Performance-Stil
Der Punkt ist, die Identität zu fixieren, bevor du irgendetwas generierst. Sobald die Bibel definiert ist, sollten jeder Prompt, jede Referenz, jeder Storyboard-Frame und jede Shot-Entscheidung darauf zurückverweisen.
Warum ein einzelner Prompt nicht reicht
Ein einzelner Prompt kann für ein isoliertes Bild funktionieren, zerbricht aber meist über eine Sequenz hinweg. Das liegt daran, dass Prompts nur ein Teil des Systems sind. Das KI-Ergebnis wird von Zufall, Modellinterpretation, Referenzwechseln, Lichtveränderungen, Kamerawinkeln und Stil-Drift beeinflusst. Wenn du deine Beschreibung jedes Mal änderst, behandelt das Modell jede Einstellung wie eine neue Figur.
Deshalb sind stabile Beschreibungen so wichtig. Deine zentralen Identitätsdetails sollten fest bleiben:
- Gesichtsform und prägende Merkmale - Haarlänge, Farbe und Styling - Kostüm und Accessoires - Silhouette und Körpertyp - scheinbares Alter - Performance-Stil und emotionaler Ausgangszustand - visueller Stil und Rendering-Regeln
Aktion, Bildausschnitt und Emotion kannst du von Einstellung zu Einstellung ändern. Wenn die Charakter-Bibel aber solide ist, sollte die Identität selbst verankert bleiben.
Baue die Bibel, bevor du die Szene planst
Die beste Kontinuität beginnt vor der Generierung. Zerlege die Arbeit für einen Kurzfilm oder eine Dialogszene in Produktionsschritte:
1. Figur definieren 2. Referenzbilder freigeben 3. Garderobe und Requisiten fixieren 4. Szenenbreakdown erstellen 5. Shotlist anlegen 6. Sequenz storyboarden 7. Shots aus demselben Ausgangsmaterial generieren 8. Kontinuität prüfen, bevor du weitermachst
Diese Struktur trennt Filmproduktion von isolierter Bilderstellung. Außerdem macht sie es einfacher, eine Szene mit KI filmen zu wollen, weil jedes Bild als Teil einer Sequenz geplant wird und nicht als eigenständiges Artwork.
Ein praktisches Beispiel: eine Dialogszene, acht Einstellungen
Stell dir eine Szene in einem Kurzfilm zwischen Maya und Tomas in einer Küche vor.
Maya: - 29 Jahre alt - kurze, lockige schwarze Haare - warme braune Haut - schlanker Körperbau - gelber Cardigan, weißes Tanktop, ausgewaschene Jeans - kleine silberne Creolen
Tomas: - 35 Jahre alt - mittlere Körpergröße - olivfarbene Haut - kurzes dunkles Haar mit Seitenscheitel - durchschnittlicher Körperbau - marineblaue Hoodie, schwarze Jeans, abgetragene Sneaker
Jetzt wird daraus ein Kontinuitätspaket:
- Front- und Profil-Character-Sheets für beide erstellen - je ein freigegebenes Close-up für Maya und Tomas speichern - ihre Garderobe für die gesamte Szene fixieren - die Farbpalette und Lichtführung der Küche definieren - die acht Einstellungen vor der Generierung storyboarden
Eine einfache Shotlist könnte so aussehen:
1. Weite Einstellung: beide Figuren betreten den Bildraum 2. Halbnahe auf Maya, während sie spricht 3. Gegenschuss halbnah auf Tomas 4. Nahaufnahme auf Maya in der Reaktion 5. Insert auf die Hände am Tisch 6. Nahaufnahme auf Tomas, der wegschaut 7. Two-Shot, während die Spannung steigt 8. Finale Nahaufnahme auf Maya
Prüfe vor jeder Generierung die Kontinuität gegen die Bibel:
- Ist Mayas Gesicht noch dasselbe? - Hat Tomas’ Hoodie seine Farbe oder Form geändert? - Sind die Ohrringe noch sichtbar? - Bewahrt der Kamerawinkel dieselbe Silhouette? - Ist die Alterswirkung zwischen Nahaufnahme und Totaler konsistent? - Kommt das Licht aus derselben Richtung? - Passt die emotionale Performance zum Beat der Szene?
Dieser Review-Workflow fängt Drift ab, bevor sie teuer wird.
Verwende Referenzen wie ein Produktionsteam
Referenzbilder funktionieren am besten, wenn man sie als Produktions-Assets behandelt und nicht als Inspirations-Pins. Nutze sie kontrolliert:
- ein Master-Gesichtsreferenzbild pro Figur - Expressions-Referenzen für wichtige Emotionen - Garderobenreferenzen für jede Szene oder Sequenz - Requisitenreferenzen für wiederkehrende Objekte - Umgebungsreferenzen für wiederkehrende Locations - Stilreferenzen für die gesamte visuelle Sprache
Wenn du Zugriff auf trainierte Figuren hast, nutze sie als Identitätsanker, aber halte Bibel und Referenzen trotzdem organisiert. Training hilft, ersetzt aber keine Produktionsdisziplin. Du musst die visuellen Inputs weiterhin kontrollieren, besonders wenn die Figur über mehrere Shots stabil bleiben soll.
Halte Prompts dort stabil, wo Kontinuität wichtig ist
Prompts sollten die Bibel unterstützen, nicht mit ihr konkurrieren. Bei continuity-kritischen Shots halte die Identitätssprache konsistent und ändere nur die Variablen, die sich tatsächlich ändern sollen.
Stabil halten: - Name - Alter - Gesichtsbeschreibung - Kleidung - Körpertyp - Farbpalette - Rendering-Stil - Kamerasprache für die Sequenz
Sorgfältig ändern: - Aktion - Emotion - Bildausschnitt - Linsenwirkung - szenenspezifische Beleuchtung - Blocking
Wenn du jede Einstellung anders überbeschreibst, steigt die Wahrscheinlichkeit von Drift. Wenn du den Stil mitten in der Szene änderst, kann das Publikum das Gefühl haben, die Figur habe sich verändert, obwohl das Gesicht gleich geblieben ist. Und wenn du ein einzelnes Bild regenerierst, ohne die umliegenden Frames zu prüfen, kannst du die ganze Sequenz brechen.
Häufige Fehler, die Konsistenz zerstören
Hier sind die größten Probleme, die Filmemacher erleben:
- Prompts zwischen den Einstellungen zu stark verändern - Details überbeschreiben, die eigentlich fest bleiben sollten - Inkonsistente Referenzbilder verwenden - Den Stil mitten in der Szene ändern - Shots isoliert regenerieren, ohne Kontinuitätsprüfung - Garderobenreferenzen nicht fixieren - Lichtführung und Schattenlogik ignorieren - Jede Einstellung als eigenes Bild statt als Teil eines Films behandeln
Diese Fehler sind besonders häufig, wenn Teams schnell arbeiten und versuchen, mit KI-Tools unter Zeitdruck einen Kurzfilm erstellen zu wollen.
Prüfe Kontinuität wie ein Filmemacher
Ein ordentlicher Kontinuitäts-Check sollte über die Frage hinausgehen, ob das Bild „gut“ ist. Prüfe die Filmsprache:
- Gesichtskonsistenz - Kostümkonsistenz - Silhouettenkonsistenz - Alterskonsistenz - Körpertyp-Konsistenz - Lichtkontinuität - Performance-Kontinuität - Stilkontinuität - Blickachsen und Bildrichtung - Geografie und Blocking
Das ist der Unterschied zwischen Bilderzeugung und professioneller Filmproduktion.
Wenn du einen Workflow willst, der all das verbunden hält, ist Ciaro Pro darauf ausgelegt, Filmemachern zu helfen, Figuren, Referenzen, Shots und Storyboards in einem einzigen Produktionssystem zu organisieren. Ein strukturierter Workspace macht es leichter, Bibel, Szenenplan und visuelle Kontinuität vom ersten bis zum letzten Frame zusammenzuhalten.
Konsistenz entsteht durch Produktionsdisziplin, nicht nur durch Prompts. Baue zuerst die Charakter-Bibel auf, und jeder Shot hat eine bessere Chance, zu demselben Film zu gehören.
Plane die Szene wie einen Film, nicht wie einen Prompt
Wenn du konsistente Figuren in KI-Filmen willst, ist der größte Umbruch mental: Behandle nicht jede Generierung als einmalige Bildanfrage, sondern das gesamte Projekt wie eine Filmproduktion.
Ein Prompt kann eine Figur beschreiben. Er kann die Identität über eine vollständige Sequenz allein nicht zuverlässig schützen. Deshalb driften Figuren: Gesichter verändern sich subtil, Kostüme mutieren, Silhouetten werden neu geformt, Alterswahrnehmung ändert sich, Licht kippt die Stimmung, und die Performance verliert von Einstellung zu Einstellung ihre Kontinuität. Das Modell trifft immer Entscheidungen, und wenn dein Workflow locker ist, summieren sich diese Entscheidungen.
Die Lösung ist nicht nur „besseres Prompting“. Es ist eine Produktionsstruktur.
1) Zerlege die Szene in Beats, bevor du irgendetwas generierst
Beginne mit der Szene selbst:
- Was passiert in der Szene? - Wer ist anwesend? - Was verändert sich emotional? - Was muss das Publikum visuell verstehen?
Dann zerlege die Szene in Story-Beats. Eine einfache Dialogszene könnte zum Beispiel werden:
1. Figur A betritt den Raum 2. Figur B reagiert 3. Austausch in Over-the-Shoulder 4. Eine Schlüsselzeile landet 5. Stille oder Machtverschiebung 6. Abgang oder Übergang
Diese Aufteilung ist wichtig, weil jeder Beat einen anderen Kamerawinkel, Bildausschnitt oder eine andere emotionale Performance erfordern kann. Wenn du versuchst, die gesamte Szene als einen vagen Prompt zu generieren, hat das Modell zu viel Freiheit und zu wenig Kontinuitätskontrolle.
2) Erstelle eine Shotlist, bevor du Bilder oder Clips machst
Eine Shotlist macht Konsistenz praktisch.
Definiere für jede Einstellung:
- Shot-Nummer - Kameradistanz und -winkel - Wer im Bild ist - Welche Emotion oder Aktion lesbar sein soll - Was unverändert bleiben muss - Was sich ändern darf
Beispiel:
| Shot | Zweck | Kontinuität muss halten | |---|---|---| | 1 | Weite Establishing Shot | Kleidung, Silhouette, Location, Tageszeit | | 2 | Halbnahe auf Figur A | Gesicht, Alter, Haare, Kleidung, Körpertyp | | 3 | Over-the-Shoulder auf Figur B | Kleidung, Lichtführung, Blickachse | | 4 | Reaktions-Nahaufnahme | Gesichtsidentität, Performance, Stil | | 5 | Insert einer Requisite | Objektdesign, Szenengeografie | | 6 | Two-Shot | Relative Positionen beider Figuren |
Hier gewinnen Indie-Teams oft Kontrolle zurück. Statt Einstellungen zufällig zu generieren, entscheidest du zuerst die Sequenz und produzierst dann darauf hin.
Wenn du einen KI-Storyboard-Generator verwendest, wird dieser Schritt deutlich einfacher, weil Szene, Shotlist und Frames an einem Ort verbunden bleiben.
3) Erstelle Figurenreferenzen vor der Szenengenerierung
Eine konsistente Figur braucht ein Referenzpaket, nicht nur einen Textprompt.
Baue für jede Figur eine einfache visuelle Bibel:
- Frontansicht - Seitenansicht - 3/4-Ansicht - Neutraler Ausdruck - Ein oder zwei emotionale Ausdrücke - Fixierte Garderobenreferenz - Haarreferenz - Körpertyp-Referenz - Markante Silhouette oder Profilform
Schreibe außerdem eine stabile Beschreibung, die sich nur ändert, wenn sich die Story ändert:
- Gesichtsform - Altersbereich - Hautton - Frisur und Haarfarbe - Kleidungsstücke - Körpertyp - Wichtige Accessoires - Performance-Stil - Visueller Stil oder Art Direction
Das ist besonders wichtig, wenn du trainierte Figuren oder Bildreferenzen verwendest. Je öfter du Referenzen tauschst, desto stärker wird die Figur abweichen.
Eine gute Regel: Eine Master-Referenz für Identität, eine Garderobenreferenz für das Kostüm und eine Stilreferenz für den gesamten Filmlook.
4) Fixiere die Kontinuitätsvariablen, die am wichtigsten sind
Wenn eine Figur unerwartet wechselt, liegt es meistens daran, dass eine dieser Variablen nicht fixiert wurde:
- Gesichtskonsistenz - Kostümkonsistenz - Silhouette - Alter - Körpertyp - Lichtführung - Performance - Stil
Das sind die Kontinuitätsdimensionen, die Zuschauer sofort lesen.
Wenn eine Figur zum Beispiel von einer schlanken Silhouette zu einer breiteren wechselt oder von warmem Innenlicht zu hartem Tageslicht ohne erzählerischen Grund springt, spürt das Publikum die Abweichung, auch wenn es sie nicht benennen kann. Dasselbe gilt für Garderobendrift: Eine Jacke wechselt die Farbe, ein Kragen verschwindet oder ein Accessoire geht zwischen zwei Einstellungen verloren.
5) Halte Prompts dort stabil, wo Kontinuität wichtig ist
Prompts sind weiterhin nützlich, aber sie sollten den Workflow unterstützen und nicht ersetzen.
Halte diese Teile über die Shots hinweg stabil:
- Charaktername und Identitätsbeschreibung - Haare, Gesicht, Alter, Körpertyp - fixierte Garderobe - Stil-Sprache der Szene - globaler Filmstil
Lass diese Teile von Shot zu Shot variieren:
- Kamerawinkel - Bildausschnitt - Gesichtsausdruck - Aktion - Zweck der Einstellung
Was du vermeiden solltest, ist, die Figur in jedem Prompt neu zu schreiben. Zu starkes Überbeschreiben erzeugt oft subtile Widersprüche. Du sagst „dieselbe Figur“ und fügst dann zusätzliche Details hinzu, die das Modell in eine andere Interpretation schieben. Das ist eine der häufigsten Ursachen für Drift.
6) Nutze Storyboards als Kontinuitätscheck, nicht nur als Planungsbild
Ein Storyboard ist nicht nur ein visuelles Planungswerkzeug. In der KI-Filmproduktion ist es auch ein Kontinuitätssystem.
Storyboards helfen dir zu prüfen:
- Ist die Figur in jedem Frame wiedererkennbar? - Bleibt die Garderobe fix? - Ergibt die Lichtführung über die Szene hinweg Sinn? - Sind die Blickachsen konsistent? - Ist die Geografie des Raums stimmig? - Schneiden die Shots sauber aneinander?
Wenn eine Einstellung hier scheitert, ist es günstiger, sie zu fixen, bevor du die finale Sequenz generierst.
Deshalb nutzen viele Teams eine strukturierte Arbeitsumgebung wie Ciaro Pro, um Figuren, Referenzen, Shots und Storyboards in einem Produktionsfluss zu halten, statt sie über Ordner und Prompts zu verstreuen.
7) Praktisches Beispiel: eine Dialogszene in acht Einstellungen
Stell dir eine Kurzfilmszene vor: Zwei Geschwister streiten nachts in einer Küche.
Figuren - Figur A: ältere Schwester, rote Arbeitsjacke, kurze schwarze Haare, schlanker Körperbau, müdes Gesicht - Figur B: jüngerer Bruder, grauer Hoodie, lockige Haare, kleinerer Körperbau, nervöse Energie
Referenz-Setup - Character Sheets für beide - Fixierte Garderobenreferenzen - Eine Küchen-Referenz für das Setting - Eine visuelle Bibel mit dem gedeckten, Low-Key-Lichtstil des Films
Shot-Plan 1. Weite Establishing Shot der Küche 2. Halbnahe auf die Schwester beim Betreten des Bildes 3. Halbnahe auf den Bruder am Tisch sitzend 4. Over-the-Shoulder von der Schwester zum Bruder 5. Reverse Over-the-Shoulder vom Bruder zur Schwester 6. Nahaufnahme auf die Reaktion der Schwester 7. Nahaufnahme auf die defensive Antwort des Bruders 8. Two-Shot, wenn sich der Streit beruhigt
Kontinuitäts-Checks vor der Generierung - Die rote Jacke der Schwester bleibt in Farbe und Form gleich - Der graue Hoodie des Bruders bleibt grau, nicht blau oder schwarz - Haarlänge und Silhouette bleiben stabil - Nachtlicht bleibt über alle Winkel konsistent - Die Küchengeografie bleibt unverändert - Die emotionale Intensität steigt, ohne die Identität zu verändern
Das ist der Unterschied zwischen einer Sequenz, die inszeniert wirkt, und einer Sequenz, die zufällig wirkt.
8) Häufige Fehler, die Konsistenz zerstören
Hier sind die häufigsten Probleme:
- Prompts zwischen den Einstellungen zu stark verändern - Jede Einstellung überbeschreiben und versehentlich Widersprüche erzeugen - Inkonsistente Referenzen verwenden - Den Stil mitten in der Szene ändern - Einen Shot isoliert neu generieren, ohne die umliegende Sequenz zu prüfen - Lichtkontinuität ignorieren - Jede Einstellung als separates Kunstwerk statt als Teil einer Filmszene behandeln
Viele KI-Filmemacher machen außerdem den Fehler, Kontinuität als Cleanup-Schritt statt als Planungsschritt zu behandeln. Sobald sie das Problem bemerken, haben sie oft schon zu viel Material generiert, um es sauber zu reparieren.
Das praktische Fazit
Wenn sich KI-Szenen wie Kino anfühlen sollen und nicht wie Experimente, plane sie auch wie Kino. Definiere zuerst die Figur, fixiere die Referenzen, storyboarde die Sequenz und prüfe die Kontinuität, bevor du weitermachst.
Das ist der echte Workflow hinter konsistenten Figuren. Es geht nicht nur darum, härter zu prompten. Es geht darum, das Projekt von Anfang an wie einen Film zu behandeln.
Wenn du ein komplettes Projekt planst, kann Ciaro Pro dir helfen, das Produktionssystem organisiert zu halten, während du vom Skript zum Storyboard bis zu den finalen Shots gehst.
