01 abstract

Die rasche Verbreitung generativer KI verändert grundlegende Verfahren kunsthistorischer Forschung. Modelle, die Texte statistisch erzeugen, simulieren analytische Tiefe, ohne an die methodischen Anforderungen des Faches gebunden zu sein: die Unterscheidung von Beschreibung und Deutung, die Begründung jeder Aussage, der Umgang mit Kontexten, Quellen und theoretischen Ansätzen. Dadurch entsteht ein strukturelles Problem: KI kann überzeugend „klingen“, ohne wissenschaftlich zu arbeiten.

VERA-VM bietet hierfür einen systematischen Gegenentwurf. Das Framework übersetzt kunsthistorische Hermeneutik in eine modulare Architektur (A1–A5), die maschinelle Textproduktion an klare Regeln bindet. Jedes Modul erfüllt eine definierte Aufgabe – von der formalen Beschreibung über die Kontextualisierung und Theorieanwendung bis zur Synthese und Dokumentation – und ist durch Guardrails, Handover-Dateien und Validierungspflichten abgesichert. Die KI wird damit nicht als ersetzende Instanz verstanden, sondern als Werkzeug, das auf wissenschaftliche Verfahren verpflichtet wird.

Die Publikation zeigt, wie VERA-VM eine kontrollierte, reproduzierbare und begründungsorientierte KI-Analyse ermöglicht, die hermeneutische Strukturen wahrt, Interpretationssprünge verhindert und eine transparente Form der Mensch-Maschine-Kooperation schafft.

02 Einleitung

Die kunsthistorische Forschung befindet sich in einem methodischen Umbruch. Mit der breiten Verfügbarkeit generativer KI-Systeme sind erstmals Werkzeuge entstanden, die in der Lage scheinen, komplexe Bildanalysen, Kontextualisierungen und theoretische Einbettungen sprachlich zu simulieren. Diese Entwicklung erzeugt zugleich Faszination und Irritation. Was auf den ersten Blick wie eine radikale Beschleunigung und Vereinfachung wissenschaftlicher Arbeit erscheint, entpuppt sich bei genauerer Betrachtung als epistemische Herausforderung: KI erzeugt Texte auf Grundlage statistischer Muster, nicht aufgrund von Erkenntnisprozessen, methodischen Prüfungen oder hermeneutischer Erfahrung.

Damit stellt sich eine grundlegende Frage: Was bleibt von kunsthistorischer Hermeneutik, wenn ihre Struktur nicht mehr garantiert ist? Die traditionellen Verfahren der Disziplin – genaue Beobachtung, Kontextwissen, theoretische Einordnung, argumentative Deutung – sind nicht zufällig entstanden. Sie bilden eine historische und methodische Antwort auf die Komplexität visueller Zeugnisse. Werden diese Verfahren durch sprachmodellbasierte Automationen unterlaufen, droht die Wissenschaftlichkeit des Faches ausgehöhlt zu werden.

Hier setzt VERA-VM an. Das Framework versteht sich nicht als Ersatz der Kunsthistorikerin oder des Kunsthistorikers, sondern als methodische Rahmung maschineller Prozesse. Indem es die Analyse in klar abgegrenzte Module gliedert – formale Beschreibung, Kontextualisierung, Theorieanwendung, Synthese – zwingt VERA-VM die KI in eine strukturierte Arbeitsweise, die an wissenschaftliche Standards gekoppelt bleibt. Die Maschine soll nicht „interpretieren“, sondern definierten Verfahren folgen, die Transparenz und Begründbarkeit gewährleisten.

Die Einleitung erläutert diese Ausgangssituation, beschreibt die Risiken unkontrollierter KI-Textproduktion und begründet, warum ein modular aufgebautes, hermeneutisch diszipliniertes System notwendig ist. VERA-VM ist weniger ein technisches Tool als ein epistemisches Konzept: ein Versuch, die spezifische Qualität kunsthistorischer Erkenntnis im digitalen Zeitalter zu bewahren und zugleich neue Formen der Mensch-Maschine-Kooperation zu ermöglichen.

03 Problemstellung

KI und Bildanalyse

Generative KI kann in kurzer Zeit umfangreiche Texte zur Bildanalyse erzeugen. Diese Texte basieren jedoch nicht auf präziser visueller Beobachtung, sondern auf statistischen Musterfortsetzungen. Die Modelle erzeugen Beschreibungen, die plausibel wirken, aber nicht sicher an das konkrete Bild gebunden sind. Dadurch verschwimmen die Grenzen zwischen formaler Beobachtung, Interpretation und Kontextzuschreibung. KI kann keine visuelle Evidenz prüfen, sondern extrapoliert aus Trainingsdaten. Das führt zu inhaltlichen Ungenauigkeiten, Vermischungen unterschiedlicher Bildtypen und inkonsistenten Beschreibungen. Ohne methodische Rahmung verliert die Bildanalyse ihre Bindung an Wahrnehmung, Terminologie und kunsthistorische Standards.


Verlust hermeneutischer Tiefe

Kunsthistorische Hermeneutik ist ein gestuftes Erkenntnisverfahren, das zwischen Sichtbarem, Kontexten und Deutungen unterscheidet. Sprachmodelle rekonstruieren diese Struktur nicht, sondern erzeugen eine synthetische Oberfläche, die analytische Tiefe imitiert. Formale Beschreibung und Interpretation werden nicht getrennt, theoretische Konzepte erscheinen als unverbindliche Schlagworte, und historische Bezüge lösen sich in allgemeinen Wendungen auf. Damit geht der Kern hermeneutischer Arbeit verloren: argumentatives Fortschreiten, Begründungspflicht und kritische Reflexion. KI erzeugt Texte, die wie wissenschaftliche Deutungen wirken, aber nicht durch methodische Schritte gedeckt sind.


Epistemische Risiken

Unkontrollierte KI-Textproduktion kann den Eindruck belastbarer Erkenntnis erwecken, obwohl die zugrunde liegende Operation rein probabilistisch ist. Dies führt zu epistemischen Risiken: erfundene Fakten, nicht belegbare Zuschreibungen, unsichtbare Mischungen aus Stilmustern, verzerrte historische Bezüge und die Gefahr, dass fehlerhafte Inhalte durch Wiederholung Autorität gewinnen. Da weder Quellenwege noch Begründungen offengelegt werden, entsteht eine Form von Schein-Objektivität. Ohne klare Vorgaben wird KI zum Verstärker bestehender Verzerrungen – nicht zu einem Werkzeug kontrollierter wissenschaftlicher Analyse.

04 – These und Leitidee

Notwendigkeit strukturierter KI

Die gegenwärtige Nutzung generativer KI in der kunsthistorischen Analyse führt zu einem grundlegenden Problem: Die Modelle erzeugen sprachlich überzeugende Texte, ohne an das methodische Fundament der Kunstgeschichte gebunden zu sein. Beschreibung, Kontextualisierung und Interpretation erscheinen als zusammenhängender Fluss, obwohl sie in der hermeneutischen Praxis klar getrennte Schritte sind. Diese Unschärfe macht KI-basierte Analysen wissenschaftlich schwer überprüfbar.
VERA-VM formuliert daher die These, dass KI nur dann sinnvoll in kunsthistorischen Arbeitsprozessen eingesetzt werden kann, wenn sie in eine klar strukturierte, modular aufgebaute Methodik eingebettet wird. KI muss gezwungen werden, nach definierten Regeln zu operieren, statt spontan „analytisch klingende“ Texte zu generieren.


VERA-VM als Gegenentwurf

VERA-VM bietet ein Framework, das KI in einen kontrollierten Ablauf einbettet: Die Analyse wird in fünf Module gegliedert (A1–A5), die jeweils eine klar abgegrenzte Aufgabe erfüllen. Jeder Schritt baut auf dem vorherigen auf und verhindert damit, dass Interpretation ohne vorherige Sichtung oder Kontextanalyse entsteht.
Durch den modularen Aufbau wird die KI zu einem Werkzeug, das methodisch disziplinierte Einzelschritte ausführt. Die Maschine ersetzt nicht die kunsthistorische Urteilsbildung, sondern unterstützt sie, indem sie innerhalb eines klar regulierten Systems arbeitet. Das Framework schafft eine Form maschinengestützter Hermeneutik, die transparent, nachvollziehbar und prüfbar bleibt.


Wissenschaftliche Prinzipien

Die Leitidee hinter VERA-VM basiert auf drei wissenschaftlichen Grundprinzipien:

  1. Begründungspflicht:
    Jede Aussage, besonders jede Deutung, muss auf vorhergehenden Analysephasen beruhen und nachvollziehbar sein.

  2. Trennung der Ebenen:
    Beschreibung, Kontextualisierung, Theorieanwendung und Interpretation dürfen nicht vermischt werden. KI muss diese Ordnung einhalten.

  3. Transparenz der Verfahren:
    Die Schritte der maschinellen Analyse müssen sichtbar und überprüfbar sein. Nur so kann der Prozess als wissenschaftlich gelten.

VERA-VM ist damit keine technische Optimierung, sondern ein methodischer Ansatz, der die Besonderheiten kunsthistorischer Erkenntnis schützt, während er zugleich die Möglichkeiten der KI nutzbar macht.

Kapitel 05 – Architektur A1–A5

Überblick des Analysezyklus

Der Analyseprozess von VERA-VM folgt einer klar definierten, modularen und sequenziellen Struktur. Jede Phase besitzt eine eindeutige methodische Funktion und ist durch ein standardisiertes Handover mit den folgenden Schritten verbunden. Ziel ist eine kontrollierte, nachvollziehbare und wissenschaftlich überprüfbare KI-Analyse, die den Grundprinzipien kunsthistorischer Hermeneutik verpflichtet bleibt.
Der Zyklus beginnt mit der rein formalen Beobachtung (A1), führt über die Kontextualisierung (A2) zur theoriegeleiteten Analyse (A3) und mündet in die interpretative Synthese (A4). Abschließend werden alle Ergebnisse strukturiert dokumentiert (A5). Dadurch entsteht ein Analyseablauf, der Interpretationssprünge verhindert und eine transparente Argumentationskette gewährleistet.


Modul A1 – Formale Bildanalyse

A1 bildet den Ausgangspunkt der Analyse. In dieser Phase beschreibt die KI ausschließlich sichtbare Bildelemente: Komposition, Raum, Perspektive, Farb- und Lichtgestaltung, Materialität, Technik, Gattung sowie die innere visuelle Logik des Bildes.
Wichtig ist die strikte Regel: Keine Interpretation, keine Kontextannahmen, keine historischen Zuschreibungen. A1 erzeugt ein präzises Protokoll des Sichtbaren und schafft die Grundlage für alle weiteren Schritte.


Modul A2 – Kontextualisierung

A2 erweitert die Analyse um historische, kulturelle und werkbezogene Kontexte. Dazu gehören Entstehungszeit, Künstler:in, Standort, Gattungstradition, ikonografische Konventionen und gesellschaftliche Rahmenbedingungen.
Auch hier bleibt der Text analytisch und beschreibend. Interpretative Aussagen sind nicht zulässig. A2 schafft den notwendigen Wissensrahmen, der später die Theorieanwendung und Deutung trägt.


Modul A3 – Theorieanwendung

A3 ist die Phase der reflektierten, methodischen Anbindung an einen kunsthistorischen Theorieansatz. Die KI wendet hier ein zuvor festgelegtes Modell an – etwa Panofsky, Imdahl, Warburg, Belting oder Eco.
A3 darf keine freien Interpretationen formulieren, sondern muss die theoretischen Instrumente korrekt und auf Basis der bisherigen Phasen anwenden. Es handelt sich um die methodische Analyseebene, die kritische Begriffe, Kategorien und Argumentationsschritte einführt.


Modul A4 – Interpretation und Synthese

A4 führt die Ergebnisse aus A1, A2 und A3 zusammen. Erst an diesem Punkt ist eine begründete Interpretation zulässig.
Die KI formuliert eine Synthese, die sichtbar macht, wie die formalen Beobachtungen, der historische Kontext und der gewählte Theorieansatz zusammenwirken.
Der Kern von A4 ist die Argumentationslogik: Jede Aussage muss aus den vorherigen Modulen ableitbar sein. Freie Vermutungen, spontane Einfälle oder nicht belegte Zuschreibungen sind ausgeschlossen.


Modul A5 – Dokumentation

In A5 werden alle Zwischenergebnisse und die finale Interpretation zusammengeführt.
Das Modul erstellt:

  • eine strukturierte Darstellung der Analyse
  • eine klare Gliederung aller Teilschritte
  • Metadaten zum Werk
  • verwendete Theorien und Konzepte
  • optionale Literaturhinweise
  • ein reproduzierbares Gesamtdokument

A5 dient der wissenschaftlichen Nachvollziehbarkeit und macht den gesamten Prozess transparent.


Handover-Mechanismus

Ein zentrales Element der Architektur ist der standardisierte Handover zwischen den Modulen. Jedes Modul erzeugt ein JSON-Dokument, das nur die Informationen enthält, die methodisch erlaubt sind — nicht mehr und nicht weniger.
Interpretation ist erst möglich, wenn A1–A3 vollständig und konsistent vorliegen.
Der Handover zwingt die KI zu einer disziplinierten Arbeitsweise und verhindert methodisch illegitime Abkürzungen oder erfundene Inhalte.

█▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀█
█ TEXTGRAFIK 01 █
█ ANALYSEZYKLUS █
█▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄█

> A1 → A2 → A3 → A4 → A5
> Modularer Analyseweg
> Hermeneutischer Ablauf

Diagramm 1: Analysezyklus (Terminal-Style)
█▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀▀█
█ TEXTGRAFIK 02 █
█ HANDOVER-PROZESS █
█▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄▄█

> Modul X → Handover.json → Modul Y
> Prüfung der Konsistenz
> Terminologische Angleichung

Diagramm 2: Handover-Mechanismus (Terminal-Style)

06 – Methodischer Imperativ

Wahrheit und Form

Die kunsthistorische Analyse basiert auf dem Anspruch, sichtbare und konzeptuelle Strukturen eines Werkes wahrheitsgemäß zu erfassen und nachvollziehbar zu beschreiben. Dieser Anspruch ist nicht abstrakt, sondern konkret: Jede Beobachtung, jede Kontextangabe, jede theoretische Verbindung muss sich aus dem Werk oder aus belastbaren Quellen herleiten lassen.
Der methodische Imperativ von VERA-VM verpflichtet die KI auf diese Wahrheitspraxis. Die Maschine darf nicht „ins Freie“ formulieren, sondern muss sich an die Ordnung des Materials binden. Wahrheit ist in VERA-VM nicht metaphysisch gemeint, sondern als empirische und methodische Redlichkeit: sichtbar Gesichertes wird klar benannt, Spekulationen sind nicht zulässig.


Begründungspflicht

Kunsthistorische Aussagen haben immer eine argumentative Struktur. Eine Interpretation ohne Begründung bleibt eine Behauptung. Die Begründungspflicht ist deshalb ein Kernmoment wissenschaftlicher Arbeit: Jeder interpretative Schritt muss auf vorhergehenden Beobachtungen, Kontexten oder theoretischen Konzepten aufbauen.
VERA-VM überträgt diesen Grundsatz in eine technische Architektur. Das Framework erzwingt eine Abfolge von Modulen, in denen jede Phase nur auf bereits gesicherten Daten aufbauen darf. Die KI kann erst interpretieren (A4), wenn Beschreibung (A1), Kontext (A2) und Theorieanwendung (A3) vollständig und plausibel vorliegen. Dadurch entsteht eine kontrollierte argumentative Entwicklung statt frei oszillierender Assoziationstexte.


Transparenz und Quellenkritik

Wissenschaftliche Analyse erfordert nicht nur Ergebnisse, sondern auch eine transparente Darstellung des Weges, der zu diesen Ergebnissen geführt hat. Für menschliche Autor:innen ist dies selbstverständlich; für KI muss es erzwungen werden.
VERA-VM verlangt daher, dass jede Phase einzeln dokumentiert und die verwendeten Daten offengelegt werden. Die Struktur verhindert, dass KI Inhalte halluziniert oder Quellen „simuliert“. Stattdessen werden Kontextinformationen, theoretische Begriffe und interpretative Ableitungen klar voneinander getrennt und nachvollziehbar ausgewiesen. Diese Transparenz ermöglicht es, Fehler zu erkennen und die Qualität der Analyse zu überprüfen.


Langsamkeit als Tugend

Die Geschwindigkeit von KI ist gleichzeitig ihre größte Gefahr: Sie erzeugt in Sekunden Texte, die wie fertige Interpretationen wirken, ohne die Zwischenschritte sichtbar zu machen. Der methodische Imperativ von VERA-VM setzt bewusst auf die Tugend der Langsamkeit.
Langsamkeit bedeutet hier nicht Trägheit, sondern methodische Disziplin: Die Analyse entfaltet sich Schritt für Schritt. Die Maschine wird gezwungen, innezuhalten, zu prüfen, zu begründen und zu dokumentieren. Diese kontrollierte Verzögerung ist kein Hindernis, sondern eine epistemische Voraussetzung dafür, dass KI-gestützte Analysen wissenschaftlich belastbar bleiben.

07 – Fallbeispiel (A1–A4 Durchlauf)

Einführung in das Fallbeispiel

Um die Funktionsweise von VERA-VM nachvollziehbar zu machen, zeigt dieses Kapitel einen exemplarischen Analyseprozess anhand eines bekannten Kunstwerks. Das gewählte Beispiel dient nicht primär der inhaltlichen Interpretation, sondern der Demonstration der methodischen Architektur: Wie die Module A1 bis A4 ineinandergreifen, wie Zwischenschritte voneinander getrennt bleiben und wie die KI gezwungen wird, schrittweise vorzugehen.
Der Fokus liegt weniger auf dem Werk selbst als auf dem didaktischen Wert der Analyse.


A1 – Formale Bildanalyse

Die Analyse beginnt mit einer streng beschreibenden Erfassung des Sichtbaren. Das Werk wird ausschließlich auf Basis seiner formalen Strukturen untersucht: Komposition, Raumorganisation, Lichtführung, Farbverteilung, Materialität, Technik und Bildelemente.
Dieser Schritt ist bewusst eng gefasst. Die KI darf keine biografischen oder historischen Informationen einführen und keine interpretativen Zuschreibungen vornehmen. A1 dient der Klärung der formalen Eigenlogik des Bildes – der Weise, in der es sich selbst strukturiert und visuell organisiert.


A2 – Kontextualisierung

Im zweiten Schritt wird der Kontext des Werkes rekonstruiert: Entstehungszeit, Künstler:in, kulturelle Situation, Gattungstraditionen, ikonografische Konventionen und mögliche historische Bezugspunkte.
A2 bewegt sich weiterhin im Bereich der Analyse, nicht der Deutung. Die Kontextinformationen dürfen nur aus belastbaren historischen Daten oder etablierten kunsthistorischen Wissensbeständen stammen. Sie dienen dazu, die Voraussetzungen für eine spätere Interpretation zu schaffen, ohne bereits interpretativ aktiv zu werden.


A3 – Theorieanwendung

A3 überführt die bisherigen Beobachtungen in eine methodisch fundierte Untersuchung. Hier wird ein theoretischer Ansatz gewählt – beispielsweise Panofskys ikonologische Methode, Imdahls Ikonik, Warburgs Pathosformel-Modell oder Ecos semiotischer Ansatz.
Die KI muss die Begriffe und Kategorien dieses Ansatzes korrekt verwenden und auf die Ergebnisse aus A1 und A2 beziehen. A3 ist kein Interpretationsraum, sondern eine kontrollierte methodische Erweiterung, die Klärung schafft und die Grundlage für die spätere Synthese legt.


A4 – Interpretation und Synthese

Erst in A4 werden die vorherigen Schritte miteinander verbunden. Die Interpretation entsteht als Ergebnis der strukturierten Analyse, nicht als spontaner Einfall.
Die KI führt formale Merkmale, Kontextwissen und theoretische Konzepte zusammen, um eine begründete Deutung zu formulieren. Jede Aussage muss sich logisch aus A1–A3 ergeben. Der Prozess zwingt die KI zu einer nachvollziehbaren Argumentation und verhindert Projektionen oder erfundene Bedeutungen.
A4 macht sichtbar, dass Interpretation nicht einfach „Beschreibung in schön“ ist, sondern ein eigenständiger Schritt, der zwingend eine methodische Vorbereitung benötigt.


Didaktische Bedeutung des Fallbeispiels

Das Fallbeispiel zeigt, wie VERA-VM seine Stärke entfaltet: Die Maschine wird nicht als Orakel eingesetzt, sondern als Werkzeug, das innerhalb klarer methodischer Grenzen operiert.
Der modulare Ablauf verhindert Kurzschlüsse und ermöglicht es, Fehlerquellen transparent zu machen. Gleichzeitig wird die KI zu einem produktiven Partner in der Analyse, der systematisch vorgeht und Einsichten liefert, die nachvollziehbar und prüfbar bleiben.
Das Beispiel macht deutlich, dass die Verbindung von KI und kunsthistorischer Hermeneutik nur dann sinnvoll ist, wenn eine strukturierende Architektur vorhanden ist.

08 – Vergleichsmatrix

Einleitung

Die Entwicklung von VERA-VM erfolgt nicht im Vakuum. Verschiedene Projekte, Forschungsinitiativen und technologische Ansätze setzen sich bereits mit KI und Bildanalyse auseinander, jedoch mit unterschiedlichen Zielen, Methoden und epistemischen Grundlagen.
Die folgende Vergleichsmatrix zeigt, wie VERA-VM sich in diesem Feld positioniert und worin seine Besonderheit besteht. Dabei werden fünf etablierte Kategorien betrachtet: wissenschaftliche KI-Projekte, universitäre Kunst-KI-Initiativen, Digital Art History, klassische Computer-Vision-Verfahren und die traditionelle Hermeneutik der Kunstgeschichte.

Standardvergleich (immer identisch aufgebaut)
Legende: 🟩 = vorhanden    🟨 = teilweise / rudimentär    🟥 = fehlt

Methode / Feature VERA-VM ReflectAI (LMU) Stanford AI & Art Digital Art History Computer Vision Klassische Hermeneutik
Modulare Pipeline A1–A5 🟩 🟥 🟥 🟥 🟥 🟥
Formanalyse (A1) 🟩 🟨 🟨 🟥 🟩 (technisch) 🟩
Kontextualisierung (A2) 🟩 🟥 🟨 🟩 (Metadaten) 🟥 🟩
Theorieanwendung (A3) 🟩 🟩 (didaktisch) 🟥 🟥 🟥 🟩
Interpretation / Synthese (A4) 🟩 🟨 🟥 🟥 🟥 🟩
PDF / Archivierung (A5) 🟩 🟥 🟥 🟥 🟥 🟥
Verstehensprüfung / Handover 🟩 🟥 🟥 🟥 🟥 🟩 (menschlich)
Guardrails / methodischer Imperativ 🟩 🟨 🟥 🟥 🟥 🟩
Quellenkritik integriert 🟩 🟨 🟥 🟥 🟥 🟩
KI als Ko-Analytiker 🟩 🟨 🟨 🟥 🟥 🟥
Hermeneutische Struktur 🟩 🟨 🟥 🟥 🟥 🟩

1. ReflectAI (LMU München)

Fokus: kritische KI-Didaktik und wissenschaftliche Reflexion

ReflectAI untersucht KI-Bildanalysen aus einer didaktischen und reflexiven Perspektive. Das Projekt vermittelt, wie KI zu bewerten ist, welche Fehler sie produziert und wie Studierende mit maschinellen Beschreibungen kritisch umgehen können.
Es handelt sich nicht um ein produktives Analysewerkzeug, sondern um ein Reflexionsinstrument. KI wird als Gegenstand kritischer Auseinandersetzung verstanden.

Unterschied zu VERA-VM:
VERA-VM ist kein Reflexionsangebot, sondern ein operatives System. Es strukturiert KI nicht didaktisch, sondern funktional: durch Module, Handover-Regeln und analytische Disziplin. Der Fokus liegt auf der Produktion kontrollierter Analysen, nicht auf der pädagogischen Kontextualisierung.


2. Stanford AI & Art Initiative

Fokus: technische Experimente und explorative Bildinterpretationen

Die Stanford-Initiative verbindet Informatik und Kunstgeschichte in experimenteller Weise. KI wird genutzt, um Muster zu erkennen, ästhetische Merkmale zu analysieren oder hypothetische Stilvergleiche zu erstellen. Die Ergebnisse sind explorativ, nicht methodisch gebunden.
Die Projekte liefern inspirierende Einsichten, aber die Texte und Analysen sind nicht hermeneutisch strukturiert.

Unterschied zu VERA-VM:
VERA-VM arbeitet nicht explorativ, sondern methodenbasiert. Die KI darf keine freien Deutungen formulieren, keine assoziativen Beschreibungen erzeugen und keine ungesicherten Stilzuschreibungen vornehmen.
Die Stanford-Ansätze bleiben experimentell – VERA-VM ist ein kontrolliertes Framework mit wissenschaftlichem Anspruch.


3. Digital Art History (DAH)

Fokus: Big Data, Mustererkennung und visuelle Clusteranalyse

Die Digital Art History untersucht große Datenmengen: Bildkorpora, formale Muster, Beziehungsnetzwerke. KI wird genutzt, um Stilgruppen, Cluster, Trends oder ikonografische Variationen zu erkennen. Die Ergebnisse können analytisch wertvoll sein, beziehen sich jedoch selten auf ein einzelnes Werk in hermeneutischer Tiefe.

Unterschied zu VERA-VM:
VERA-VM ist ein werkbezogenes Verfahren. Es analysiert nicht tausende Bilder gleichzeitig, sondern ein konkretes Kunstwerk anhand eines modularen, nachvollziehbaren Analysepfades.
Während DAH Strukturen im großen Maßstab untersucht, wendet VERA-VM Prinzipien der Einzelwerkanalyse an.


4. Computer Vision

Fokus: algorithmische Mustererkennung ohne hermeneutische Ebene

Computer-Vision-Systeme analysieren Bilder mathematisch: Kanten, Formen, Farbräume, Features, Objekterkennung. Diese Verfahren sind extrem leistungsfähig, aber blind für Bedeutung, historische Kontexte oder ästhetische Synthesen.
Sie liefern Datenpunkte, keine Interpretation.

Unterschied zu VERA-VM:
VERA-VM nutzt Large Language Models, keine CV-Algorithmen. Die Analyse ist sprachlich, hermeneutisch und theoriegebunden.
Während Computer Vision nur quantitative Informationen erzeugt, erzeugt VERA-VM qualitative und argumentativ strukturierte Analysen.


5. Klassische kunsthistorische Hermeneutik

Fokus: methodische Disziplin, Argumentation, Kontextwissen

Die traditionelle Hermeneutik arbeitet mit einer klaren Trennung von Beschreibung, Kontext, Theorie und Interpretation. Sie verlangt Begründung, Quellenkritik und argumentatives Vorgehen.
Dies bildet den methodischen Kern kunsthistorischer Wissenschaft.

Unterschied zu VERA-VM:
VERA-VM imitiert diese Struktur nicht — es implementiert sie.
Die Module A1–A5 bilden die kunsthistorische Arbeitsweise technisch ab, erzwingen die Trennung der Ebenen und binden jede Aussage an überprüfbare Zwischenschritte.
VERA-VM ist damit kein Ersatz für Hermeneutik, sondern eine maschinelle Umsetzung hermeneutischer Disziplin.


Fazit der Vergleichsmatrix

Die Analyse zeigt: VERA-VM steht in keinem direkten Wettbewerb mit bestehenden KI- oder DH-Ansätzen. Es ist weder ein Reflexionsangebot noch ein technisches Experiment, weder Big-Data-Analyse noch Computer Vision.
VERA-VM ist ein methodisches Framework, das KI in die Ordnung kunsthistorischer Erkenntnis einpasst und dadurch ein bislang fehlendes Element einführt: eine kontrollierte, wissenschaftlich belastbare maschinelle Hermeneutik.

09 Diskussion

Zentrale Stellung von VERA-VM im Spannungsfeld zwischen KI und Hermeneutik

Die Diskussion widmet sich der Frage, welche Rolle VERA-VM im gegenwärtigen Übergang zwischen traditioneller kunsthistorischer Methodik und KI-gestützten Analyseverfahren einnimmt.
Während generative Modelle beeindruckende syntaktische Leistungen erbringen, offenbaren sie zugleich fundamentale epistemische Schwächen: fehlende Verlässlichkeit, Vermischung analytischer Ebenen, eine Tendenz zu glatten, aber unbegründeten Aussagen.

VERA-VM positioniert sich dazwischen: nicht als Gegenpol zu KI, sondern als methodische Rahmung, die aus einem unkontrollierten Generator ein diszipliniertes Analysewerkzeug macht.
Die Diskussion zeigt, dass das Framework zwei zentrale Probleme adressiert:

  1. epistemische Unsicherheit generativer KI,
  2. Verlust methodischer Struktur im digitalen Arbeitsprozess.

Hermeneutische Stabilität im KI-Zeitalter

Die Module A1 bis A5 übertragen die klassische Trennung von Beschreibung, Kontext, Theorie und Interpretation in eine maschinenlesbare Form.
Diese Struktur schafft eine bemerkenswerte Stabilität: Die KI kann Fehler machen, aber nicht beliebig springen; sie muss Schritte begründen und darf Deutungen erst auf Basis gesicherter Informationen formulieren.

Damit bildet VERA-VM eine Brücke zwischen:

  • historischer Methodendisziplin
  • und maschineller Textproduktion.

Chancen und Transformationspotenziale

Die Diskussion macht deutlich, dass VERA-VM nicht nur ein Schutzmechanismus ist.
Es eröffnet auch neue Potenziale:

  • präzise, schnell generierte Zwischenstände
  • strukturierte Analysen für die Lehre
  • automatisierte Dokumentation wissenschaftlicher Ergebnisse
  • Einbindung theoretischer Modelle in kontrollierter Form
  • Wiederholbarkeit und Vergleichbarkeit von Analysen

Diese Potenziale verändern nicht das Wesen der Kunstgeschichte, aber sie verändern die Praxis und die Arbeitsabläufe.


Risiken und offene Fragen

Trotz der Vorteile bleiben offene Diskussionspunkte:

  • Wie viel Verantwortung darf einer KI in der Analyse überlassen werden?
  • Wie vermeiden wir eine Überästhetisierung maschineller Texte?
  • Welche Prüfmechanismen müssen etabliert werden, damit Ergebnisse nicht unkritisch übernommen werden?
  • Wie kann VERA-VM in universitäre Curricula eingebettet werden?
  • Wie wird mit divergierenden Interpretationen umgegangen?

Diese Fragen zeigen, dass VERA-VM kein Endpunkt, sondern ein Vorschlag zur Neuorientierung ist.


Zwischenfazit

Die Diskussion verdeutlicht:
VERA-VM ist weniger ein technisches Produkt als ein methodisches Angebot.
Es strukturiert KI in einer Weise, die wissenschaftliche Arbeit nicht ersetzt, sondern unterstützt.

Damit bildet es ein Modell, wie KI-gestützte Erkenntnisprozesse in der Zukunft aussehen können:
kontrolliert, nachvollziehbar, modular und wissenschaftlich redlich.

10 Methodische und epistemische Grenzen

Auch ein strukturiertes Framework wie VERA-VM kann die grundlegenden Grenzen von KI nicht aufheben.
Die KI besitzt keine echte visuelle Wahrnehmung, keine historische Urteilskraft und keine eigenständige Theoriekompetenz.
Sie operiert ausschließlich über Musterstatistik.

Die Grenzen des Systems liegen deshalb nicht im Code, sondern in der Natur der Modelle:

  • fehlende echte Bildwahrnehmung
  • unvermeidbare Halluzinationen
  • Reduktion historischer Komplexität
  • Risiko der Überinterpretation
  • keine Quellenkritikfähigkeit
  • Abhängigkeit vom Prompt und den Modulen

VERA-VM kann diese Grenzen nur sichtbar machen, nicht eliminieren.


Technische Einschränkungen

Die technische Umsetzung bringt eigene Begrenzungen mit sich:

  • JSON-Handover sind streng, aber fehleranfällig
  • inkonsistente A1-Beschreibungen können A4 zerstören
  • komplexe Theorien lassen sich nur teilweise präzise in Prompts abbilden
  • große Bildkomplexität überfordert KI-Modelle strukturell

VERA-VM ist daher ein Kontrollsystem, kein Ersatz für wissenschaftliche Expertise.


Notwendigkeit menschlicher Kontrolle

Keine KI-Analyse, auch nicht im Rahmen von VERA-VM, ist ohne menschliche Kontrolle wissenschaftlich belastbar.
Das System zwingt zur Struktur — aber nur der Mensch kann:

  • Fehler erkennen
  • Theorien korrekt einordnen
  • Abweichungen bewerten
  • Interpretationen plausibilisieren

Damit stellt VERA-VM die Rollen klar:

KI analysiert strukturell.
Der Mensch urteilt wissenschaftlich.

Ausblick

Zukunft wissenschaftlicher Analyse im KI-Zeitalter

VERA-VM ist weniger ein abgeschlossenes System als ein Ausgangspunkt.
Zukünftige Erweiterungen werden die Module A6 bis A9 ausbauen: Validierung, Quellenkritik, Ethik, Archivierung.
Diese Schritte machen aus VERA-VM eine vollständige methodische Infrastruktur.

Darüber hinaus eröffnen sich Cross-Domain-Anwendungen:

  • Forensik
  • Medizinische Befundung
  • Journalismus
  • Sozialwissenschaften
  • Didaktische Analyseprozesse

In allen Bereichen kann VERA-VM KI-Outputs wissenschaftlich disziplinieren.

Der Ausblick zeigt:
Die Zukunft der KI-gestützten Forschung liegt nicht in immer größeren Modellen, sondern in besseren methodischen Architekturen.