Auch ein strukturiertes Framework wie VERA-VM kann die grundlegenden Grenzen von KI nicht aufheben.
Diese Kategorie enthält die elf Kapitel der wissenschaftlichen Publikation über VERA-VM, die hier kapitelweise abgelegt wurde
VERA-VM ist weniger ein abgeschlossenes System als ein Ausgangspunkt.
Die Diskussion widmet sich der Frage, welche Rolle VERA-VM im gegenwärtigen Übergang zwischen traditioneller kunsthistorischer Methodik und KI-gestützten Analyseverfahren einnimmt.
Die Entwicklung von VERA-VM erfolgt nicht im Vakuum. Verschiedene Projekte, Forschungsinitiativen und technologische Ansätze setzen sich bereits mit KI und Bildanalyse auseinander, jedoch mit unterschiedlichen Zielen, Methoden und epistemischen Grundlagen.
Die kunsthistorische Analyse basiert auf dem Anspruch, sichtbare und konzeptuelle Strukturen eines Werkes wahrheitsgemäß zu erfassen und nachvollziehbar zu beschreiben. Dieser Anspruch ist nicht abstrakt, sondern konkret: Jede Beobachtung, jede Kontextangabe, jede theoretische Verbindung muss sich aus dem Werk oder aus belastbaren Quellen herleiten lassen.
Der Analyseprozess von VERA-VM folgt einer klar definierten, modularen und sequenziellen Struktur. Jede Phase besitzt eine eindeutige methodische Funktion und ist durch ein standardisiertes Handover mit den folgenden Schritten verbunden. Ziel ist eine kontrollierte, nachvollziehbare und wissenschaftlich überprüfbare KI-Analyse, die den Grundprinzipien kunsthistorischer Hermeneutik verpflichtet bleibt.
VERA-VM bietet ein Framework, das KI in einen kontrollierten Ablauf einbettet: Die Analyse wird in fünf Module gegliedert (A1–A5), die jeweils eine klar abgegrenzte Aufgabe erfüllen. Jeder Schritt baut auf dem vorherigen auf und verhindert damit, dass Interpretation ohne vorherige Sichtung oder Kontextanalyse entsteht.
Durch den modularen Aufbau wird die KI zu einem Werkzeug, das methodisch disziplinierte Einzelschritte ausführt.
Generative KI kann in kurzer Zeit umfangreiche Texte zur Bildanalyse erzeugen. Diese Texte basieren jedoch nicht auf präziser visueller Beobachtung, sondern auf statistischen Musterfortsetzungen. Die Modelle erzeugen Beschreibungen, die plausibel wirken, aber nicht sicher an das konkrete Bild gebunden sind. Dadurch verschwimmen die Grenzen zwischen formaler Beobachtung, Interpretation und Kontextzuschreibung. KI kann keine visuelle Evidenz prüfen, sondern extrapoliert aus Trainingsdaten. Das führt zu inhaltlichen Ungenauigkeiten, Vermischungen unterschiedlicher Bildtypen und inkonsistenten Beschreibungen. Ohne methodische Rahmung verliert die Bildanalyse ihre Bindung an Wahrnehmung, Terminologie und kunsthistorische Standards.
Die Einleitung erläutert diese Ausgangssituation, beschreibt die Risiken unkontrollierter KI-Textproduktion und begründet, warum ein modular aufgebautes, hermeneutisch diszipliniertes System notwendig ist. VERA-VM ist weniger ein technisches Tool als ein epistemisches Konzept: ein Versuch, die spezifische Qualität kunsthistorischer Erkenntnis im digitalen Zeitalter zu bewahren und zugleich neue Formen der Mensch-Maschine-Kooperation zu ermöglichen.
