Vergleichsanordnung: GPT-4 (ChatGPT) vs. Gemini

Ein strukturierter Vergleich der Analysefähigkeiten beider KI-Modelle im Bereich Kunstgeschichte, insbesondere bei symbolischen, ikonografischen und theoretisch fundierten Werkdeutungen.

Ausgangspunkt: Analyseauftrag

Werk: Porträt eines jungen Mannes (Broccardo-Porträt)
Künstler: Giorgione
Analysefokus: Symbolik
Fragen:

ChatGPT (GPT-4 oder GPT-4o) – Eingabe

Die Anfrage erfolgte über das eigene Modul Vera Modul A oder direkt per Chat, strukturiert mit:

  • Benutzerdefiniertem Prompt (generiert durch Formularfelder)

  • Optionale Auswahl von:

    • Fokus (z. B. Symbolik)

    • Theorie (Belting, Panofsky etc.)

    • Freitext-Frage

  • Automatischer Prompt-Baustein:

    „Bitte analysiere das Kunstwerk ‘XYZ’ mit folgendem Fokus … Gib eine wissenschaftlich strukturierte Analyse, gegliedert in Werkbeschreibung, Kontext, Interpretation, Diskussion und Quellenlage.“

Der Prompt wurde intern (z. B. über API oder GPT-UI) an GPT-4 weitergeleitet. Die Ergebnisse erschienen im HTML-Modul oder wurden manuell in ChatGPT eingefügt.

Gemini (Advanced) – Eingabe

Die Analyse in Gemini erfolgte mit fast identischem Textprompt, meist manuell eingegeben:

  • Volltext-Eingabe mit Bildlink

  • Manuelles Nachreichen der Fragen

  • Aktivierte Tools: ✅ Internetsuche, ✅ DeepResearch

  • Versuchsweise Nutzung von Google Lens-Erkennung (Bildanalyse)

Beispielhafte Toolauswahl:

  • Internetsuche = automatische Ergänzung durch Webquellen

  • DeepResearch = gezielte Recherche in Fachquellen, z. B. Museumskataloge, wissenschaftliche Seiten

Gemini interpretierte allerdings den Titel „Die Pazzi-Verschwörung“ fälschlich als Bildtitel, da keine Differenzierung zwischen Bildanalyse und historischer Ereignisanalyse stattfand.

Klicke hier, um Ihren eigenen Text einzufügen

Der erzeugte Prompt

4. Beobachtete Unterschiede

Aspekt ChatGPT (GPT-4) Gemini Advanced
Prompt-Integration Modular über VERA-Formular / frei erweiterbar Manuell eingetippt, weniger strukturiert
Bildlink-Erkennung Bild wird nicht analysiert, nur referenziert Teilweise visuelle Analyse möglich
Theorierahmen (Belting) Wird explizit als Analyseperspektive integriert Wird ignoriert oder überlesen
Symbolanalyse Detaillierte Auswertung aller Elemente Allgemeiner, teils oberflächlich
Quellenbezug Intern, trainiert – keine externen Quellen Nutzung von Webressourcen, aber selektiv
Reaktionsstruktur Klar gegliedert nach akademischen Standards Freier, oft journalistisch oder essayistisch
Verständnis für „Kontext“ Hoch, bei richtiger Promptstruktur Schwankend – häufig Verwechslungen

5. Fazit (zur Dokumentation, nicht als Wertung!)

GPT-4 ist präziser, wenn die Analyseziele klar strukturiert übergeben werden (wie durch VERA).

Gemini kann aktuelle Quellen einbinden, ist aber weniger sensitiv für symbolische Tiefenebenen und erkennt Theoriebezüge seltener korrekt.

Die Kombination beider Systeme könnte langfristig sinnvoll sein, wenn Gemini richtig gelenkt und GPT-4 modular vorbereitet wird.

GEMINI

Einstellung

  1. Modell. Chat GPT 4.5
  2.  Internet-Suche
  3. Deep Research

CHAT GPT

Einstellung

  1. Modell. Chat GPT 4.5
  2.  Internet-Suche
  3. Quellen hinzufügen (Internet)