Vergleichsanordnung: GPT-4 (ChatGPT) vs. Gemini
Ein strukturierter Vergleich der Analysefähigkeiten beider KI-Modelle im Bereich Kunstgeschichte, insbesondere bei symbolischen, ikonografischen und theoretisch fundierten Werkdeutungen.
Ausgangspunkt: Analyseauftrag
Werk: Porträt eines jungen Mannes (Broccardo-Porträt)
Künstler: Giorgione
Analysefokus: Symbolik
Fragen:
-
Welche Gefühle drückt der junge Mann aus?
-
Warum wirkt er verträumt?
-
Was bedeuten die Knoten am Hemd?
-
Bedeutung der Inschrift „Antonios Brocard“ auf der Brüstung?
-
Bedeutung des „V“ am Hut?
-
Bedeutung der Brosche mit drei Gesichtern?
-
Was unterscheidet dieses Porträt von anderen?
-
Weitere sichtbare Details?
Theorierahmen: Hans Belting
Modell: GPT-4 bzw. Gemini Advanced
Bildlink: https://cdn.topartprint.com/images/artists/Giorgio_da_Castelfranco_Giorgione/paintings-wm/giorgione025.jpg
ChatGPT (GPT-4 oder GPT-4o) – Eingabe
Die Anfrage erfolgte über das eigene Modul Vera Modul A
oder direkt per Chat, strukturiert mit:
-
Benutzerdefiniertem Prompt (generiert durch Formularfelder)
-
Optionale Auswahl von:
-
Fokus (z. B. Symbolik)
-
Theorie (Belting, Panofsky etc.)
-
Freitext-Frage
-
-
Automatischer Prompt-Baustein:
„Bitte analysiere das Kunstwerk ‘XYZ’ mit folgendem Fokus … Gib eine wissenschaftlich strukturierte Analyse, gegliedert in Werkbeschreibung, Kontext, Interpretation, Diskussion und Quellenlage.“
Der Prompt wurde intern (z. B. über API oder GPT-UI) an GPT-4 weitergeleitet. Die Ergebnisse erschienen im HTML-Modul oder wurden manuell in ChatGPT eingefügt.
Gemini (Advanced) – Eingabe
Die Analyse in Gemini erfolgte mit fast identischem Textprompt, meist manuell eingegeben:
Volltext-Eingabe mit Bildlink
Manuelles Nachreichen der Fragen
Aktivierte Tools: ✅ Internetsuche, ✅ DeepResearch
Versuchsweise Nutzung von Google Lens-Erkennung (Bildanalyse)
Beispielhafte Toolauswahl:
-
Internetsuche = automatische Ergänzung durch Webquellen
-
DeepResearch = gezielte Recherche in Fachquellen, z. B. Museumskataloge, wissenschaftliche Seiten
Gemini interpretierte allerdings den Titel „Die Pazzi-Verschwörung“ fälschlich als Bildtitel, da keine Differenzierung zwischen Bildanalyse und historischer Ereignisanalyse stattfand.
Klicke hier, um Ihren eigenen Text einzufügen
Der erzeugte Prompt
4. Beobachtete Unterschiede
Aspekt | ChatGPT (GPT-4) | Gemini Advanced |
---|---|---|
Prompt-Integration | Modular über VERA-Formular / frei erweiterbar | Manuell eingetippt, weniger strukturiert |
Bildlink-Erkennung | Bild wird nicht analysiert, nur referenziert | Teilweise visuelle Analyse möglich |
Theorierahmen (Belting) | Wird explizit als Analyseperspektive integriert | Wird ignoriert oder überlesen |
Symbolanalyse | Detaillierte Auswertung aller Elemente | Allgemeiner, teils oberflächlich |
Quellenbezug | Intern, trainiert – keine externen Quellen | Nutzung von Webressourcen, aber selektiv |
Reaktionsstruktur | Klar gegliedert nach akademischen Standards | Freier, oft journalistisch oder essayistisch |
Verständnis für „Kontext“ | Hoch, bei richtiger Promptstruktur | Schwankend – häufig Verwechslungen |
5. Fazit (zur Dokumentation, nicht als Wertung!)
GPT-4 ist präziser, wenn die Analyseziele klar strukturiert übergeben werden (wie durch VERA).
Gemini kann aktuelle Quellen einbinden, ist aber weniger sensitiv für symbolische Tiefenebenen und erkennt Theoriebezüge seltener korrekt.
Die Kombination beider Systeme könnte langfristig sinnvoll sein, wenn Gemini richtig gelenkt und GPT-4 modular vorbereitet wird.
GEMINI
Einstellung
- Modell. Chat GPT 4.5
- Internet-Suche
- Deep Research
CHAT GPT
Einstellung
- Modell. Chat GPT 4.5
- Internet-Suche
- Quellen hinzufügen (Internet)