1 Einleitung

Es ist offensichtlich und würde von Schüler*innen wie Lehrkräften bestätigt: Physikstunden sind irgendwie anders als Englischstunden oder Geschichtsstunden. Lehrkräfte würden vermutlich fachliche Spezifika des Unterrichtens ins Zentrum rücken, Spezifika, die sich aus der Epistemologie des Faches ergeben und sich in fachdidaktisch begründeten Inszenierungsformen niederschlagen, seien es Formen der „Entdeckung“ von Naturgesetzen im naturwissenschaftlichen Unterricht oder der Bewusstmachung des Konstruktcharakters von Geschichte, der es ermöglicht, Vergangenheit, Gegenwart und Zukunft sinnbildend aufeinander zu beziehen. Auch für die Schüler*innen besteht der Unterschied nicht nur darin, ob sie (viel) für das Fach lernen müssen oder ob sie im jeweiligen Schuljahr eine Lehrkraft haben, von der sie sich gut geführt, beachtet und unterstützt sowie angemessen herausgefordert fühlen. Sie erkennen, erspüren vielleicht nur, dass die Fächer unterschiedlichen Logiken folgen, unterschiedlich viel mit ihrem Leben und ihrem „Menschsein“ zu tun haben (Rüsen 2013).

Aufgrund solcher Unterschiede zwischen Schulfächern sind – so könnte man meinen – auch deren Qualitätsfaktoren nicht vergleichbar. Auf der anderen Seite gilt jedoch, dass – ganz profan gesagt – die „Köpfe“ der Schüler*innen die gleichen sind, unabhängig davon, in welchem Fachunterricht sie sich gerade befinden. Damit sollte alle Befassung mit Fachinhalten zumindest teilweise denselben (fachübergreifend wirksamen) Prozessen und Bereitschaften unterliegen.

Es lohnt sich also darüber nachzudenken, wo die Fachspezifität beginnt, wie weit sie reicht und inwieweit allgemeine Qualitätsmerkmale von Unterricht Gültigkeit über Fachgrenzen hinweg haben. Unser Beitrag kann aus Platzgründen nicht auf den strukturähnlichen Diskurs zur Allgemein- vs. Fachdidaktik (vgl. Dietrich 1994) eingehen und auch die internationalen Antworten (vgl. exemplarisch den Diskurs zu (historischem) Lesen; Goldman et al. 2016) bleiben unberücksichtigt. Zudem möchten wir betonen, dass wir natürlich nicht für ein ganzes Feld sprechen können. Die Basis der Ausführungen sind vielmehr unsere pädagogisch-psychologisch (Trautwein, Hasenbein) bzw. geschichtsdidaktisch (Schreiber) geprägten akademischen Biographien sowie ein gemeinsames Verständnis von qualitätsvollen Lehr-Lernprozessen im Fach Geschichte, das sich in mehreren interdisziplinär angelegten und vom BMBF geförderten Projekten (HiTCH; Trautwein et al. 2017; KLUG; Schreiber et al. 2017; QQM; Schreiber et al. 16,17,a, b) entwickelte.

2 Die Diskussion der Fachspezifität von Unterrichtsqualität in der Geschichtsdidaktik

Der Grundkonsens zur Qualität von Geschichtsunterricht, der die unterschiedlichen in der Geschichtsdidaktik vertretenen Positionen eint, fußt in einem narrativ-konstruktivistischen Geschichtsverständnis, das sich in der Geschichtswissenschaft – nicht zuletzt aufgrund der Instrumentalisierung und Instrumentalisierbarkeit von Geschichte in den Diktaturen des 20. Jahrhunderts – durchgesetzt hat (vgl. etwa Rüsen 2013). Epistemologische Prinzipien sind das Vergangensein des Gegenstands und als Konsequenzen daraus der notwendig deutende und Sinn bildende Charakter der historischen Narrationen und die Bedeutung von Kommunikation und Diskurs. Hierin operationalisiert sich der Konstruktcharakter von Geschichte sowie ihre Retro-Perspektivität und Selektivität. Daraus erwächst die Notwendigkeit, sowohl die Plausibilität (a) der Vergangenheitsbezüge (die auf Quellen fußen, die ihrerseits durch Partialität und Perspektivität gekennzeichnet sind) sowie (b) der Orientierungspotentiale und -angebote für Gegenwart und Zukunft zu überprüfen. Hinter diesen grundlegenden Konsens eines narrativ-konstruktivistischen Geschichtsverständnisses gehen die über die letzten Jahrzehnte entwickelten Theorien zu Geschichtsunterricht, zu Prinzipien guten Geschichtsunterrichts sowie zu Kompetenzen, deren Auf- und Ausbau guter Geschichtsunterricht unterstützen soll, nicht zurück (vgl. etwa Körber et al. 2007; Pandel 2013; Gautschi 2015; Zülsdorf-Kersting 2020).

Die Selbstverständigung und die Debatten, die Positionierungen, die sich daraus innerhalb der Geschichtsdidaktik ergeben, wurden dabei bislang nur punktuell mit den Diskussionen in der allgemeinen Lehr-Lernforschung zur Unterrichtsqualität zusammengeführt: Die Frage der Generik von Unterrichtsqualität spielte cum grano salis eine geringe Rolle in der Geschichtsdidaktik, trotz einiger beachtenswerter Ausnahmen (z. B. Gautschi 2015). Adaptiert wurden über die Jahre u. a. Ansätze wie Handlungsorientierung, Problemorientierung, forschend-entdeckendes Lernen, Kompetenzorientierung sowie interkulturelles und inklusives Lernen, wobei – diese Spekulation sei erlaubt – aufgrund der fehlenden empirischen Operationalisierungen bisweilen eher „Moden“ als empirische Evidenz für Schwerpunktsetzungen handlungstreibend gewesen sein mögen. Eine vertiefte Überprüfung der Wirksamkeit sowie eine Integration von geschichtsdidaktischer Forschung und pädagogisch-psychologischer Lehr-Lernforschung scheiterte lange Zeit bereits daran, dass es in der traditionell hermeneutisch-geisteswissenschaftlich geprägten Geschichtsdidaktik an Modellierungen von Prozessen und wünschenswerten Ergebnissen fehlte, die eine direkte Operationalisierung und Prüfung erlaubten. Wie bereits Zülsdorf-Kersting (2020) in seiner Übersichtsarbeit zeigen konnte, mangelt es demnach – jenseits einzelner Arbeiten – an einer systematischen wechselseitigen Auseinandersetzung von Geschichtsdidaktik und allgemeiner Lehr-Lernforschung. Damit gibt es jedoch auch keine breite empirische Basis, weder für den Nachweis von Nicht-Kompatibilität noch für Kompatibilität.

Die insgesamt unbefriedigende Situation könnte sich aber rasch ändern. So liegen inzwischen einige geschichtsdidaktische Bände zur Frage der Unterrichtsqualität vor (vgl. Bracke et al. 2018; Kuchler und Sommer 2018), die als Ausgangspunkt beim Abgleich von generischen und fachdidaktischen Qualitätsvorstellungen genutzt werden könnten. Eine Art Zwischenstand im Sinne eines solchen systematischen theoretischen Abgleichs zwischen Qualitätsfaktoren, die geschichtsdidaktischen Arbeiten entnommen werden können, sowie dem Syntheseframework von Praetorius et al. (2020b) liefert der Überblick von Zülsdorf-Kersting (2020). Darüber hinaus lässt sich ein Erstarken des empirisch arbeitenden Arms in der deutschsprachigen Geschichtsdidaktik erkennen, analog international beobachtbarer Entwicklungen (vgl. u. a. Wineburg et al. 2013, Seixas et al. 2015; van Boxtel und van Drie 2012). In diesem Kontext gibt es auch erste Studien, die sich mit Unterrichtsqualität befassen – auch unter Berücksichtigung von Ansätzen aus der allgemeinen Lehr-Lernforschung (Gautschi 2015; Mägdefrau und Michler 2012; Zülsdorf-Kersting und Praetorius 2017). Zudem findet sich allmählich eine Entwicklung von Instrumenten, mit denen man Effekte der angenommenen Qualitätsmerkmale des Geschichtsunterrichts „messen“ kann. Ein Beispiel ist der von uns entwickelte Test „Historical Thinking – Competencies in History“ (HiTCH; Trautwein et al. 2017) zur Erfassung der Kompetenzen historischen Denkens. Insgesamt nimmt auch die Initiierung interdisziplinär angelegter Forschungsprojekte zu, wodurch auf ein Desiderat reagiert wird, das beispielsweise im Vergleich zur Mathematikdidaktik bestand. Die Kooperationen können auch zu einer stärkeren Vernetzung mit der allgemeinen Lehr-Lernforschung führen.

Bis heute liegt aber keine uns bekannte publizierte Studie vor, die das Modell der drei Basisdimensionen (vgl. Klieme et al. 2001), das die Rolle von Klassenführung, konstruktiver Unterstützung und kognitiver Aktivierung hervorhebt, bzw. den breiter angelegten Syntheseframework nach Praetorius et al. (2020b) in einer ausgereichend großen Stichprobe von Klassen für den Geschichtsunterricht untersucht hätte, sei es mithilfe von Expert*innen-Urteilen oder auf der Basis von Schüler*innen-Urteilen.

3 Historisches Denken lehren und lernen: Potenziale und Grenzen generischer Modelle der Unterrichtsqualität

Gerade (auch) in Hinblick auf die Geschichtsdidaktik besteht also ein großer Bedarf an belastbaren empirischen Studien zu Fragen der Unterrichtsqualität: zu den zugrundeliegenden Dimensionen und zu den Zusammenhängen mit Lernverläufen. Diese empirischen Studien können davon profitieren und an Aussagekraft und Anschlussfähigkeit gewinnen, wenn sie systematisch auf die allgemeinen Entwicklungen im Bereich der Unterrichtsforschung bezogen sind (vgl. Praetorius et al. 2020b). Unsere eigenen aktuellen Projekte folgen hier drei übergeordneten Überlegungen, die wir im Folgenden ausführen. Wir starten mit generellen Überlegungen zur Auswahl eines geeigneten „Modells“. Anschließend beschreiben wir ein geschichtsdidaktisches Kompetenzmodell und nutzen dies für einen Abgleich mit Überlegungen zu generischen Elementen der Unterrichtsqualität nach Klieme et al. (2001) bzw. Praetorius et al. (2020b). Der Beitrag schließt mit einer Beschreibung und Diskussion von spezifischen Elementen im Geschichtsunterricht (den „blinden Flecken“ nach Praetorius et al. 2020b) ab.

3.1 Welches generische Modell der Unterrichtsqualität sollte man verwenden?

Will man die Fachdidaktik explizit mit der allgemeinen Lehr-Lernforschung zusammenbringen, so stehen einem dafür aus letzterer eine Reihe von theoretischen Ansätzen zur Verfügung (vgl. z. B. Wilhelm et al. 2018). Das Modell der drei Basisdimensionen (Klieme et al. 2001; vgl. auch Kunter und Trautwein 2013) hat gerade in deutschsprachigen Ländern eine rege Forschungstätigkeit inspiriert, es hat ein substantielles Maß an empirischer Bestätigung erfahren und rasch eine beachtliche Resonanz in der Praxis gefunden. Der Syntheseframework von Praetorius et al. (2020b) verspricht, die „blinden Flecken“ dieses Modells zu überwinden, indem vier „zusätzliche“ Basisdimensionen und weitere Subdimensionen identifiziert werden. Eine unbestreitbare Leistung des Syntheseframeworks besteht darin, dass eine explizite Aufnahme der Expertise von unterschiedlichen Fachdidaktiken erfolgte und dezidiert die Diskussion um die generische bzw. fachspezifische Rolle von Qualitätsaspekten des Unterrichts befeuert wird.

Der Syntheseframework ist umfassender als das Modell der drei Basisdimensionen und weist auf dessen (mögliche) Fehlstellen hin. Sollte man deshalb nun generell dieses Modell als „richtig“ annehmen und künftig in Forschung und Praxis anstatt des Modells der drei Basisdimensionen verwenden? Mit Bezug auf die dem Mathematiker George Box zugeschriebene Feststellung, dass grundsätzlich alle Modelle falsch sind, aber einige (trotzdem) nützlich, würden wir hier zur Vorsicht raten. Dies umso mehr, als weder für das Modell der drei Basisdimensionen, noch für den Syntheseframework ein „Standardinstrument“ zur Erfassung vorliegt.

Dessen ungeachtet: Sowohl das Modell der drei Basisdimensionen (Klieme et al. 2001) als auch das Syntheseframework nach Praetorius et al. (2020b) können als wertvolle Arbeitsmodelle dienen, wobei die Entscheidung für das eine, das andere bzw. weitere Modelle sinnvollerweise von mehreren Faktoren abhängig sein sollte. Das Modell der drei Basisdimensionen hat klare Stärken in Hinblick auf die sparsame Modellierung, die hohe Akzeptanz bei Lehrkräften sowie die nachgewiesene hohe Reliabilität und die substanziellen Belege der prädiktiven Validität entsprechender Instrumente. Für die Nutzung in der Praxis ist neben der hohen Akzeptanz des Modells die (bislang aber nur in Ansätzen bestätigte) Annahme von entscheidender Bedeutung, dass mit Beobachtungsinstrumenten, die auf den drei Basisdimensionen basieren, auch ohne tiefere fachliche Expertise zu validen Einschätzungen der Unterrichtsqualität gelangt werden kann, was ihren Anwendungsbereich in der Praxis enorm erweitert. In ähnlicher Weise liegt eine wichtige Stärke des Modells der drei Basisdimensionen darin, dass es sich auch bei Verwendung von Schüler*innen-Urteilen bewährt hat. Das Syntheseframework hat andere Vorzüge: Durch die breitere Konzeptualisierung sollte bei seiner Nutzung praktisch automatisch die erklärte Varianz bei der Kompetenzentwicklung und Motivation der Schüler*innen erhöht werden. Zudem ermöglicht das Syntheseframework – zumindest in Ansätzen – eine bessere Unterscheidung von „Angebot“ und „Nutzung“ und damit auch die Untersuchung von Mediationsmodellen. Darüber hinaus steht das Syntheseframework mit der in den Fachdidaktiken weit verbreiteten Auffassung in Einklang, dass Unterrichtsqualität immer nur von Personen mit fachlicher bzw. fachdidaktischer Expertise angemessen erfasst werden kann – am klarsten drückt sich dies vielleicht in der Subdimension „Akkuratheit und Korrektheit der thematisierten Inhalte“ (vgl. Praetorius et al. 2020b, S. 311) aus.

3.2 Abgleich der Basisdimensionen mit einem fachspezifischen Kompetenzstrukturmodell

Prinzipiell lassen sich also sowohl das Modell der drei Basisdimensionen als auch das Syntheseframework für die geschichtsdidaktische Forschung und Praxis heranziehen. Die konkrete Eignung sollte auf der Basis konzeptueller Überlegungen sowie empirischer Studien überprüft werden, und dies kann wiederum Implikationen für die Weiterentwicklung der generischen Modelle haben.

Die konzeptuelle Prüfung, inwiefern generisch verstandene Basisdimensionen aus dem Modell der drei Basisdimensionen bzw. dem Syntheseframework einem spezifischen Fach „gerecht“ werden können, kann nur dann sinnvoll erfolgen, wenn man einen Abgleich mit fachspezifischen Vorstellungen zu Prozessen des Lehrens und Lernens vornimmt. Hierfür gibt es mehrere mögliche Wege: Man kann erstens, wie Zülsdorf-Kersting (2020) es getan hat, auf eine Zusammenschau bislang unverbundener theoretischer Stränge zurückgreifen und konzeptuell prüfen, wie groß die Überlappung ist. Zweitens lässt sich analysieren, welche Gemeinsamkeiten und Unterschiede in sich geschlossene „Theorien des geschichtsdidaktischen Unterrichts“ (z. B. Bracke et al. 2018; Gautschi 2015) mit entsprechenden Ansätzen der allgemeinen Lehr-Lernforschung aufweisen. Ein dritter Ansatz ist etwas anders gelagert, indem er anstatt von geschichtsdidaktischen Unterrichtsmodellen von einem geschichtsdidaktischen Kompetenzmodell ausgeht und konzeptuell prüft, inwieweit die spezifizierten Kompetenzen bestimmtes unterrichtliches Handeln nahelegen, das sich wiederum in Modellen der Lehr-Lernforschung wiederfinden sollte. Dieser letztgenannte Ansatz, den wir im Folgenden ausführen, hat den Vorteil, dass stringent von dem zu erreichenden Unterrichtsziel in Geschichte ausgehend gedacht wird, was eine präzisere Beschreibung erlaubt, welche Lernprozesse durch den Unterricht ermöglicht werden sollen. Zudem ermöglicht es, die Kompetenzmodelle im Lichte der allgemeinen Unterrichtsforschung kritisch zu beleuchten.

In unserer eigenen Forschung beziehen wir uns hierbei auf das sogenannte FUER-Modell (Körber et al. 2007; Schreiber 2008). FUER beschreibt nicht nur die dem historischen Denken zugrundeliegenden Kompetenzen, sondern skizziert auch den dafür notwendigen (Unterrichts‑)Prozess der Auseinandersetzung mit Vergangenem und mit sinnbildenden Geschichten über Vergangenes, der dazu führt, dass diese Kompetenzen erworben werden. Ausgangspunkt kompetenzförderlichen Unterrichts ist eine Fragestellung, die die Befassung mit Vergangenem aktiviert und – möglichst methodisch reguliert – das Suchen nach Antworten steuert, einschließlich des Niederschlags in einer historischen Narration und deren Diskussion. Teil der Entwicklung der Fragestellung ist der Abgleich mit den Orientierungsproblemen, die durch die Beschäftigung mit Vergangenem bearbeitet werden sollen. Drei prozedurale Kompetenzbereiche (historische Frage‑, Methoden-, und Orientierungskompetenz) erfassen die Fähigkeiten, Fertigkeiten und Bereitschaften, die für diesen Prozess notwendig sind. Sie überlappen sich mit dem letzten Kompetenzbereich der Modellierung, der kategorial gedachten Sachkompetenz. Sie meint die Fähigkeit durch Begriffskonzepte zu kategorisieren und strukturieren – inhalts-, theorie-, methoden- und subjektbezogen. Das FUER-Modell umfasst zudem eine Graduierungslogik, die basale, konventionelle und elaborierte Niveaus unterscheidet. Auch wenn der Schritt zu einem Unterrichtsqualitätsmodell noch nicht gegangen worden ist, hat das FUER-Modell das Potenzial, Unterricht zu steuern. Die Auflösung des Akronyms (Förderung und Entwicklung eines reflektierten und (selbst-)reflexiven Geschichtsbewusstseins) zeigt die Richtung auf.

Zieht man das FUER-Modell heran, so finden sich beim Abgleich mit generischen Modellen zur Unterrichtsqualität unmittelbar Überlappungen und Potenziale für gegenseitige Präzisierungen. Besonders auffällig ist der enge Bezug von FUER zur kognitiven Aktivierung. Wir bezeichnen Unterricht als kognitiv aktivierend, wenn er an das aktuelle Verständnisniveau der Schüler*innen anknüpft, diese mit Fragen und Aufgaben in ihrem bisherigen Denken „irritiert“ und zu engagiertem, aktivem Nachdenken herausfordert und auf die zentralen Methoden und Konzepte des Faches (ein eigenständiger Faktor im Syntheseframework) fokussiert ist. Kognitive Aktivierung ist konstitutiv im FUER-Modell verankert, weil eine auf historische Orientierung zielende Befähigung zu historischem Denken notwendig über das „Auswendiglernen“ eines historischen Inhalts hinausreicht und das Gewordensein und Werden von Gegenwart und Zukunft mit einbezieht. Potenziale für kognitive Aktivierung liegen beispielsweise darin, dass – wie etwa aktuell im Umfeld der Corona-Pandemie – Irritationen in der Gegenwart bestehen, zu deren Bearbeitung die Auseinandersetzung mit vergangenen Erfahrungen beitragen kann oder dass bei der Entwicklung vergangenheitsbezogener Fragestellungen Irritations- und Orientierungspotentiale für Gegenwart und Zukunft antizipiert werden. Während „Der Erste Weltkrieg – ein technisierter Krieg“ auf Fakten zielt, zielt die kognitive aktivierende Frage „Macht Fortschritt Kriege besonders grausam?“ auf Reflexion, Diskurs und Transfer. Hier drückt sich entsprechend ein Fokus auf zentrale Konzepte jenseits unverbundenen Detailwissens aus. Dabei ist es nach FUER konstitutiv für einen qualitätsvollen Unterricht, dass Schüler*innen durch die Arbeit mit Materialien und Aufgaben nicht nur Antworten auf die jeweiligen Fragen finden, sondern zugleich einen kritischen und methodenkompetenten Umgang lernen, der sie befähigt, sich selbst Meinungen zu bilden und zu vertreten – wiederum ein Prozess, der ohne kognitive Aktivierung nicht vorstellbar ist. Anders gesagt: Kognitive Aktivierung ist unabdingbar, wenn Orientierungskompetenz jenseits der kritiklosen Übernahme von Orientierungsangeboten angestrebt wird.

Dass ein erfolgreiches Durchlaufen historischer Lernprozesse, die vom Erkennen von Fragestellungen bis hin zu einer historischen Orientierung auf einem elaborierteren Niveau reichen, ohne konstruktive Unterstützung kaum gelingen kann, ist evident, auch wenn die Geschichtsdidaktik zu diesem Bereich bislang kaum empirisch gearbeitet hat (vgl. Zülsdorf-Kersting 2020). Nach unserem Verständnis beinhaltet konstruktive Unterstützung einerseits methodisch-didaktische und andererseits sozio-emotionale Unterstützungsanteile, die im Syntheseframework in drei Dimensionen (Formatives Assessment, Unterstützung des Lernens aller Schüler*innen, sozio-emotionale Unterstützung) enthalten sind. Die Unterstützung umfasst die Berücksichtigung unterschiedlicher Ausgangslagen, Lern- und Leistungsmöglichkeiten, Interessen und Erfahrungen und reagiert auf Wissenslücken oder unzureichende Kompetenzausprägungen. Dazu müssen je geeignete Formen des Übens, Anregens und Befähigens gewählt werden. Die immer weiter zunehmende Heterogenität der Schülerschaft verlangt nicht nur sprachsensible Unterstützung für Lernende, die die deutsche Bildungssprache (noch) nicht beherrschen oder mit Bedeutungsverschiebungen in Quellensprachen („Weib“) Schwierigkeiten haben. Nimmt man FUER mit dem Anspruch auf re-konstruktive und de-konstruktive Akte der Lernenden ernst, an denen viele Lernende in heterogenen Lerngruppen auf sich allein gestellt scheitern müssen, so wird unmittelbar ersichtlich, wie wichtig diese methodisch-didaktische Unterstützung ist. Die Heterogenität verlangt darüber hinaus, eine Auseinandersetzung mit unterschiedlichen Sinnbildungen über ein und dieselbe Vergangenheit zu ermöglichen (wie z. B. die Bezeichnung der Massaker und Vertreibung der Armenier als Völkermord), und reicht damit auch (als Teil der sozio-emotionalen Unterstützung) in die Bereiche individueller Sinnbildung – ein Aspekt, der im Mathematikunterricht vielleicht eine geringere oder zumindest eine anders gelagerte Rolle spielt.

Auch die Klassenführung fristet nach Zülsdorf-Kersting (2020) in den Debatten der Geschichtsdidaktik eher ein Schattendasein. Zieht man jedoch erneut das FUER-Modell zurate, sieht man dort sofort die Implikationen für die Klassenführung, zumindest wenn man unter Klassenführung auch Aspekte der Zielklarheit und Struktur subsumiert, die im Syntheseframework unter dem Label „Auswahl und Thematisierung von Inhalten und Fachmethoden“ zu finden sind. Durch das FUER-Modell ist eine mögliche Strukturierung des Unterrichts impliziert, da es Ausgangs- und Zielpunkte von Geschichtsunterricht sowie den zu beschreitenden Weg benennt: Der Regelkreis historischen Denkens gibt automatisch eine Zielklarheit und – wenn auch lockere – Struktur vor. Darüber hinaus sind Fragen der Klassenführung unmittelbar relevant bei der Realisierung offener, kommunikativer, nicht-linearer Unterrichtssituationen. Ein tiefes Verständnis von Qualitäten der Klassenführung hilft zudem, eine Betonung konstruktivistisch angelegter Lernprozesse mit den Erfordernissen an Struktur und Klarheit zu vereinen, die erst die Grundlagen für konstruktive Unterstützung (z. B. formatives Feedback), aber auch für adaptiv vorgehende kognitive Aktivierung bietet.

Praetorius et al. (2020a) bzw. Zülsdorf-Kersting (2020) haben aufgezeigt, dass die im Modell der drei Basisdimensionen sowie im Syntheseframework postulierten Basisdimensionen in der geschichtsdidaktischen Diskussion nur teilweise auftauchen. Wie wir in den vorigen Absätzen zeigen, liegt dies nach unserer Einschätzung weniger daran, dass die Basisdimensionen nicht „passen“ würden, sondern vor allem an spezifischen, teilweise auch an je nach Forschenden individuellen, Schwerpunktsetzungen bei den bislang in der empirisch arbeitenden Geschichtsdidaktik verfolgten Fragestellungen.

3.3 Grenzen der Basisdimensionen für die geschichtsdidaktische Diskussion

Das geschichtsdidaktische FUER-Modell lässt sich also insgesamt gut mit der Annahme zentraler Basisdimensionen vereinbaren und kann diese fachspezifisch ausfüllen. Dies steht in Einklang mit der Annahme, dass es generische Basisdimensionen von Unterrichtsqualität gibt. Auch wenn beispielsweise „Irritationen“, die im Sinne der kognitiven Aktivierung eingesetzt werden, in unterschiedlichen Fächern unterschiedlich benannt werden (z. B. Arbeit an „Präkonzepten“, „Fehlvorstellungen“, das Entdecken von Lücken), so sind es doch Aktivierungen und Infragestellungen von Wissensstrukturen im Langzeitgedächtnis. Allerdings lassen sich in Hinblick auf den Geschichtsunterricht auch eine Reihe von spezifischen Herausforderungen und Konstellationen erkennen, die mit den aktuellen Vorstellungen zu den Basisdimensionen bzw. dem Syntheseframework konfligieren bzw. nicht abgebildet sind und damit zur Debatte zum Zusammenhang zwischen generischen und fachspezifischen Dimensionen beitragen können. Wir führen drei Aspekte („blinde Flecken“) aus.

Erstens soll der Geschichtsunterricht (auch) eine Orientierungsfunktion haben, deren Gelingen vermutlich ganz wesentlich davon abhängt, dass Schüler*innen sowohl kognitiv aktiviert sind, als auch sich konstruktiv unterstützt fühlen – die beiden Dimensionen verschmelzen. Wir wollen das am bereits erwähnten Irritationspotenzial zeigen, das historische Orientierung unterstützt. Das Irritationspotential (z. B. der Frage nach dem Völkermord an den Armeniern), das bei den einzelnen Schüler*innen zu kognitiver Aktivierung führt, unterscheidet sich abhängig von kulturspezifischen Prägungen und Sinnbildungen etwa in deren Familien und/oder Peergroups, von lebensweltlichen Erfahrungen (etwa von Exklusion), von Merkmalen individueller Identität. Unterschiedliche Zugänge zu eröffnen und verständlich zu machen, erfordert konstruktive Unterstützung sowohl der einzelnen Schüler*innen im Umgang mit ihren eigenen Irritationen (Selbstreflexivität), als auch mit Sinnbildungen der anderen (Fremdreflexivität). Vereinfacht gesagt: Erkennen Schüler*innen im Mathematikunterricht, dass ihr bisheriges Verständnis von „Steigung“ falsch war, so mag das mit der Freude über den Erkenntnisgewinn einhergehen – Erkenntnisgewinn im Geschichtsunterricht kann Schüler*innen dagegen in Mark und Bein gehen. Man kann sich deshalb guten Geschichtsunterricht, der zu wirklicher Orientierung führt, nur bei einer gelungenen Synthese von kognitiver Aktivierung und sozio-emotionaler konstruktiver Unterstützung denken. In den Basisdimensionen bei Klieme et al. (2001) bzw. im Syntheseframework von Praetorius et al. (2020b) sind solche Überlegungen nicht angelegt.

Analoges lässt sich am Beispiel untriftiger Sinnbildungen in der Gegenwart erläutern („Corona-Diktatur’“). Das für kognitive Aktivierung nutzbare Irritationspotential, das diese Sinnbildungen für Einzelne haben, hängt von Faktoren wie Erfahrungsnähe, Vorwissen, Lebenswelten und Peergroups ab. Die konstruktive Unterstützung, die angeboten werden muss, um die untriftige Sinnbildung möglichst eigenständig und methodisch reguliert zu erschließen, ist nicht nur inhaltlicher Art. Sie muss auch die Normen durchleuchten, die explizit und implizit in den gewählten Sinnbildungen sichtbar werden und die Narrative betrachten, mit denen Zusammenhänge hergestellt werden. Die hochgradig sensiblen, weil identitätsnahen Thematiken, die in einem Geschichtsunterricht, der Orientierungsfragen ernst nimmt, automatisch aktiviert werden, verlangt Formen der Klassenführung, die in großer Klarheit sichtbar machen, wie Geltungsbehauptungen hinterfragt werden können sowie Formate, in denen dies eingeübt werden kann. Dies betrifft auch und gerade das Erlernen von Diskursformen (als Form der Strukturierung des Unterrichtsgesprächs), die „eigensinnige“ Sinnbildungen auf ihre Triftigkeit überprüfen und offenlegen, wo Geltungsbehauptungen den common ground der Reflektiertheit verlassen. Wieder lassen sich solch zentrale Merkmale des geschichtsspezifischen Frameworks in den Basisdimensionen nicht finden.

Zweitens: Ein Aspekt, der im FUER-Modell angelegt ist, aber sowohl in empirischer Forschung zum Modell als auch zum Geschichtsunterricht ganz generell zu kurz kommt, ist die Graduierungslogik, die bei Lernenden mehrere, auch qualitativ unterschiedliche Kompetenzniveaus postuliert. Es geht dabei nicht zuletzt auch um die theoretische und empirische Überprüfung der in den länderspezifischen Lehrplänen – zum Teil auf sehr unterschiedliche Weise – gesetzten „Kompetenzerwartungen“ für Schularten und Jahrgangsstufen. Stark vereinfachend gesagt steht die grundsätzliche Frage im Fokus, wie reflektierend und reflexiv Geschichtsunterricht in den unterschiedlichen Klassenstufen sein darf bzw. sein muss bzw. in welcher Weise sich der Unterricht in den höheren Klassenstufen vom Unterricht in den niedrigeren Klassenstufen unterscheiden kann, jenseits einer Progression von konkret zu abstrakt. Uns scheint insbesondere die überfällige ernsthafte Beschäftigung mit Ergebnissen der Entwicklungspsychologie an dieser Stelle großes Potenzial zu haben.

Drittens: Den Prozess des historischen Denkens immer wieder zu durchlaufen, dabei Konzepte in unterschiedlichen Kontexten wiederzuerkennen – das ist teilweise das, was in generischen Modellen wie dem Syntheseframework unter dem Begriff des wiederholenden Übens thematisiert wird, aber dann doch auch etwas ganz anderes. In Bezug auf die inhaltliche Dimension etwa haben wir es mit der Besonderheit zu tun, dass es keinen „Grundwortschatz“ Geschichte gibt und kein direkt kumulatives Wissen. Die prototypischen Merkmale von Kategorien und Konzepte zu erkennen, müssen die Schüler*innen üben. Aber zugleich müssen sie in diesem wiederholenden Üben auch lernen, deren Veränderung und ihr epochen- und kulturspezifisches Changieren wahrzunehmen. Dieses grundlegende Element der Sachkompetenz kann man unter Meta-Reflexion fassen, in dem Sinne, dass wiederholendes Üben das Wiederholte immer auch transzendiert.

Als weitere Baustelle machte Zülsdorf-Kersting (2020, S. 394) in seinem Abgleich von Fachspezifik und Lehr-Lernforschung die Berücksichtigung von Kommunikation als konstitutives, unverzichtbares Element des Geschichtsunterrichts aus, wobei diese Kommunikation metakognitiv-epistemologische Reflexionen und „kontrolliert diskursive, kontingenzeinschränkende Aushandlung dieser Reflexionen“ enthalten solle. In gewisser Weise ist hier eine Fortführung und Überwindung dessen, was als „generisch-sokratischer Dialog“ in der Unterrichtsforschung bekannt ist (vgl. Kunter und Trautwein 2013), angelegt. Wir halten die Erforschung effektiver kommunikativer Praxen im Geschichtsunterricht für vielversprechend. Wir sehen sie allerdings angelegt in einem Unterricht, der in seiner Konzeptionierung dem Prozess des historischen Denkens folgt und sich um kognitive Aktivierung und konstruktive Unterstützung bemüht. Denn kommunikative, insbesondere metareflexive Praxen drohen dann zu scheitern, wenn viele Schüler*innen an dieser Kommunikation gar nicht aktiv teilnehmen (können).

4 Resümee

Eine grundlegende Beschäftigung der Geschichtsdidaktik mit generisch gedachten Basisdimensionen von Unterrichtsqualität unter Berücksichtigung sowohl der Überlappungen als auch der „blinden Stellen“ verspricht nach unserem Verständnis einen hohen Erkenntnisgewinn – für das Fach Geschichte, aber auch für die Unterrichtsforschung generell. Wir hoffen, dies an zentralen Herausforderungen des Geschichtsunterrichts verdeutlicht zu haben. Aber gleichzeitig gilt: Natürlich haben wir uns vieler Auslassungen schuldig gemacht, insbesondere bei den Spezifika des Geschichtsunterrichts, und viele unserer Gedanken basieren aufgrund der dünnen empirischen Lage noch auf Spekulationen anstatt auf Befunden. Weil wir dennoch einige eindeutige Empfehlungen geben wollten, passt für die von uns gewählte Form des Beitrags der Begriff eines „Positionspapiers“ – wir begrüßen es, wenn Leser*innen Implikationen des Beitrags empirisch prüfen wollen: Das streben auch wir an.