Evaluation der Wirksamkeit

Die empirisch-quantitative Evaluation, inwieweit sich die am Kurs teilnehmenden Studierenden weiterentwickelt haben, fokussierte die drei unterschiedenen Bereiche des Professionswissens und deren Anwendung in kritischen Unterrichtssituationen (für methodische und statistische Details s. Riegger 2024, in press).

Inhalte der Evaluation

Empirische Befunde legen nahe, dass die Qualität des Unterrichts an Schulen von pädagogischen, fachwissenschaftlichen und fachdidaktischen Wissensbereichen abhängt (z. B. Krauss et al. 2017). Die Erhebungsinstrumente wurden auf die Inhalte und Ziele des Simulationsseminars zugeschnitten (für eine Übersicht und Diskussion von Instrumenten zur Messung von Kompetenzen vgl. Fricke 2017, Riegger et al. 2024, 77f.). Als fachliches Konzept (Facette des ThPhCK) wurde das Wunderverständnis der Studierenden (s. o. drei Niveaus in Tabelle 5) mittels Zustimmung (4-stufig: „stimmt gar nicht“ bis „stimmt völlig“) zu verschiedenen Aussagen erfasst
(z. B. „Das ist NUR DESHALB ein Wunder, weil der Blinde körperlich geheilt wird.“ für Stufe 1)

Als fachdidaktische Grundlagen (Facetten des RPCK) wurden erfasst

  • die Beurteilung einer Hinführung zur Bartimäus-Erzählung[1] (sinnvoll ja nein und freie Begründung) sowie denkbare Schüler:innenreaktionen (freie Antwort),
  • Reaktion als Lehrkraft auf einen Wortwechsel zwischen Schüler:innen („Jesus hat den Blinden körperlich geheilt.“ vs. „Die Heilung ist nur im übertragenen Sinne passiert. Der Blinde ist körperlich immer noch blind, aber er ‚sieht‘, was in seinem Leben wichtig ist.“) ebenfalls als offene Frage,
  • Reaktion als Schüler:in auf eine (denkbare) Äußerung einer ehemaligen Religionslehrkraft („Für Jesus ist alles möglich!“) auch als offene Frage,
  • Annahmen (Wissen) darüber, wie viele der zukünftigen Schüler:innen bestimmte Gedanken und Überzeugungen vertreten könnten, z. B. „Die Religionslehrkraft sagt das, was die Kirche will, obwohl sie es selbst nicht glaubt.“ (5-stufig „eher 0 %“ bis „eher 100%“),
  • die Einschätzung möglicher Prä-Dispositionen und Intentionen (z. B. „Schüler:in will cool wirken“), die eine:n Schüler:in zu einer ‚kritischen‘ Bemerkung motivieren könnten („Ich glaube an das Bier, seine berauschende Kraft und hoffe, dass der Kater schnell wieder verschwindet“), 4-stufig („stimmt gar nicht“ bis „stimmt völlig“).

Für die fachübergreifende pädagogische bzw. pädagogisch-psychologische Kompetenz wurden statt Wissensgrundlagen (GPK) die Kommunikationsfertigkeiten im Selbstbericht erfasst. Die Studierenden sollten einschätzen, in welchem Ausmaß sie in Alltagsdialogen mit ihrem Freund/ihrer Freundin zuhören (Kommunikation), sich in den/die andere hineinversetzen (Empathie) sowie Eigenes und Fremdes unterscheiden (Perspektivenübernahme bzw. -abgrenzung) können (z. B. „Ich kann Eigenes und Fremdes nebeneinander gelten lassen“, 5-stufig „trifft gar nicht zu“ bis „trifft völlig zu“).

Vorgehen bei der Evaluation

Die Wirkungen des Kurses wurden in einem quasi-experimentellen Prä-Post-Kontrollgruppen-Design mit den Wirkungen eines fachübergreifenden Kurses zum Umgang mit Unterrichtsstörungen verglichen (Stichprobenvergleich in Riegger 2024, in press). Das heißt, die Studierenden beider Kurse füllten zu Beginn und am Ende des jeweiligen Semesters ein Inventar aus, das die oben genannten Aufgaben und Fragen enthielt. Damit können die Angaben der Studierenden zu Beginn und am Ende sowie zwischen den beiden Kursen direkt miteinander verglichen werden. Als Kontrollgruppe dienten Lehramtsstudierende eines Seminars zu Unterrichtsstörungen, Lehrer-Schüler-Interaktion und Umgang mit Heterogenität auf der Basis theoretischer Prinzipien und Materialien des Konstanzer Trainingsmodells (KTM, Tennstädt et al. 1991). Das KTM ist ein sechsmonatiges Training am Arbeitsplatz, d. h. in der Schule, um die Kompetenzen von Lehrkräften im Umgang mit aggressivem und störendem Schüler:innenverhalten zu verbessern. Ähnlich wie das Simulationskonzept beinhaltete das Seminar intensive Fallarbeit und Selbstreflexion sowie eine Einheit zur Simulation selbst erlebter Störungen in der Rolle als Lehrende:r. Da das Kontrollgruppenseminar Teil eines allgemeinen Moduls für Lehramtsstudierende unabhängig von ihren Unterrichtsfächern ist, reflektierten die Studierenden dieser Gruppe keine inhaltsspezifischen Konzepte (PhThCK), fach- bzw. inhaltsspezifische Lehrstrategien und Lernmöglichkeiten (RPCK) und deren inhaltliche Bedeutung in und für religionsbezogene Unterrichtsstörungen und -irritationen, die im Mittelpunkt des religionspädagogischen Kurses standen. Dementsprechend wurde erwartet, dass die Studierenden des religionspädagogischen Kurses am Ende des Semesters im Vergleich zu den Studierenden des fachübergreifenden Seminars und im Vergleich zum Beginn des Semesters

  • den Fragen bzw. Thesen, die ein elaborierteres, offeneres und weiter entwickeltes Verständnis des Wunderkonzeptes repräsentieren, stärker zustimmen, d. h. ihr Wunderverständnis entwickelt haben,
  • die religionsdidaktischen Aufgaben im Inventar angemessener bearbeiten (d. h. didaktische Elemente treffender bewerten, elaborierter argumentieren, Präkonzepte und Dispositionen der Schüler:innen – relativ zur gemeinsamen Einschätzung der Expertenlehrkräfte und der Autor:innen – adäquater einschätzen),
  • sich in ihrer Entwicklung bzw. Veränderung der kommunikativen Fertigkeiten dagegen nicht unterscheiden.

Ergebnisse und Diskussion der Evaluation

Inwieweit sich die Gruppen unterschieden und die Studierenden über das Semester hinweg ihr Wunderverständnis, ihre religionsdidaktischen Grundlagen und ihre Kommunikationsfertigkeiten veränderten, wurde je Inhaltsbereich des Inventars mit gemischten zwei-faktoriellen Varianzanalysen (2 Gruppen * 2 Messzeitpunkte) geprüft.

Wunderverständnis (PhThCK): Die Studierenden beider Gruppen stimmten Aussagen, die ein wortwörtlich-magisches Wunderkonzept (A) repräsentierten, zu Beginn und am Ende des Semesters in gleichem Ausmaß zu. Es zeigten sich „keine Unterschiede zwischen den Gruppen und keine Veränderungen während eines Semesters“ (Riegger et al. 2024, 78). Dagegen stimmten die Studierenden der Kurse ReliProfi werden den Aussagen, die ein distanzierend-rationales Wunder-Konzept (B) repräsentierten sowohl zu Beginn als auch am Ende stärker zu, zeigten aber keine Veränderung (Haupteffekt: F1,41 = 7.315; η2 = .15; p = .01). Eine Veränderung zeigte sich dagegen in Bezug auf ein integriertes Verständnis des religiösen Begriffs „Wunder” (C), und zwar nur in der Gruppe „ReliProfi werden“ (Interaktionseffekt: F1,41 = 5.705; η2 = .12; p < .05), die den entsprechenden Aussagen auch insgesamt stärker zustimmten (Haupteffekt: F1,41 = 4.523; η2 = .10; p < .05). Diese Ergebnisse sprechen für die intendierten konzeptuellen Veränderungen bei den Studierenden des Kurses ReliProfi werden, und zwar vermutlich durch den starken Fachbezug und die Fokussierung auf religionsbezogene Unterrichtsstörungen und -irritationen. Dass die Studierenden nach vor auch einem magisch-wörtlichen Wunderverständnis zustimmten, entspricht den Ergebnissen anderer Studien, die zeigten, dass im Verlauf der konzeptuellen Entwicklung Fehl- bzw. Präkonzepte neben adäquaten Fachkonzepten koexistieren (Büttner & Dieterich 2016) und beim Handeln unter Druck oft schneller aktiviert werden (z. B. Wahl 1991). Obwohl davon auszugehen ist, dass Lehramtsstudierende in dieser Phase der beruflichen Entwicklung in kritischen Situationen auf der Grundlage ihrer Präkonzepte reagieren und disruptive Schüler:innenbeiträge nicht in Lernmöglichkeiten umwandeln können, bieten die veränderten konzeptuellen Grundlagen einen guten Ausgangspunkt für die langfristige Weiterentwicklung und Professionalisierung ihres Unterrichtshandelns. Und da ein integriertes Wunderverständnis aus fachlicher Sicht die Offenheit auch für magisch-wörtliche Deutungen beinhaltet, kann es nur darum gehen, die Deutungs- und Handlungsmöglichkeiten im Unterricht zu erweitern.

Religionsdidaktische Grundlagen (RPCK): Lediglich die Einschätzungen der Studierenden, wie viele ihrer zukünftigen Schüler:innen bestimmte Sichtweisen auf Religion und ihre Religionslehrkraft vertreten könnten, veränderten sich in den beiden Gruppen signifikant, und zwar in gegensätzlicher Richtung (Interaktionseffekt: F1,41 = 4.759; η2 = .10; p < .05). Die Studierenden in den Kursen „ReliProfi werden“ entwickelten zutreffendere Einschätzungen dieser Schüler:innenüberzeugungen. Die Studierenden im fachübergreifenden Seminar schätzen religionsbezogene Schüler:innenüberzeugungen zum Ende des Semesters weniger zutreffend ein. In den Simulationskursen wurden zwar alle mit dem Inventar erfassten Facetten der religionsdidaktischen Grundlagen angesprochen, gleichwohl repräsentiert diese Facette den Kern des Kurskonzepts: Durch die persönlichen Erfahrungen in den Simulationen sowie deren intensive Reflexion (a) sich mit dem eigenen Selbstverständnis als Religionslehrkraft auseinanderzusetzen, (b) die Perspektiven (und Reaktionen) der Schüler:innen mitzudenken und (c) den „Austausch“ zwischen praktischer Expertise (Umgang mit Schüler:innenbeiträgen) und wissenschaftlichem Wissen (z. B. Erkenntnisse über und Erklärungen für Präkonzepte) anzuregen.

Kommunikationsfertigkeiten: Die Studierenden schätzten ihr Verhalten in Dialogen mit Freund:innen zu Beginn und zum Ende des Semesters in beiden Kursen gleich bzw. ähnlich ein (keine Unterschiede), außer in Bezug auf die Selbsteinschätzung „Ich kann eigenes und Fremdes nebeneinander gelten lassen“. Obwohl die Studierenden beider Gruppen (im Mittel) schon zu Beginn des Semesters ihre Toleranz und Unterscheidungsfähigkeit zwischen Eigenem und Anderem hoch einschätzten, schätzten sie diese zum Ende des Semesters in beiden Gruppen signifikant höher ein (Haupteffekt: F1,41 = 3.856; η2 = .09; p = .05). Dass die Studierenden beider Gruppen am Ende des Semesters lediglich eine noch größere Toleranz für die Überzeugungen und Deutungen anderer äußerten als zu Beginn, könnte mit dem Bezug der Fragen auf kommunikativ-symmetrische und inhaltsunspezifische Alltagsdialoge anstatt auf kommunikativ-asymmetrische und inhaltsspezifische Unterrichtsdialoge zusammenhängen.

Perspektiven zur Qualitätssteigerung in der Religionslehrkräftebildung

Die Thematisierung der bisher wenig erforschten – und in der Lehrkräftebildung kaum bearbeiteten – religionsbezogenen Unterrichtsstörungen bzw. -irritationen (Riegger, 2019) in Simulationen kann zur Qualitätssteigerung in der Religionslehrkräftebildung beitragen. Die Inhalte und den Aufbau interdisziplinär aus multiplen, für die Professionalisierung von Lehrkräften notwendig zu verschränkenden Theorien und Forschungslagen abzuleiten, hat sich als wirksam erwiesen, Brücken über den oft beklagten Theorie-Praxis-Bruch zu bauen.

Auch wenn sich nicht alle Effekte von Veranstaltungen in der Religionslehrkräftebildung empirisch erfassen lassen, scheint unser „bescheidener“ Weg, die Wirkungen der Veranstaltung mit einem quasi-experimentellen Prä-Post-Kontrollgruppen-Design zu testen, zweifach produktiv: (1) Die relativen Wirkungen konnten nach wissenschaftlichen Standards gemessen werden. (2) Das Vorgehen zur Überprüfung der Wirkungen kann ein Modell für weitere Vergleichsstudien liefern, beispielsweise zwischen verschiedenen religionsdidaktischen Veranstaltungen. So könnte – nicht nur – in der Öffentlichkeit deutlich gemacht werden, dass in der Religionslehrkräftebildung tatsächlich etwas gelehrt und gelernt wird. Wir sollten nicht erwarten, dass eine einzelne Veranstaltung innerhalb eines Semesters „das Wunder” einer Metamorphose vom Anfänger zum Experten bewirkt, obwohl dies nach allen Verständnisweisen des Wunderkonzepts möglich ist. Wir sollten – jenseits von Wundern – den Anspruch haben, das, was wir in der Religionslehrkräftebildung anstreben, wissenschaftlich zu begründen und wissenschaftlich zu prüfen.

[1]      Um eigenständige fachdidaktische Argumentationen zu erfassen anstatt wortwörtlicher Reproduktionen aus den Seminareinheiten, wurden in der empirischen Messung nur solche Themen und Fragen adressiert, die in keinem der durchgeführten Kurse explizit erörtert wurden.