Lehrevaluation

Zurück zur LEHRE-Seite

Einleitung
Faktoren VB-Psych
Faktoren LEIRA
Vergleich zwischen Einführungskurs, inhaltlichen und Methoden-Veranstaltungen
Bewertung von Lehrveranstaltungen durch Studierende
Literatur
Anhang

Einleitung

Am Lehrstuhl für Allgemeine Psychologie und Kulturpsychologie werden seit dem Wintersemester 1996/97 von Seiten der Dozierenden (Prof. Dr. N. Groeben; Prof'in Dr. B. Scheele; Dr'in M. Schreier, seit Februar 2001 Prof'in an der IUB; sowie seit WiSe 00/01 Dipl.-Psych. J. Naumann und Dipl.-Psych. T. Richter) Selbstevaluationen der Lehre durchgeführt. Eingesetzt wurden dabei zunächst zwei Fragebogen-Instrumente, von denen das eine ein Klassiker ist (VB-PSYCH: Fragebogen zur Beurteilung von Hochschulveranstaltungen im Fach Psychologie, Diehl & Kohr, 1977), das andere ein Instrument aus neuerer Zeit (LEIRA: Lehrevaluationsinventar von Rindermann und Amelang, Rindermann & Amelang, 1993; s. auch Rindermann & Amelang, 1994). Da zwischen beiden Instrumenten ein inhaltlicher Überlappungsbereich (s.u.) besteht, wird seit dem WiSe 1999/2000 aus ökonomischen Gr&uhttp://www.uni-koeln.de/rrzk/www/eingabe/uml;nden nur noch der LEIRA ausgegeben, der sich als inhaltlich differenzierter erwiesen hat. Die Items der beiden Fragebogen-Instrumente gehen aus den folgenden Faktorenanalysen hervor.

Die evaluierten Lehrveranstaltungen waren im Einzelnen:

Einführung in das (Grund-)Studium der Psychologie (Blockkurs jeweils im Wintersemester von 1996/97 bis 2002/03; Scheele/Groeben);
"Inhaltliche Veranstaltungen": Prof. Dr. N. Groeben: Vorlesung Anthropologische Subjektmodelle (in) der Psychologie (WiSe 96/97, SS 2001), Übung Kreativität (WiSe 96/97), Vorlesung Lernpsychologie (WiSe 97/98, SoSe 2000, 2002) Seminar Kreatives Problemlösen (WiSe 98/99, SoSe 2001), Seminar Dogmatismus - Neugier (SoSe 1999, 2002), Vorlesung Sprachpsychologie (WiSe 99/00, 01/02), Seminar Ironie und Witz (SoSe 2000), Seminar Theorien des reflexiven Subjekts (WiSe 00/01), Seminar Kritik der Psychoanalyse (SoSe 2001), Seminar Willensfreiheit (SoSe 2002), Seminar Lesekompetenz (WiSe 02/03); Prof'in Dr. B. Scheele: Übungsvorlesung Prosoziale Motivation (WiSe 96/97, 98/99, 02/03), Seminar Leistung, Macht, Moral (WiSe 96/97), Seminar Stressentstehung und -bewältigung (WiSe 97/98, 01/02), Übungsvorlesung Sprache, Denken, Sprechen (SoSe 1998, 2000, 2002), Seminar Aggression als motivationspsychologisches Konstrukt (SoSe 1998, WiSe 01/02), Vorlesung Emotionspsychologie (SoSe 1999, 2001, 2003), Seminar Katharsis (SoSe 1999), Seminar Motivation und Gender (WiSe 99/00), Seminar Lernen am Modell (SoSe 2001, 2003), Seminar Selbstbezogene Emotionen (SoSe 2002); Prof'in Dr. M. Schreier: Seminar Psychologie der Verantwortungsattribution (SoSe 1998, 2000), Seminar Der Genuss (WiSe 98/99), Mediensozialisation (WiSe 02/03); Dipl.-Psych. T. Richter: Seminar Entscheidungstheorien (SoSe 2003).
"Methoden-Veranstaltungen": Prof. Dr. N. Groeben: Vorlesung Einführung in die Wissenschaftstheorie (WiSe 96/97, 97/98, 98/99, 99/00, 00/01, 01/02, 02/03), Empiriepraktikum (SoSe 1999, 2000, 2001, 2003) Seminar Ethik und Experiment (SoSe 2000); Prof'in Dr. B. Scheele: Seminar Interview: Dialog-Hermeneutik (WiSe 97/98, SoSe 1999, 2001, 2003), Seminar Technik des empirischen Arbeitens (SoSe 1998), Seminar Rezeption und Produktion wissenschaftlicher Texte (SoSe 1999, 2000); Prof'in Dr. M. Schreier: Empiriepraktikum (SoSe 1998, 1999, 2000, 2002), Experimentalpraktikum (WiSe 98/99, 99/00, 00/01, 01/02), Vorlesung Versuchsplanung (SoSe 1999), Einfühhttp://www.uni-koeln.de/rrzk/www/eingabe/rung in die psychologische Methodenlehre (WiSe 99/00, 01/02, 02/03), Qualitative Methoden in der Medienpsychologie (SoSe 2002); Prof. Dr. N. Groeben und Prof'in Dr. B. Scheele: Übung Datenerhebung und -auswertung (WiSe 98/99, 99/00, 00/01, 01/02, 02/03); Dipl.-Psych. J. Naumann und Dipl.-Psych. T. Richter: Experimentalpraktikum (WiSe 00/01, 01/02), Seminar Auswertungsverfahren im ALM (WiSe 00/01); Dipl.-Psych. J. Naumann: Vorlesung Statistik I (WiSe 02/03); Dipl.-Psych. T. Richter: Experimentalpraktikum (WiSe 02/03), Empiriepraktikum (SoSe 2003).

Ziel der Evaluation war zunächst einmal ein Methodenvergleich zwischen den beiden eingesetzten Fragebogen-Instrumenten, um die Möglichkeiten und Grenzen von Evaluationsverfahren näher bestimmen zu können. Über die auf dieses Ziel ausgerichteten Auswertungen wird hier nicht im Einzelnen berichtet, weil sie mehr von methodologischem Forschungsinteresse sind. Das zweite Ziel war die Bewertung und ggf. Verbesserung des neu entwickelten Einführungskurses in das (Grund-)Studium der Psychologie, der deshalb im Folgenden in erster Linie mit den übrigen Veranstaltungen verglichen werden soll. Als drittes Ziel ist selbstverständlich generell die Rückmeldung der Studierenden zu den Lehrveranstaltungen anzusetzen, auf deren Grundlage ggf. (allerdings auch nicht unbedingt immer) Veränderungen vorgenommen werden sollen. Dieser generelle Bewertungsaspekt wird im Anschluss an die Vergleiche veranschaulicht. Dabei werden einige grundsätzliche Probleme der Lehrevaluation diskutiert werden.

In einschlägigen Untersuchungen (so auch Diehl & Kohr, 1977; Diehl, 2003; Esser, 1994) ergibt sich immer wieder, dass für die Studierenden motivational, arbeitstechnisch etc. ein erheblicher Unterschied zwischen (im weiteren Sinne) Methoden-Veranstaltungen und eher "inhaltlich" ausgerichteten Lehrveranstaltungen existiert. Methodenveranstaltungen stimmen oft nicht mit den Voreinstellungen der sozialwissenschaftlichen Studierenden überein und werden von vielen Studierenden daher als uninteressant und zu anspruchsvoll empfunden, was die Bewertung negativ beeinflussen könnte. Unter Rückbezug auf die angeführten Zielsetzungen bei der Darstellung der Ergebnisse wird daher der Vergleich des Einführungskurses mit den im weiteren Sinne methodischen Veranstaltungen (s.o.) sowie den übrigen "inhaltlichen" Veranstaltungen der Dozierenden Groeben, Scheele, Schreier, Richter und Naumann fokussiert.

Dabei wäre es unökonomisch und aus methodischen Gründen auch unangemessen, einen entsprechenden Vergleich auf dem Niveau einzelner Fragebogen-Items vorzunehmen. Vielmehr liegen den eingesetzten Evaluations-Instrumenten bestimmte (Bewertungs-) Dimensionen zugrunde, die in der Regel über eine Faktorenanalyse des jeweiligen Instruments gesichert werden. Für den VB-PSYCH ist von Diehl und Kohr (1977) diese Faktorenstruktur errechnet und angegeben worden, und zwar mit folgenden vier Faktoren:

Faktor 1: Relevanz und Nützlichkeit der Veranstaltungsinhalte

Faktor 2: Verhalten der Dozenten gegenüber den Veranstaltungsteilnehmern

Faktor 3: Angemessenheit von Schwierigkeit und Umfang der Veranstaltungsinhalte

Faktor 4: Methodik und Aufbau der Veranstaltung

Für den LEIRA sind inhaltliche Dimensionen angesetzt worden, deren Anzahl mit 16 allerdings relativ groß ist. Um eine Vergleichbarkeit der beiden Fragebögen zu gewährleisten, wurde beim LEIRA eine Reduktion der Dimensionenanzahl via Faktorenanalyse angestrebt. Unabhängig von diesem Problem ist es sowieso angezeigt, bei Untersuchungen an einer neuen Stichprobe von Untersuchungspartnern/innen (Uptn) eine erneute Faktorenanalyse zu errechnen, um die faktorielle Struktur der jeweiligen Instrumente für diese Untersuchungsstichprobe zu sichern. Daher wurde auch beim VB-Psych eine Faktorenanalyse durchgeführt.

Zurück zum Seitenanfang

Faktoren VB-Psych

Die entsprechende Faktorenstruktur für den VB-PSYCH auf der Grundlage der bewerteten Lehrveranstaltungen führt in Abweichung von dem Ergebnis von Diehl und Kohr (1977) zu einer Fünf-Faktoren-Struktur, und zwar:

Faktor 1: Angemessenheit der Schwierigkeit und Verständlichkeit der Veranstaltungsinhalte

-21	Es wurde zu schnell vorgegangen
1	Man konnte dem Stoff der Veranstaltung leicht folgen
-27	Der Stoff der Veranstaltung war zu schwierig
-33	Grundgedanken und Begriffe wurden vom Dozenten zu schnell entwickelt
-14	In der Veranstaltung wurde zu viel Stoff behandelt
-5	Der dargebotene Stoff war zu umfangreich
-36	Um der Veranstaltung folgen zu können, war zu viel zusätzliche Arbeit nötig
-26	Der Dozent wiederholte den Stoff nicht oft genug und auch nicht so, dass die Studenten erkennen konnten, worin ihre Verständnisschwierigkeiten bestanden
-7	Einige Sachverhalte wurden nicht genügend gut erklärt
28	Der Dozent vermittelte den Stoff anschaulich und verständlich
35	Der Dozent drückte sich meist unverständlich aus

Faktor 2: Lehrengagement und Kompetenz der/des Dozierenden

-20	Der Dozent wirkte arrogant
-6	Das Verhalten des Dozenten den Veranstaltungsteilnehmern gegenüber wirkte kühl und unpersönlich
-12	Der Dozent schien Lehre als reine Pflichtübung und Routinetätigkeit zu betrachten
-10	Der Dozent ging auf Verständnisschwierigkeiten bei den Teilnehmern nicht genügend ein
19	Der Dozent ging auf die Vorstellungen und Vorschläge der Studenten ein
-31	Dem Dozenten ging es offensichtlich nur um das Durchziehen des Stoffes
2	Der Dozent war einer kritischen Haltung dem Inhalt seiner Veranstaltung gegenüber aufgeschlossen
3	Das Verhalten des Dozenten hat die Veranstaltung aufgelockert
-4	Der Dozent war am Lernerfolg der Teilnehmer nicht sonderlich interessiert
37	Der Dozent berücksichtigte weitgehend die Interessen der Teilnehmer
-8	Der Dozent hat das Stoffgebiet zu unkritisch dargestellt

Faktor 3: Praxisnähe und Fachrelevanz der Veranstaltungsinhalte

15	Die in dieser Veranstaltung erworbenen Kenntnisse können mir in anderen Veranstaltungen sehr helfen
11	Das in der Veranstaltung erworbene Wissen kann ich auch im übrigen Studium gut anwenden
38	Die Zusammenhänge zwischen dem vermittelten Stoff und der späteren beruflichen Praxis wurden gut aufgewiesen
40	Die Veranstaltung ermöglicht ein besseres Verstehen anderer Veranstaltungen
29	Die in der Veranstaltung erworbene Kenntnisse kann man gut in der späteren Berufspraxis gebrauchen
18	Die Relevanz des Stoffes wurde durch genügend Beispiele verdeutlicht
17	Das Thema dieser Veranstaltung halte ich im Rahmen des Psychologiestudiums für sehr sinnvoll
16	Der Stoff wurde durch Beispiele gut verdeutlicht
34	Der durchgenommene Stoff gewann durch die verwendeten Beispiele an Anschaulichkeit und Praxisnähe

Faktor 4: Gegliedertheit der Veranstaltung

39	Die Veranstaltung verlief nach einer klaren Gliederung
24	Der Stoff war übersichtlich gegliedert
-9	Die Veranstaltung war häufig verwirrend, weil keine Gliederung mehr zu erkennen war und einem so der Überblick verloren ging
-23	Durch die Behandlung zu vieler Einzelheiten ging der Gesamtzusammenhang verloren
30	Der Dozent hat die Veranstaltung didaktisch gut aufgebaut und durchgeführt

Faktor 5: Inhaltliche Wichtigkeit für das Psychologiestudium

-25	Unter psychologischen Inhalten stelle ich mir etwas anderes vor
-13	Da Thema dieser Veranstaltung hatte mit Psychologie nicht viel zu tun
22	Die Veranstaltung machte mich gut mit psychologischen Fragestellungen vertraut
32	Der dargebotene Stoff kam einem oft ziemlich unwichtig vor

Zurück zum Seitenanfang

Faktoren LEIRA

Aus Gründen der methodischen Vergleichbarkeit (s.o.) wurde dann für den LEIRA-Fragebogen ebenfalls eine Fünf-Faktor-Lösung angezielt, die sich folgenderweise darstellt:

Faktor 1: Interessantheit und Effektivität der Veranstaltung

21	Die Veranstaltung ist interessant
4	Das Thema der Veranstaltung interessiert mich
43	Die Veranstaltung fördert mein Interesse am Studienfach
-22	Mir ist in der Veranstaltung langweilig
-23	Die Veranstaltung zieht sich schleppend dahin
30	Ich lerne etwas Sinnvolles und Wichtiges
42	Der Besuch der Veranstaltung lohnt sich
11	Ich werde zum Mitdenken motiviert
12	Zur kritischen Auseinandersetzung mit den behandelten Themen wird angeregt
1	Das behandelte Thema ist von gesellschaftlicher Bedeutung
-44	Wenn man alles mit einer Note zusammenfassen könnte
29	Ich lerne viel in der Veranstaltung
41	Die Diskussionen in der Veranstaltung sind produktiv
3	Das, was ich hier höre und lerne, kann mich persönlich und menschlich weiterbringen

Faktor 2: Engagement, Fachkompetenz und Wirksamkeit der/des Dozierenden

19	Dem Dozenten macht es Spaß zu lehren
24	Der Dozent ist im Umgang mit den Studierenden freundlich und aufgeschlossen
18	Der Dozent nimmt die Lehre wichtig
20	Dem Dozent ist es wichtig, dass die Studierenden etwas in der Veranstaltung lernen können
25	Die Dozentin / Der Dozent ist kooperativ
14	Der Dozent wirkt gut vorbereitet
16	Der Dozent spricht frei und anregend
15	Der Dozent ist m.E. fachkompetent
7	Die Veranstaltung ist gut organisiert
6	Die Vorträge des Dozierenden sind gut gegliedert
13	Der Dozent kann Kompliziertes verständlich machen
17	Der Dozent zeigt Engagement in seiner Lehrtätigkeit

Faktor 3: Praxisnähe und persönliche Bedeutung

47	Was ich in der Veranstaltung gelernt habe, kann mir auch in den Prüfungen und in der Diplomarbeit nützlich sein
9	Die Relevanz/Bedeutung/ Nutzen der behandelten Themen wird nahegelegt
10	Ein Bezug zwischen Theorie und Praxis wird hergestellt
46	Die Veranstaltung dürfte zur Verkürzung meiner Studienzeit beitragen
5	Der inhaltliche Aufbau der Veranstaltung ist stringent/logisch
2	Das Thema hat praktische Bedeutung
8	Der Stoff wird anhand von Beispielen aus dem Alltag oder der Praxis veranschaulicht

Faktor 4: Beteiligung der Studierenden und Verständlichkeit der Veranstaltung

39	Beim Einbringen eigener Beiträge fühle ich mich frei und äußerungsfähig
38	An der Veranstaltung beteilige ich mich mit Wortbeiträgen
40	Es finden ausreichend Diskussionen statt
-27	Das Tempo der Veranstaltung ist zu schnell, ich komme nicht mehr mit
28	Ich verstehe alles
26	Die Stoffmenge kann ich noch verkraften

Faktor 5: Arbeitsaufwand der Studierenden für die Veranstaltung

36	Mein Arbeitsaufwand ist verglichen mit anderen Veranstaltungen sehr hoch
35	Ich bereite mich auf die Veranstaltung vor und bereite sie nach
37	Ich arbeite für die Veranstaltung, z.B. lese die angegebene Literatur

Zurück zum Seitenanfang

Vergleich zwischen Einführungskurs, inhaltlichen und Methoden-Veranstaltungen

Unter Rückgriff auf diese faktoriellen Strukturen wurden anschließend, wie oben begründet, Vergleiche zwischen dem Einführungskurs, den Methoden-Veranstaltungen und den so genannten "inhaltlichen" Veranstaltungen berechnet. Dazu wurden Skalenwerte durch einfaches Aufsummieren der einzelnen Itemwerte gebildet. Die Items, die in den obigen Auflistungen kursiv gedruckt sind, wurden aufgrund zu geringer Faktorladungen (< .50) bei der Skalenwertbildung nicht berücksichtigt. Um die erzielten Werte auf den Skalen leichter interpretieren zu können, wurden anschließend Skalenmittelwerte berechnet. Die Skalenmittelwerte können aufgrund der zugrunde liegenden Ratingskalen beim VB-PSYCH rein theoretisch Werte von 1 bis 4 (4-stufige Skala von 'stimmt' bis 'stimmt nicht'; wegen der einfacheren Interpretation wurde die Skala hier umgedreht, 'stimmt' entspricht 4 Punkte, 'stimmt nicht' 1 Punkt) und beim LEIRA von 1 bis 7 (7-stufige Skala von 'trifft nicht zu' bis 'trifft zu') einnehmen.

Da mit den folgenden Signifikanztests keine universellen Hypothesen überprüft werden, sondern vielmehr die Unterschiede zwischen den Veranstaltungsarten exploriert werden sollen, kann von einer -Adjustierung abgesehen werden (Koch, 2001). Die Veranstaltungsvergleiche werden somit paarweise mittels Welch-Test durchgeführt.

Wie den nachfolgenden Tabellen zu entnehmen ist, ergeben sich beim LEIRA zahlreiche und zum Teil sehr hohe Signifikanzen. Dies kann u.a. auf die hohen Stichprobengrößen zurückgeführt werden. Um bestimmen zu können, ob die signifikanten Unterschiede auch substanziell sind, wurden zusätzlich Effektstärkemaße (d-Wert, s. z.B. Bortz & Döring, 2002) berechnet. Nach einem Vorschlag von Cohen (1988) kann ab d = .30 von einem schwachen, ab d = .50 von einem mittleren und ab d = .80 von einem starken Effekt ausgegangen werden.

Skalenmittelwerte und Standardabweichungen der Veranstaltungstypen der LEIRA-Skalen

	Skala	Veranstaltungstyp	N	Mittelwert	Standardabweichung
1	Interessantheit, Effektivität	Einführungskurs	164	5,34	,97
		inhaltliche Veranstaltungen	330	6,05	,81
		Methoden-Veranstaltungen	485	5,12	1,15
2	Engagement, Fachkompetenz, Wirksamkeit	Einführungskurs	167	6,38	,65
		inhaltliche Veranstaltungen	338	6,36	,63
		Methoden-Veranstaltungen	493	6,04	,82
3	Praxisnähe, persönliche Bedeutung	Einführungskurs	168	5,54	,83
		inhaltliche Veranstaltungen	308	4,96	,98
		Methoden-Veranstaltungen	450	5,07	1,08
4	Beteiligung der Studierenden, Verständlichkeit	Einführungskurs	167	5,00	1,01
		inhaltliche Veranstaltungen	330	5,00	1,17
		Methoden-Veranstaltungen	481	4,53	1,36
5	Arbeitsaufwand	Einführungskurs	171	2,14	1,10
		inhaltliche Veranstaltungen	342	3,64	1,58
		Methoden-Veranstaltungen	497	4,66	1,84

Veranstaltungsvergleich (Welch-Test): Einführungskurs vs. inhaltliche Veranstaltungen mittels LEIRA

	T	df	Sig. (2-seitig)	Mittlere Differenz	d-Wert
Skala 1	-8,092	279,609	,000	-,71	,79
Skala 2	,351	322,569	,726	,02	,03
Skala 3	6,935	396,680	,000	,59	,64
Skala 4	-,042	378,520	,967	,00	,00
Skala 5	-12,558	459,957	,000	-1,50	1,10

Veranstaltungsvergleich (Welch-Test): Einführungskurs vs. Methoden-Veranstaltungen mittels LEIRA

	T	df	Sig. (2-seitig)	Mittlere Differenz	d-Wert
Skala 1	2,442	329,572	,015	,22	,21
Skala 2	5,485	359,972	,000	,34	,46
Skala 3	5,878	387,910	,000	,48	,49
Skala 4	4,630	388,726	,000	,46	,39
Skala 5	-21,472	498,309	,000	-2,52	1,67

Veranstaltungsvergleich (Welch-Test): inhaltliche Veranstaltungen vs. Methoden-Veranstaltungen mittels LEIRA<

	T	df	Sig. (2-seitig)	Mittlere Differenz	d-Wert
Skala 1	13,622	811,835	,000	,93	,94
Skala 2	6,356	818,680	,000	,32	,44
Skala 3	-1,454	696,078	,146	-,11	,11
Skala 4	5,222	770,889	,000	,47	,37
Skala 5	-8,587	796,270	,000	-1,02	,59

Die dargestellten Ergebnisse scheinen darauf hinzudeuten, dass der Einführungskurs im Vergleich zu den übrigen inhaltlichen Veranstaltungen als weniger interessant und effektiv eingeschätzt wird (Skala 1, mittlerer Effekt: d = .79). In Bezug zu den Methoden-Veranstaltungen findet sich zwar ein signifikanter Unterschied; dieser ist jedoch nicht substanziell (d = .21). Die inhaltlichen Veranstaltungen werden als deutlich interessanter eingestuft als die Methoden-Veranstaltungen (d = .94: großer Effekt). Bei der Skala 2 ,Engagement, Fachkompetenz und Wirksamkeit der Dozierenden' resultierten zwei signifikante Unterschiede, die allerdings nur schwach ausfielen (d = .44 bzw. d = .46). Sowohl beim Einführungskurs als auch bei den inhaltlichen Veranstaltungen werden die zugehörigen Aspekte etwas höher eingestuft als bei den Methoden-Veranstaltungen (Skala 2). Einführungskurs und die übrigen inhaltlichen Veranstaltungen unterscheiden sich diesbezüglich nicht. Des Weiteren wird der Einführungskurs als praxisnäher und persönlich bedeutender (Skala 3) eingeschätzt als die inhaltlichen (d = .64) und Methoden-Veranstaltungen (d = .49), während sich inhaltliche und Methoden-Veranstaltungen nicht signifikant unterscheiden. Bei der Skala 4 ,Beteiligung der Studierenden und Verständlichkeit' finden sich keine Unterschiede zwischen Einführungskurs und inhaltlichen Veranstaltungen. Diese beiden Veranstaltungsarten weisen aber jeweils leichte Unterschiede zu den Methodenveranstaltungen im positiven Sinne auf (d = .39 bzw. d = .37). Bezüglich des Arbeitsaufwands der Studierenden für die jeweilige Veranstaltung (Skala 5) unterscheidet sich der Einführungskurs von allen übrigen Veranstaltungen (d.h. inhaltlichen und Methoden-Veranstaltung) insofern, als der Arbeitsaufwand für den Einführungskurs am geringsten ist, und dies mit großem Effekt (d = 1.10 bzw. d = 1.67). Zudem werden die Methoden-Veranstaltungen im Vergleich zu den inhaltlichen Veranstaltungen als arbeitsaufwändiger angesehen (mittlerer Effekt: d = .59).

Auch beim VB-PSYCH ergeben sich trotz geringerer Stichprobenumfängen wiederum fast durchgehend signifikante Unterschiede, die den nachfolgenden Tabellen zu entnehmen sind. Hier erweist sich nur der Unterschied zwischen inhaltlichen und Methoden-Veranstaltungen hinsichtlich der Skala 3 (,,Praxisnähe und Fachrelevanz") als nicht-signifikant.

Skalenmittelwerte und Standardabweichungen der Veranstaltungstypen der VB-PSYCH-Skalen

	Skala	Veranstaltungstyp	N	Mittelwert	Standardabweichung
1	Angemessenheit d. Schwierigkeit, Verständlichkeit	Einführungskurs	66	3,64	,41
		inhaltliche Veranstaltungen	160	3,36	,49
		Methoden-Veranstaltungen	83	2,87	,78
2	Lehrengagement, Kompetenz	Einführungskurs	65	3,73	,27
		inhaltliche Veranstaltungen	156	3,61	,37
		Methoden-Veranstaltungen	76	3,36	,63
3	Praxisnähe, Fachrelevanz	Einführungskurs	68	3,34	,41
		inhaltliche Veranstaltungen	161	3,10	,54
		Methoden-Veranstaltungen	80	3,12	,60
4	Gegliedertheit	Einführungskurs	68	3,75	,34
		inhaltliche Veranstaltungen	165	3,48	,54
		Methoden-Veranstaltungen	82	3,27	,64
5	Inhaltliche Wichtigkeit	Einführungskurs	67	2,85	,68
		inhaltliche Veranstaltungen	164	3,62	,41
		Methoden-Veranstaltungen	79	3,33	,62

Veranstaltungsvergleich (Welch-Test): Einführungskurs vs. inhaltliche Veranstaltungen mittels VB-PSYCH

	T	df	Sig. (2-seitig)	Mittlere Differenz	d-Wert
Skala 1	-4,376	144,997	,000	-,28	,62
Skala 2	-2,690	163,814	,008	-,12	,37
Skala 3	-3,716	167,277	,000	-,24	,50
Skala 4	-4,573	193,874	,000	-,27	,60
Skala 5	8,716	86,712	,000	,77	1,37

Veranstaltungsvergleich (Welch-Test): Einführungskurs vs. Methoden-Veranstaltungen mittels VB-PSYCH

	T	df	Sig. (2-seitig)	Mittlere Differenz	d-Wert
Skala 1	-7,715	128,262	,000	-,77	1,23
Skala 2	-4,591	105,220	,000	-,36	,77
Skala 3	-2,693	138,945	,008	-,22	,43
Skala 4	-5,856	128,090	,000	-,48	,94
Skala 5	4,497	135,544	,000	,49	,74

Veranstaltungsvergleich (Welch-Test): inhaltliche Veranstaltungen vs. Methoden-Veranstaltungen mittels VB-PSYCH

	T	df	Sig. (2-seitig)	Mittlere Differenz<	d-Wert
Skala 1	-5,204	116,092	,000	-,49	,75
Skala 2	-3,126	101,691	,002	-,24	,49
Skala 3	,220	144,110	,826	,02	,03
Skala 4	-2,528	140,963	,013	-,21	,36
Skala 5	-3,718	112,112	,000	-,29	,55

Inhaltlich bedeuten die Ergebnisse der Tabellen zum VB-PSYCH Folgendes: Der Einführungskurs wird im Vergleich zu den inhaltlichen (mittlerer Effekt: d = .62) und Methoden-Veranstaltungen (großer Effekt: d = 1.23) als weniger schwierig und besser verständlich eingeschätzt (Skala 1), was seinerseits mit einer mittleren Effektstärke (d = .75) auch noch einmal für den Vergleich von inhaltlichen und Methoden-Veranstaltungen gilt. Das Lehrengagement und die Kompetenz der/des Dozierenden (Skala 2) werden sowohl im Einführungskurs (d = .37) als auch in den übrigen inhaltlichen Veranstaltungen (d = .77) höher eingestuft als in den Methoden-Veranstaltungen, wobei im ersten Fall nur eine schwache Effektstärke gegeben ist. Dies gilt auch für den Vergleich zwischen dem Einführungskurs und den inhaltlichen Veranstaltungen (d = .49). Die Inhalte des Einführungskurses werden des Weiteren im Vergleich zu den übrigen Veranstaltungen (insgesamt) als praxisnäher und fachrelevanter beurteilt (Skala 3, d = .50 bzw. d = .43); zugleich wird der Einführungskurs im Vergleich wiederum sowohl zu den inhaltlichen Veranstaltungen (d = .60) als auch insbesondere zu den Methoden-Veranstaltungen (d = .94) als gegliederter bewertet (Skala 4). Auch die inhaltlichen Veranstaltungen werden in Relation zu den Methoden-Veranstaltungen als besser organisiert eingeschätzt, wobei der Unterschied hier nicht so deutlich ausgefallen ist (d = .36). Schließlich wird die inhaltliche Wichtigkeit für das Psychologie-Studium (Skala 5) bei den inhaltlichen Veranstaltungen sowohl im Vergleich zum Einführungskurs (großer Effekt: d = 1.37) als auch zu den Methoden-Veranstaltungen (mittlerer Effekt: d = .55) von den Studierenden höher bewertet. Bezüglich dieser Skala werden zudem die Methoden-Veranstaltungen höher eingeschätzt als der Einführungskurs (d = .74).

Insgesamt zeigen die Daten, dass man bei den eingesetzten Instrumenten durchaus von einer gewissen Validität ausgehen kann. Auf den ersten Blick unplausibel ist allerdings das Ergebnis, dass in beiden Fragebögen in Bezug auf das Lehrengagement und die Kompetenz der Dozierenden die inhaltlichen Veranstaltungen und der Einführungskurs höher eingeschätzt werden als die Methoden-Veranstaltungen. Eine Ursache hierfür könnte - wie bereits eingangs erwähnt - in der höher bewerteten Schwierigkeit der Methoden-Veranstaltungen liegen. Die wahrgenommene höhere Schwierigkeit könnte die Beurteilung hinsichtlich des Lehrengagements und der Kompetenz der Dozierenden negativ beeinflusst haben.
Anzumerken bleibt jedoch, dass methodisch saubere Vergleiche zwischen Methoden- und inhaltlichen Veranstaltungen verlangen, dass Veranstaltungen gleichen Typus, die jeweils von denselben Dozierenden gehalten wurden, gegenübergestellt werden. Nur so können Konfundierungen mit der Veranstaltungsart und/oder den Dozierenden vermieden werden. Zur Darstellung dieser Auswertungsmöglichkeit über mehrere Dozierenden hinweg ist an dieser Stelle jedoch nicht genügend Raum vorhanden (s. aber Koch, 2004).

Die Replikation des oben berichteten Ergebnisses, dass Methoden-Veranstaltungen im Vergleich zu inhaltlichen Veranstaltungen als schwieriger, uninteressanter und weniger (inhaltlich) wichtig für das Psychologie-Studium angesehen werden, spricht dafür, dass auch in den vorliegenden Untersuchungsstichproben die üblichen Bewertungsmuster der Studierenden abgebildet worden sind. Andererseits zeigt die Unterschätzung der Relevanz von Methoden-Veranstaltungen für das Psychologie-Studium, wenn man z.B. deren Gewicht bei den Lehrzielen und dem Studienplan für die Diplom-Ausbildung zugrunde legt, auch die Grenzen der Aussagekraft dieser Bewertungsperspektiven auf.
Allerdings kann man in Bezug auf das wichtigste inhaltliche Ziel dieser Evaluation (s.o.), nämlich die didaktische Realisierung und Etablierung eines Einführungskurses, doch von einem relativ validen Vergleich zwischen den Veranstaltungskategorien in Relation auf die hier zentralen Dimensionen der Verständlichkeit, der Gegliedertheit, Praxisnähe und Fachrelevanz ausgehen. Insgesamt sind dabei auch die absoluten Werte mit einer quasi ,,Zustimmung" zu der didaktischen Konzeption von 5,5 (Skala 1) beim LEIRA (bei einer 7-stufigen Skala von 1 ,trifft nicht zu' bis 7 ,trifft zu') bzw. 5,3 (Skala 3) sowie 3,3 und 3,8 (bei den Skalen 3 und 4) beim VB-PSYCH (4-stufige Skala von ,stimmt' bis ,stimmt nicht') als durchaus ermutigend anzusehen. Dass im Einführungskurs der Arbeitsaufwand als weniger intensiv im Vergleich zu den sonstigen Veranstaltungen angegeben wird, entspricht ebenfalls durchaus der Konzeption dieses Kurses, in dem ja zunächst einmal die relevanten Informationen und zumindest ansatzweise auch Arbeitstechniken für die Bewältigung des Studiums einführend vorgestellt werden sollen. So sind relevante Verbesserungsaspekte vor allem aus den individuellen, qualitativen Rückmeldungen (innerhalb und außerhalb der eingesetzten Fragebögen) zu entnehmen, als deren Folge z.B. inzwischen auch die Präsentation von Referaten mitthematisiert wird und von der Organisation her die drei Blockkurse in der ersten Hälfte des jeweiligen Wintersemesters (d.h. bis zu den Weihnachtsferien) abgeschlossen werden.

Die angeführten Skalenmittelwerte machen überdies deutlich, dass der Arbeitsaufwand der Studierenden für die inhaltlichen Veranstaltungen (LEIRA Faktor 5) von ihnen selbst nur als durchschnittlich (m = 3,64) bewertet wird. Auf der anderen Seite wird die inhaltliche Wichtigkeit dieser Veranstaltungen für das Psychologie-Studium (VB-PSYCH Faktor 5) mit 3,6 fast als optimal eingeschätzt; es wird auf die Dauer zu überprüfen sein, ob dies speziell für die angebotenen Themen der Allgemeinen Psychologie oder aber vielleicht für die Fächer des Grundstudiums generell im Vergleich zu den anwendungsorientierten Fächern des Hauptstudiums gilt (ggf. anhand paralleler Lehrevaluationen in diesen Fächern mit dem gleichen Instrumentarium).

Zurück zum Seitenanfang

Bewertung von Lehrveranstaltungen durch Studierende

An dieser Stelle wird die Bewertung der Lehrveranstaltungen mittels der inhaltlichen Dimensionen des LEIRA veranschaulicht. Dabei werden einige grundsätzliche Problembereiche der Lehrevaluation diskutiert. Der LEIRA besteht insgesamt aus 16 Skalen (s. Anhang). Sechs der sechzehn Skalen (3. ,Struktur', 4. ,Breite', 5. ,Verarbeitung', 6. ,Lehrkompetenz', 7. ,Dozentenengagement', 9. ,Klima') beziehen sich nach Rindermann (2001) auf beobachtbares Lehrverhalten der Dozierenden. Die Lehreffektivität, was als Zielkriterium einer Lehrveranstaltung gelten kann, soll mit den Skalen 8. ,Interessantheit', 11. ,Lernen' und 16. ,Allgemeineinschätzung' erhoben werden. Unter studierendenbezogene Aspekte, deren Ausmaß von den Einflüssen von Studierenden selbst (mit) abhängen, werden von Rindermann (2001) die Skalen 12. ,Referate', 14. ,Beteiligung' und 15. ,Diskussion' subsumiert. Als Rahmenbedingungen im Sinne von potenziell verzerrenden Variablen (= Biasvariablen) können die Aspekte 1. ,Themarelevanz', 2. ,Persönliche Bedeutung', 10. ,Anforderung', d.h. Schwierigkeit der Veranstaltung, sowie 13. ,Fleiß' (besser Arbeitsaufwand) der Studierenden eingeordnet werden.

Es können zumindest zwei Funktionen der Lehrevaluation unterschieden werden (Prenzel, 1999): eine Entwicklungs- bzw. Optimierungsfunktion und eine Rechenschaftsfunktion.
Bei der Optimierungsfunktion werden Rückmeldungen für die Dozierenden erhoben, um diese für eventuelle Verbesserungen der Lehre zu verwenden (vgl. Bargel & Hage, 2000; Gold, 1996). Um aussagekräftige Informationen zu erhalten, sollten Bewertungen von mindestens N = 10 Studierenden vorliegen, da nur so die Objektivität der Beurteilung gewährleistet werden kann. Aufgrund der Resultate kann der/die Dozierende seine Lehrqualität einschätzen.
Bei der Lehrevaluation im Sinne der Rechenschaftsfunktion werden Vergleiche zwischen der Lehrleistung von Dozierenden durchgeführt und veröffentlicht, womöglich mit - bislang in Deutschland lediglich diskutierten (vgl. Diehl, 2003; Koch, 2004; Rindermann, 2001) - weit reichenden Konsequenzen für die Lehrenden (z.B. Gehaltseinbußen, weniger Chancen bei Berufungen usw.). Bei dieser Form der Lehrevaluation sind härtere Kriterien zu fordern als bei der im Sinne einer Entwicklungsfunktion. Hiermit ist neben anderen Validitätskriterien insbesondere die Generalisierbarkeit der Ergebnisse anzuführen. Im Kontext der Rechenschaftsfunktion müssen somit nicht nur auf der Ebene der einzelnen Veranstaltungen jeweils genügend Studierendenurteile vorliegen (s.o., N = 10). Um eine Generalisierbarkeit und somit Vergleichbarkeit zu gewährleisten, müssen auch ausreichend Veranstaltungen eines/r Dozierenden bewertet worden sein. Hierzu sollten zumindest N = 5 Veranstaltungen gleichen Typus zur Verfügung stehen (vgl. Rindermann, 2001; Koch, 2004).

Dass es hierbei wesentlich ist, zwischen unterschiedlichen Veranstaltungsarten (z.B. Vorlesung vs. Referate-Seminar) zu differenzieren, sei an einem Beispiel veranschaulicht.

In dem Beispiel wird eine Vorlesung mit methodischem Inhalt (,,Wissenschaftstheorie") und ein Seminar mit inhaltlichem Bezug (,,Kreatives Problemlösen") gegenübergestellt. Beide Veranstaltungen wurden über mehrere Semester von Herrn Prof. Groeben gehalten. Für die Vorlesung liegen insgesamt n = 42 studentische Einschätzungen vor, für das Referate-Seminar n = 30. In der unteren Tabelle sind die Mittelwerte beider Veranstaltungen, die Signifikanz-Werte der Unterschiede (via Welch-Test) und die Effektstärken eingetragen.
Wenn man nur die Lehrverhaltensskalen betrachtet, fällt unmittelbar auf, dass kaum signifikante Unterschiede vorliegen. Nur bei zwei Aspekten sind Signifikanzen aufgetreten und zwar bei den Skalen 5. ,Verarbeitung' (d = .80) und 9. ,Klima' (d = .63). Bei diesen Skalen geht es darum, inwiefern die Dozierenden die Studierenden zum Mitdenken motivieren und zur kritischen Auseinandersetzung mit den Inhalten anregen (,Verarbeitung') bzw. ein positive, wertschätzende Atmosphäre schaffen (,Klima').

Dimension	Inhaltliche Einteilung	M Vorlesung	M Seminar	M Differenz	p-Wert	d-Wert
1. Themarelevanz	Rahmenbed.	4,62	6,02	-1,40	,000	-,98
2. Persönliche Bedeutung	Rahmenbed.	5,46	6,28	-,82	,003	-,70
3. Struktur	Lehrverhalten	5,80	5,74	,06	,839	,05
4. Breite	Lehrverhalten	5,35	5,76	-,42	,220	-,30
5. Verarbeitung	Lehrverhalten	5,83	6,58	-,75	,001	-,80
6. Lehrkompetenz	Lehrverhalten	6,23	6,53	-,31	,097	-,40
7. Dozentenengagement	Lehrverhalten	6,34	6,72	-,38	,053	-,46
8. Interessantheit	Lehreffekt.	5,67	6,17	-,49	,082	-,41
9. Klima	Lehrverhalten	5,51	6,35	-,84	,008	-,63
10. Anforderung	Rahmenbed.	4,27	2,81	1,46	,000	1,06
11. Lernen	Lehreffekt.	5,51	5,87	-,35	,197	-,31
12. Referat	studierendenb.		5,26
13. Fleiß	Rahmenbed.	3,58	3,63	-,05	,890	-,03
14. Beteiligung	studierendenb.	3,98	4,60	-,62	,111	-,39
15. Diskussion	studierendenb.	4,95	6,08	-1,13	,000	-,98
16. Allgemeineinschätzung	Lehreffekt.	5,68	6,24	-,56	,043	-,48

Die Ergebnisse sprechen a posteriori für eine gewisse Validität des LEIRA. Aufgrund ihrer Operationalisierungen (s. zugehörige Items im Anhang) ist es nachzuvollziehen, dass Lehrverhalten wie die Organisation des Kurses (3. ,Struktur'), der Theorie-Praxis-Bezug (4. ,Breite') sowie die Lehrkompetenz (Skala 6.) und das Engagement der Dozierenden (Skala 7.) unabhängig davon realisierbar sind, ob es sich um ein Referate-Seminar oder um eine Vorlesung handelt. Es sind Lehraspekte, die im Wesentlichen von der Person des/der Dozierenden abhängen. Der Aspekt der Verarbeitung (Skala 5.) kann hingegen in Referate-Seminaren leichter umgesetzt werden, da die Studierenden unmittelbar höhere Beteiligungsmöglichkeiten besitzen. In gewissen Ausmaß kann das zugehörige Lehrverhalten zwar auch in Vorlesungen verwirklicht werden, was sich mit einem absoluten Wert von (m = 5.83) auch gezeigt hat, nur eben nicht so stark wie in Referate-Seminaren (m = 6.58). Dies gilt im gleichen Maße für den Aspekt des Klimas, d.h. der Atmosphäre in der Veranstaltung (Skala 9.). Durch den relativ zentrierten Unterrichtsstil in Vorlesungen wird eine gewisse Distanz zwischen Dozierendem/r und Studierenden quasi nebenbei aufgebaut.
Bei den Rahmenbedingungen werden die ,Relevanz' (Skala 1.) und die ,Persönliche Bedeutung' des Themas (Skala 2.) in dem inhaltlichen Referate-Seminar signifikant und deutlich höher bewertet (d = .98 bzw. d = .70) als bei der Methoden-Vorlesung. Gleichzeitig wird das Anforderungsniveau (Skala 10.) bei der Vorlesung höher eingeschätzt. Dies entspricht dem oftmals gefundenen Unterschied bei der studentischen Bewertung zwischen inhaltlichen und Methoden-Veranstaltungen (s.o.). Interessant ist, dass sich dies kaum auf die Lehreffektivitätsvariablen auswirkt. Hier findet sich nur bei der Allgemeinbeurteilung ein signifikanter Unterschied, der zudem mit d = .49 nur schwach ausgefallen ist.
Bei den studierendenbezogenen Skalen 14. ,Beteiligung' und 15. ,Diskussion' ergaben sich ebenfalls nachvollziehbare Resultate. Beide Skalen werden bei der Seminar-Veranstaltung höher bewertet, wobei nur bei der Skala ,Diskussion' ein signifikanter Effekt (d = .98) resultierte. Diskussionen werden zwar von dem Verhalten der Studierenden bedingt, sie sind jedoch auch mit dem Veranstaltungstypus verknüpft. Gegen einen hohen Diskussionsanteil bei Vorlesungen ist nämlich einzuwenden, dass ein Hauptanliegen dieser Veranstaltungsart in der Vermittlung von Stoff liegt, was prinzipiell Diskussionen nicht ausschließt. Diese sind auch hier vielmehr erwünscht, nur nicht so stark wie bei Seminaren, sondern eher im mittleren Ausmaß. Auch wenn von den Autoren des LEIRA eine Bewertung unabhängig vom Veranstaltungstypus versucht wurde, spielen hier womöglich die Vorerwartungen der Studierenden eine Rolle, insbesondere beim Item ,Es finden ausreichend Diskussionen statt'. Wenn von einem zu hohen Diskussionsanteil in Vorlesungen ausgegangen wird, wird dieses Item niedriger bewertet als bei adäquaten Erwartungen.

Insgesamt sollte anhand des Beispiels deutlich werden, dass man vor allem bei vergleichenden Bewertungen im Sinne der Rechenschaftsfunktion zunächst einmal generell bestimmen muss, welche Aspekte ein/e Dozierende/r zu verantworten hat und bei welchen er oder sie wenig Einflussmöglichkeiten besitzt. So sollten studierendenbezogene Aspekte und Rahmenbedingungen auch als solche verstanden und nicht zur Bewertung der Dozierenden herangezogen werden. Bei den Lehrverhaltensskalen gibt es wiederum einige Aspekte, die von der jeweiligen Veranstaltungsart mitbestimmt werden. Daher sollte man, um auf der sicheren Seite zu stehen, bei Lehrkompetenz-Vergleichen immer nur Veranstaltungen gleichen Typus heranziehen. Nur so können Konfundierungseffekte vermieden werden.

Auf die generelle Kritik an der studentischen Lehrevaluation und an dem LEIRA im Speziellen wird an dieser Stelle nicht eingegangen. Hier sei nur angemerkt, dass bisherige deutsch- und englischsprachige Fragebögen zur Lehrevaluation und somit auch der LEIRA im Wesentlichen auf intuitiv formulierten Items und/oder auf Einschätzungen von Dozierenden oder Studierenden bezüglich relevanter Aspekte einer guten Lehre basieren oder sich auf solche Instrumente beziehen. Die auf diese Weise konstruierten Itempools, die ohne Zweifel einen kryptonormativen Gehalt (Groeben, 1986) aufweisen, wurden anschließend inhaltlich (z.B. Rindermann & Amelang, 1993) oder über Faktorenanalysen (z.B. Diehl & Kohr, 1977) gebündelt. Zwar finden sich immer wieder Hinweise, dass auch hochschuldidaktische Literatur berücksichtigt worden ist. Diese Bezugnahme geht jedoch in der Regel nicht über a posteriori angeführte Verweise auf Lehr-Lern-Konzeptionen hinaus (s. z.B. Rindermann, 1998, 2001; Marsh & Roche, 1994); eine systematische nachvollziehbare Aufarbeitung der Forschungsliteratur und Herleitung relevanter Aspekte fehlt bisher.
Diese Vorgehensweise führte zu den immer wieder aufkommenden Vorwürfen, dass es sich bei Verfahren zur Lehrevaluation um eine lose Zusammenstellung von Items ohne großen übergreifenden theoretischen Rahmen handele (Kromrey, 1995) oder dass theoretische Begründungen der Kriterien guter Lehre fehlten (Gold, 1996).

Dieser Ansatzpunkt für Kritik sollte bei einem neuen Fragebogen zum Dozierendenverhalten (FRADOV: Koch, 2004), der an diesem Lehrstuhl entwickelt worden ist, ausgeschlossen werden. Eine deduktiv-theoretische Herangehensweise bei der Konstruktion des Fragebogens war dabei allerdings nicht möglich, da eine Theorie der Hochschuldidaktik selbst heute (noch) nicht existiert (Bargel & Hage, 2000). Realisierbar war jedoch ein umfassender, systematischer Rekurs auf lehrevaluationsrelevante Forschungsbereiche. Zur theoriebezogenen Herleitung der bedeutsamen Aspekte einer ,,guten" Lehre wurden dazu die grundlegenden relevanten Arbeiten und Konzeptionen aus der kognitiven Psychologie, der kognitiven Instruktionspsychologie und der konstruktivismusbezogenen Lehrkonzeption bzw. aus dem Forschungsbereich des selbstbestimmten Lernens herangezogen.

Zurück zum Seitenanfang

Literatur

Bargel, T. & Hage, N. El (2000). Evaluation der Hochschullehre. Zeitschrift für Pädagogik, Beiheft 41, 207-224.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NJ: Erlbaum.

Diehl, J.M. (2003). Normierung zweier Fragebögen zur studentischen Beurteilung von Vorlesungen und Seminaren. Psychologie in Erziehung und Unterricht, 50, 27-42.

Diehl, J.M. & Kohr, H.U. (1977). Entwicklung eines Fragebogens zur Beurteilung von Hochschulveranstaltungen im Fach Psychologie. Psychologie in Erziehung und Unterricht, 24, 61-75.

Esser, H. (1994). Lehrbericht der Fakultät für Sozialwissenschaften der Universität Mannheim. Ergebnisse der Studenten- und Lehrerhebung im Wintersemester 1993/94. Mannheim: Fakultätsbericht.

Gold, A. (1996). Können Studierende die Qualität der Lehre beurteilen? Einige Anmerkungen zu Rindermanns Antwort an seine Kritiker. Zeitschrift für Pädagogische Psychologie, 10, 147-150.

Koch, E. (2001). Über die angemessene Verwendung der alpha-Adjustierung. Kölner Psychologische Studien, 6, 33-44.

Koch, E. (2004). Gute Hochschullehre. Theoriebezogene Herleitung und empirische Erfassung relevanter Lehraspekte. (Im Druck)

Kromrey, H. (1995). Rezension des Heidelberger Inventars zur Lehrveranstaltungs-Evaluation. Zeitschrift für Pädagogische Psychologie, 9, 221-224.

Marsh, H.W. & Roche, L.A. (1994). The use of students' evaluations of university teaching to improve teaching effectiveness. Canberra: Department of Employment, Education and Training.

Marsh, H.W. & Roche, L.A. (1997). Making students' evaluations of teaching effectiveness effective. American Psychologist, 52, 1187-1197.

Prenzel, M. (1999). Studentische Beurteilungen von Lehrveranstaltungen - ein Thema für pädagogische Forschung? In G. Pollak & R. Prim (Hrsg.), Erziehungswissenschaft und Pädagogik zwischen kritischer Reflexion und Dienstleistung (S. 268-279). Weinheim: Deutscher Studien Verlag.

Rindermann, H. (1998). Skalen der Lehrevaluation: Welche Aspekte sollen in universitären Lehrveranstaltungen beurteilt werden? In G. Krampen (Hrsg.), Psychologiedidaktik und Evaluation (S. 295-316). Bonn: Deutscher Psychologenverband.

Rindermann, H. (2001). Lehrevaluation. Landau: Verlag Empirische Pädagogik.

Rindermann, H. & Amelang, M. (1993). Entwicklung eines Instruments zur Evaluation von universitären Lehrveranstaltungen. Bericht an das Wissenschaftsministerium des Landes Baden-Württemberg. Psychologisches Institut der Universität Heidelberg.

Rindermann, H. & Amelang, M. (1994). Das Heidelberger Inventar zur Lehrveranstaltungsbeurteilung (HILVE). Heidelberg: Asanger.

Zurück zum Seitenanfang

Anhang

Items und Dimensionen des LEIRA

Antwortskala:

trifft nicht zu

1 -- 2 -- 3 -- 4 -- 5 -- 6 -- 7

trifft zu

1. Themarelevanz
Das behandelte Thema ist von gesellschaftlicher Bedeutung.
Das Thema hat praktische Bedeutung.

2. Persönliche Bedeutung
Das was ich hier höre und lerne, kann mich persönlich und menschlich weiterbringen.
Das Thema der Veranstaltung interessiert mich.

3. Struktur
Der inhaltliche Aufbau der Veranstaltung ist stringent/logisch.
Die Vorträge des Dozenten sind gut gegliedert.
Die Veranstaltung ist gut organisiert.

4. Breite
Der Stoff wird anhand von Beispielen aus dem Alltag oder der Praxis veranschaulicht.
Die Relevanz/Bedeutung/Nutzen der behandelten Themen wird nahegelegt.
Ein Bezug zwischen Theorie und Praxis wird hergestellt.

5. Verarbeitung
Ich werde zum Mitdenken motiviert.
Zur kritischen Auseinandersetzung mit den behandelten Themen wird angeregt.

6. Lehrkompetenz
Der Dozent kann Kompliziertes verständlich machen.
Die Dozentin/Der Dozent wirkt gut vorbereitet.
Die Dozentin/Der Dozent ist m.E. fachkompetent.
Die Dozentin/Der Dozent spricht frei und anregend.

7. Dozentenengagement
Der Dozent zeigt Engagement in seiner Lehrtätigkeit und versucht Begeisterung "rüberzubringen".
Die Dozentin/Der Dozent nimmt die Lehre wichtig.
Dem Dozenten macht es Spaß, zu lehren.
Dem Dozenten ist es wichtig, dass die Studierenden etwas in der Veranstaltung lernen können.

8. Interessantheit
Die Veranstaltung ist interessant.
Mir ist in der Veranstaltung langweilig.
Die Veranstaltung zieht sich schleppend dahin.

9. Klima
Der Dozent ist im Umgang mit den Studierenden freundlich und aufgeschlossen.
Die Dozentin/Der Dozent ist kooperativ.

10. Anforderung
Die Stoffmenge kann ich noch verkraften.
Das Tempo der Veranstaltung ist zu schnell, ich kam nicht mehr mit.
Ich verstehe alles.

11. Lernen
Ich habe viel in der Veranstaltung gelernt.
Ich lerne etwas Sinnvolles und Wichtiges.

12. Referate
Die Referate der Studierenden sind interessant.
Die Referate sind strukturiert und verständlich.
Die Referate sind nützlich und wertvoll.
Die Referenten werden durch den Dozenten gut betreut und adäquat ergänzt.

13. Fleiß
Ich bereite mich auf die Veranstaltung vor oder bereitete sie nach.
Mein Arbeitsaufwand für die Veranstaltung ist verglichen mit anderen Veranstaltungen sehr hoch.
Ich arbeite für die Veranstaltung, z.B. lese die angegebene Literatur.

14. Beteiligung
An der Veranstaltung beteilige ich mich mit Wortbeiträgen.
Beim Einbringen eigener Beiträge fühle ich mich frei und äußerungsfähig.

15. Diskussion
Es finden ausreichend Diskussionen statt.
Die Diskussionen in der Veranstaltung sind produktiv.

16. Allgemeineinschätzung
Der Besuch der Veranstaltung lohnt sich.
Die Veranstaltung fördert mein Interesse am Studienfach.
Wenn man alles in einer Note zusammenfassen könnte,
würde ich der Veranstaltung folgende Note geben: ................................
(Notenskala von sehr gut = 1 bis ungenügend = 6, es sind auch Viertelnoten, wie 3,5 oder 2+ möglich. Bitte die betreffende Zahl eintragen.)

Autor:

Erik Koch

Zurück zur LEHRE-Seite

Webmaster