Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von...

83
Rüdiger Grotjahn Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung Pallini (Athen), 13.9.2013 [email protected] Rüdiger Grotjahn

Transcript of Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von...

Page 1: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Rüdiger Grotjahn

Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung

Pallini (Athen), 13.9.2013

[email protected] Rüdiger Grotjahn

Page 2: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Gliederung und Überblick

1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen,

b) Sprachtestanbieter, c) GER 4. Testgütekriterien 5. Spezifik von Qualitätsanforderungen im

Kontext unterrichtsnahen formativen Testens 6. Optimierung der Rückwirkungen von

Prüfungen als spezifisches Qualitätsmerkmal

Rüdiger Grotjahn 2

Page 3: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Testen, Prüfen, Evaluieren: Unterscheidung

Vorbemerkung zur Terminologie: Testen = Prüfen Sprachtest = Sprachprüfung Evaluieren/Evaluation: Oberbegriff zu Testen/Prüfen Assessment

Rüdiger Grotjahn 3

Page 4: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Testen, Prüfen, Evaluieren: Unterscheidung

Beispiele für weitere Instrumente zur Evaluation sprachlicher Kompetenzen (≠ Test):

– Portfolio – Unterrichtsbeobachtung – Rückmeldungen (Korrekturen; Lob & Tadel) – …

Rüdiger Grotjahn 4

Page 5: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Qualitätsstandards

Qualitätsstandards • zunehmende Bedeutung im Hinblick auf das

Testen, Prüfen und Evaluieren sprachlicher Kompetenzen

• Abhängigkeit der Relevanz und Wichtigkeit bestimmter Qualitätsstandards von den Funktionen (Zielen) der Evaluation und der Art der Evaluation

Rüdiger Grotjahn 5

Page 6: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Funktionen/Ziele von Evaluationen: Lehrersperspektive

• Diagnose • Förderung • Einstufung • Auslese und Zulassung • Vergabe von Noten • Rückmeldung an die Lernenden/Eltern • Motivierung • Disziplinierung

Rüdiger Grotjahn 6

Page 7: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Funktionen/Ziele von Evaluationen: bildungspolitische Perspektive

• Vergleich größerer Bildungseinheiten (z.B. DESI Studie)

• Überprüfung von bildungspolitischen Zielen (z.B. Bildungsstandards)

• positive Beeinflussung des Unterrichts (z.B. positiver Washback-Effekt durch handlungs- und aufgabenorientierte Sprachtests)

(Grotjahn/Kleppin, 2014, Kap. 2.4)

Rüdiger Grotjahn 7

Page 8: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Evaluation: Typen

Vielzahl verschiedener Typen ( Funktionen): • standardisiert vs. nicht-standardisiert • formell vs. informell • summativ vs. formativ • bezugsgruppenorientiert vs. kriteriumsorientiert • Fremdevaluation vs. Selbstevaluation • …

Rüdiger Grotjahn 8

Page 9: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Evaluation: formell/standardisiert Beispiele formeller, standardisierter Tests: • Goethe-Zertifikate • ÖSD (Österreichisches Sprachdiplom Deutsch) • TestDaF • telc-Zertifikate

(The European Language Certificates)

Ziel: vergleichbare und zuverlässige summative Feststellung des Sprachstandes unabhängig von der spezifischen Lerngeschichte der Testteilnehmer Rüdiger Grotjahn 9

Page 10: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Evaluation: summativ

Merkmale summativer Evaluation: • häufig „high-stakes“, formell, standardisiert • Funktionen: z.B. Benotung, Zulassung • produkt-/ergebnisorientiert • im Unterrichtskontext: am Ende eines

Lernabschnitts

Assessment of learning (Evaluation des Lernerfolgs)

Rüdiger Grotjahn 10

Page 11: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Evaluation: formativ

• kontinuierlich und prozessorientiert • in den Unterricht integriert • zumeist nicht standardisiert • häufig ungeplant • häufig als kooperative Interaktion zwischen

Lehrer und Lerner • zumeist „low-stakes“ • häufig keine Benotung • zumeist deskriptive Rückmeldung zu Stärken und

Schwächen

Rüdiger Grotjahn 11

Page 12: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Evaluation: formativ Assessment for Learning

Evaluation im Dienste des Lernens

Assessment as Learning Evaluation im Zuge des Lernens

Rüdiger Grotjahn 12

Page 13: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Interaktionistische dynamische Evaluation

Beispiel für Evaluation im Zuge des Lernens: (Assessment as Learning) Interaktionistische Dynamische Evaluation (IDE) (Vygotzkij, Lantolf, Poehner) • dialogisch-kooperative Diagnostik des

Lernstandes und Lernpotentials • in den unterrichtlichen Vermittlungsprozess

integriert • Diagnostik des Potentials

Rüdiger Grotjahn 13

Page 14: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Qualitätsstandards

Abhängigkeit der Qualitätsanforderung an Evaluationen: • Zielsetzungen der Evaluation • Konsequenzen für die Betroffenen Extrembeispiele für unterschiedliche Qualitätsanforderungen: • universitärer Zulassungstest • informelles Sprachquiz im Unterricht

Rüdiger Grotjahn 14

Page 15: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Qualitätsstandards

Vielzahl verschiedener Standards zur Sicherung der Qualität von Sprachtests Berufs- und Fachvereinigungen: Fachstandards/berufliche Qualifikationen Association of Language Testers in Europe (ALTE) • ALTE Code of Practice (2007) • ALTE Mindeststandards (2007)

Rüdiger Grotjahn 15

Page 16: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Qualitätsstandards

International Language Testing Association (ILTA) • ILTA Code of Ethics (2000) • ILTA Guidelines for Practice (2007)

European Association for Language Testing and Assessment (EALTA) • EALTA Guidelines for Good Practice in

Language Testing and Assessment (2006)

Rüdiger Grotjahn 16

Page 17: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Qualitätsstandards

Sprachtestanbieter: • Cambridge English Language Assessment.

(2013). Principles of good practice: Quality management and validation in language assessment. Cambridge: Cambridge English Language Assessment

Rüdiger Grotjahn 17

Page 18: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Qualitätsstandards

Sprachtestanbieter: explizite Hinweise zur Qualitätssicherung: Glaboniat, M./ Perlmann-Balme, M./ Studer, T. (2013): Zertifikat B1: Deutschprüfung für Jugendliche und Erwachsene - Prüfungsziele, Testbeschreibung. Ismaning: Hueber.

trinationales Entwicklungsprojekt: Goethe-Institut, Österreichisches Sprachdiplom Deutsch & Universität Freiburg (Schweiz)

Rüdiger Grotjahn 18

Page 19: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Gemeinsamer europäischer Referenzrahmen (GER)

wichtiges Bezugsdokument in der Qualitätsdiskussion: • Europarat (2001): Gemeinsamer europäischer

Referenzrahmen für Sprachen: Lernen, Lehren, Beurteilen. Berlin: Langenscheidt

Rüdiger Grotjahn 19

Page 20: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Gemeinsamer europäischer Referenzrahmen (GER)

viele ergänzende Dokumente wichtiges Beispiel: • Council of Europe (2009):

Relating language examinations to the Common European Framework of Reference for Languages: Learning, Teaching, Assessment (CEFR): A manual. Strasbourg: Council of Europe, Language Policy Division.

Rüdiger Grotjahn 20

Page 21: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

GER: Handlungs- und Kompetenzorientierung

Handlungs- und Kompetenzorientierung als Qualitätsmerkmal: • Prüfungen als Indikator für die Fähigkeit zur

Lösung konkreter lebensweltlicher Aufgaben und der hierfür nötigen Kompetenzen

Beispiel 1: • interaktive Planung eines Krankenhausbesuchs als

Teil einer mündlichen Paarprüfung (Zertifikat B1, 2013: Prüfungsziele - Testbeschreibung, S. 103)

Rüdiger Grotjahn 21

Page 22: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

GER: Handlungs- und Kompetenzorientierung

Beispiel 2: • Aufgaben zur Sprachmittlung (Mediation) im

Griechischen Staatszertifikat KPG (ΚΠΓ) (vgl. Dendrinos 2012)

Begründung (Zertifikat B1 und KPG): konkrete adressatenspezifische lebensweltliche Anforderungen

Rüdiger Grotjahn 22

Page 23: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

GER: Handlungs- und Kompetenzorientierung

Beispiel 3: • Testaufgabe zum Hörverstehen

(Deutsch-Test für Zuwanderer (dtz) A2-B1: Prüfungsziele, Testbeschreibung (2009), S. 47)

= Beispiel für eine explizite Ableitung von Testaufgaben aus konkreten lebensweltlichen Anforderungen

Rüdiger Grotjahn 23

Page 24: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Hörverstehen: handlungsorientierte Testaufgabe (dtz)

Handlungsorientierte Aufgabe im Alltag Der/die Lernende soll einen Text auf dem Anrufbeantworter abhören und herausfinden, wann ihm/ihr ein Termin für eine Sprechstunde angeboten wird.

Rüdiger Grotjahn 24

Ansage auf Anrufbeantworter Guten Tag, dies ist der automatische Anrufbeantworter der Praxis Dr. Antonia Renk, Fachärztin für … Die Praxis ist wegen Urlaub bis zum 15.4. geschlossen. In dringenden Fällen wenden Sie sich bitte an meine Vertretung, Dr. Paul …

Page 25: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Hörverstehen: handlungsorientierte Testaufgabe (dtz)

Prüfungsaufgabe Sie brauchen schnell einen Termin. Was sollen Sie machen? a) Bei einem anderen Arzt anrufen. b) Bis zum 15. April warten. c) Heute noch einmal anrufen.

Rüdiger Grotjahn 25

Lösung: Best-Antwort: Option a) (Notwendigkeit eines baldigen Termins)

Page 26: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Zuordnung von Prüfungen zu den Kompetenzniveaus des GER

Zuordnung von Prüfungen und Prüfungsaufgaben zu den Stufen A1, …, C2 Unterschiede in der Seriosität: • Zuordnung nach Augenschein und

Vermarktungspotential • (umfangreiche) wissenschaftliche

Forschungsprojekte: z.B. Cambridge English; TestDaF; Zertifikat B1 Deutsch (neu); dtz A2-B1

Rüdiger Grotjahn 26

Page 27: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

GER als Qualitätsmaßstab: Probleme

Kontexte und Adressaten: • Keine Berücksichtigung spezifischer Kontexte (z.B.

Beruf) • Adressaten der Skalen des GER: kognitiv reife

(ältere) Jugendliche und Erwachsene Notwendigkeit der Anpassung der Skalen an lokale Kontexte und spezifische Adressaten

Rüdiger Grotjahn 27

Page 28: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

GER als Qualitätsmaßstab: Probleme

Beispiele für Anpassungen: • Niveaustufenbeschreibungen für jüngere

Jugendliche und Kinder – Lingualevel Beschreibungen (Schweiz) – ESP für die Grundschule

Rüdiger Grotjahn 28

Page 29: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

GER als Qualitätsmaßstab: Probleme

weiteres Problem: • bisher unzureichende empirische Absicherung

einzelsprachlicher Referenzniveau-beschreibungen wie z.B. Profile deutsch

English Profile Project

Rüdiger Grotjahn 29

Page 30: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Cambridge English Language Assessment

Qualitätsstandards und Qualitätsmanagement:

Cambridge English Language Assessment. (2013). Principles of good practice: Quality management and validation in language assessment

Cambridge English Language Assessment: = Vorbild für viele andere Testentwickler (z.B. das Goethe-Institut)

Rüdiger Grotjahn 30

Page 31: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Cambridge English Language Assessment

Basis: • GER • Validitätsmodell von Weir (2005) • Gütekriterium der Nützlichkeit

(Bachman/Palmer, 2010) • argumentbasierte Validierung (Rechtfertigung)

der Interpretation der Testergebnisse und der zu treffenden Entscheidungen (im Sinne von Bachman/Palmer 2010, Kane 2013)

Rüdiger Grotjahn 31

Page 32: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Cambridge English Language Assessment

besonderes Merkmal: gleichzeitige Berücksichtigung der klassischen Testgütekriterien und Prinzipien des Qualitätsmanagement Zentrale Leitprämisse: Fit for purpose (Eignung der Evaluation für die Zielsetzungen)

Rüdiger Grotjahn 32

Page 33: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Cambridge English Language Assessment

VRIPQ als zentraler Qualitätsmaßstab Beachtung von:

Validity (Validität, Gültigkeit)

Reliability (Reliabilität, Zuverlässigkeit)

Impact (Auswirkung; Effekt; Washback)

Practicality (Praktikabilität, Ökonomie)

Quality Management (Qualitätsmanagement)

Rüdiger Grotjahn 33

Page 34: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Cambridge English: VRIPQ

Rüdiger Grotjahn 34

Cambridge English Language Assessment (2013). Principles of good practice (S. 10)

Page 35: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validity (Validität)

Fragen (1): In wie weit ist die Interpretation der Testergebnisse gültig und gerechtfertigt? Konstruktvalidität

Rüdiger Grotjahn 35

Page 36: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

21.7.2004 Rüdiger Grotjahn 36

Validity (Validität)

Konstruktvalidität:

Unsere Sicht auf Lernerkompetenzen ist u.a. bestimmt durch: • Theorien kommunikativer

Kompetenz • eingesetzte Evaluationsinstrumente • Instrumententheorien:

z.B. psychometrische Testtheorien; Theorien zu Beurteilerfehlern (z.B. Strenge/Milde)

Page 37: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validity (Validität)

Fragen (2): In wie weit sind die anhand der Ergebnisse getroffenen Entscheidungen und Maßnahmen gerechtfertigt? konsequenzielle Validität

Rüdiger Grotjahn 37

Page 38: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Reliability (Reliabilität)

Fragen: • In wie weit lassen sich die Ergebnisse der

Evaluation reproduzieren? • Wie gut können wir zwischen unseren Lernern

anhand der Evaluationsergebnisse differenzieren?

Rüdiger Grotjahn 38

Page 39: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Impact (Auswirkung, Washback)

Fragen (1): • In wie weit wirkt sich die Evaluation positiv

oder negativ auf den Unterricht aus? teaching to the test Ausrichtung des Unterrichts an Testkonstrukt und Testmethode (vgl. Tsagari/Csépes 2011; Hill 2012)

Rüdiger Grotjahn 39

Page 40: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Impact (Auswirkung, Washback)

Fragen (2): • Welche gesellschaftlichen Konsequenzen

ergeben sich aus den Testergebnissen, Entscheidungen und Maßnahmen? z.B. Erhöhung oder Verringerung der Zahl der Arbeitsmigranten

Rüdiger Grotjahn 40

Page 41: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Practicality (Praktikabilität)

Fragen: • Ist die gewählte Methode der Evaluation

hinreichend praktikabel und ökonomisch? • Reichen die vorhandenen Ressourcen aus?

(z.B. Zahl der Computer; Anzahl geschulter Prüfer und Bewerter)

Rüdiger Grotjahn 41

Page 42: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Quality Management

• Qualitätsmanagement = kontinuierliche Qualitätssicherung + Qualitätskontrolle

Rüdiger Grotjahn 42

Page 43: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Quality Management

Fragen (auch im Schulkontext): • Was tun wir unseren eigenen Aussagen nach? • Tun wir wirklich das, was wir sagen? • Ist unser Tun effektiv? • Können wir unser Tun verbessern?

(Cambridge English 2013, S. 16)

Rüdiger Grotjahn 43

Page 44: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

weitere Gütekriterien

• Transparenz (GER) • Authentizität (z.B. Zertifikat B1 Deutsch) • Fairness

Rüdiger Grotjahn 44

Page 45: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Fairness

Fairness (Gerechtigkeit): • Komponente von VRIPQ • eigenes zentrales Gütekriterium (Kunnan,

2008) ethische Aspekte des Evaluierens (Abel 2010; Brown 2012)

Rüdiger Grotjahn 45

Page 46: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Fairness

Aspekte von Fairness: • keine Benachteiligung von Teilgruppen

(z.B. aufgrund der Themen der Lese- oder Hörtexte)

• angemessene Berücksichtigung von Teilnehmern mit Einschränkungen (z.B. mit Seh-/Hörproblemen; Legastheniker)

• … Validität

Rüdiger Grotjahn 46

Page 47: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Fairness

konkrete unterrichtsnahe Beispiele für mögliche Fairnessprobleme: • Benachteiligung von Testteilnehmern

aufgrund des Abstandes zur Hörquelle (Lautsprecher)

• Unterschiede in der Vertrautheit mit den Testformaten ( Transparenz)

• Verwendung von „Tabuthemen“ wie Krankheit, Tod, Drogen, Religion

Rüdiger Grotjahn 47

Page 48: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Kernaspekt von Good Practice

zentrale Fragen: • Was sind die objektiven Bedarfe (z.B.

Zulassung zu einem Studium) • Was sind die subjektiven Bedürfnisse der

Testteilnehmer • Welche Kompetenzbereiche wollen und

können wir evaluieren? Testkonstrukt

Rüdiger Grotjahn 48

Page 49: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Zum Nachdenken …

Validität/Validierung:

weitere wichtige Qualitätsaspekte?

Rüdiger Grotjahn 49

Page 50: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Kernaspekt von Good Practice

• Adäquatheit der Konstruktrepräsentation (keine Konstruktunterrepräsentation)

• Vermeidung von konstruktirrelevanter Varianz

Rüdiger Grotjahn 50

Page 51: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

zentrale Fragen (1): Adäquatheit der im Test geforderten sprachlichen Handlungsaktivitäten im Hinblick auf die relevanten zielsprachlichen Verwendungskontexte (target language use situations) Bedarfsanalysen (z.B. Deutschtest für Zuwanderer; TOEFL iBT; neues Zertifikat B1 Deutsch)

Rüdiger Grotjahn 51

Page 52: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

zentrale Fragen (2): Relevanz der zu testenden Kompetenzen (z.B. im lexikalisch-grammatikalischen Bereich) im Hinblick auf die zielsprachlichen Verwendungskontexte z.B. Adäquatheit der im Testcurriculum beschriebenen sprachlichen Mittel

Rüdiger Grotjahn 52

Page 53: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

zentrale Fragen (3): Adäquatheit der Testaufgaben im Hinblick auf das Testkonstrukt

Rüdiger Grotjahn 53

Page 54: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Konstruktunterrepräsentation ? Test misst zu eng? Beispiel 1: TestDaF „Sprechen“: tonträgergesteuertes mündliches Reagieren auf einen „Gesprächspartner“ (Variante des SOPI)

Frage: Messung hochschulrelevanten interaktiven Sprechens? Rüdiger Grotjahn 54

Page 55: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Konstruktunterrepräsentation ? Beispiel 2: ACTFL OPI: = adaptives mündliches Interview durch einen zertifizierten Prüfer Fragen: Messung alltagsnahen interaktiven Sprechens?

Rüdiger Grotjahn 55

Page 56: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Konstruktunterrepräsentation? Beispiel 3: mündliche Paarprüfung (z.B. Goethe-Institut; ÖSD; Cambridge) 3 Komponenten: • Aushandeln/Planen (z.B. Urlaub) • vorgabengesteuerte Präsentation • Fragen des Partners und des Prüfers beantworten

Rüdiger Grotjahn 56

Page 57: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

mündliche Paarprüfung

relativ breite Konstruktabdeckung! aber: Bewertungs- und Interpretationsproblem: Abhängigkeit der Leistung vom Partner (Discourse Co-Construction, Nakatsuhara 2013)

Rüdiger Grotjahn 57

Page 58: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Konstruktunterrepräsentation? Beispiel 4: TestDaF: Schriftlicher Ausdruck • eine umfangreiche Aufgabe • zwei Textsorten: Deskription, Argumentation Konstruktrepräsentation: deutlich eingeschränkt im Hinblick auf Adressaten, Textsorten, Funktionen

Rüdiger Grotjahn 58

Page 59: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Konstruktunterrepräsentation? Beispiel 5: Goethe-Zertifikat B2: Schriftlicher Ausdruck zwei unabhängige Aufgaben: a) Verfassen eines argumentativen Leserbriefs

nach Leitpunkten b) Korrigieren von Fehlern in einem formellen

Brief

Rüdiger Grotjahn 59

Page 60: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Goethe-Zertifikat B2: Schriftlicher Ausdruck Konstruktrepräsentation: deutlich eingeschränkt im Hinblick auf Adressaten, Textsorten, Funktionen

Rüdiger Grotjahn 60

Page 61: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Konstruktunterrepräsentation? Beispiel 6: Goethe/ÖSD Zertifikat B1 (2013): Modul Schreiben (Modellsatz Jugendliche) drei unabhängige Aufgaben mit unterschiedlichen Adressaten, Textsorten und kommunikativen Funktionen

Rüdiger Grotjahn 61

Page 62: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: Konstruktrepräsentation

Goethe/ÖSD Zertifikat B1: Modul Schreiben • relativ breite Konstruktrepräsentation • Auswahl und Gestaltung der Schreibaufgaben

im Zertifikat B1 entspricht eher dem aktuellen Stand der Sprachtestforschung als im Fall der (älteren) Prüfungen „TestDaF“ und „Goethe-Zertifikat B2“

Rüdiger Grotjahn 62

Page 63: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: konstruktirrelevante Varianz

Konstruktirrelevanz: • Messung von nicht-relevanten Eigenschaften • Test misst zu breit! • Unterschiede (Varianz) zwischen den

Testteilnehmern aufgrund konstruktirrelevanter Faktoren

Rüdiger Grotjahn 63

Page 64: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: konstruktirrelevante Varianz

Beispiel 1: kompetenzirrelevante Unterschiede z.B. aufgrund spezifischer Themen beim Lese- bzw. Hörverstehen: • Vorteile weiblicher Testteilnehmer bei

Kochrezepten • Vorteile männlicher Testteilnehmer bei

Fußballreportagen Fairness

Rüdiger Grotjahn 64

Page 65: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: konstruktirrelevante Varianz

Beispiel 2:

Ziel: „reine“ Messung von Hör- bzw. Leseverstehenskompetenzen in DaF

Aufgabenformat: Schreiben einer deutschen Zusammenfassung des Textes konstruktirrelevante Varianz aufgrund von

Unterschieden in der zielsprachlichen Schreibkompetenz Ausweg: Zusammenfassung in der Muttersprache oder

anderes Aufgabenformat (z.B. Kurzantworten auf Fragen zum Text)

Rüdiger Grotjahn 65

Page 66: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: konstruktirrelevante Varianz

Folgen konstruktirrelevanter Varianz: Konfundierung = verunreinigte Messung; “muddied measurement” (Weir 2005)

Konsequenz: Interpretationsproblem vor allem bei niedrigen Testwerten!

Rüdiger Grotjahn 66

Page 67: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: konstruktirrelevante Varianz

Konfundierung Beispiel: Testung des Leseverstehens in DaF mit Hilfe einer schriftlichen deutschen Zusammenfassung niedriger Testwert: Indikator für: • geringe Lesekompetenz? • geringe Schreibkompetenz? • geringe Lese- + Schreibkompetenz?

Rüdiger Grotjahn 67

Page 68: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: integrative vs. isolierte Testung

Folgerungen für die Praxis: • Integrative Testung von Kompetenzen zur

Erhöhung der Authentizität der Evaluation • zusätzliche isolierte Testung der

Einzelkompetenzen Erhöhung des diagnostischen Wertes der integrativen Testung

Rüdiger Grotjahn 68

Page 69: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Validität/Validierung: integrative vs. isolierte Testung

Beispiel: TOEFL iBT • Verfassen eines englischen Textes auf der

Basis der Informationen in einem englischen Hördokument

• zusätzliche isolierte Testung der Hör- und Schreibkompetenz

Rüdiger Grotjahn 69

Page 70: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Zum Nachdenken …

In wie weit sind die Qualitätskriterien für formelle Tests übertragbar auf das

unterrichtsnahe (formative) Testen und Evaluieren

Rüdiger Grotjahn 70

Page 71: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Unterrichtsnahes Evaluieren: Qualitätskriterien

Qualitätskriterien formeller Tests: • prinzipiell übertragbar • andere Gewichtung (in Abhängigkeit von

Kontext und Funktion)

Rüdiger Grotjahn 71

Page 72: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Unterrichtsnahes Evaluieren: Qualitätskriterien

Beispiel: formative, low-stakes Evaluation mit dem Ziel der Diagnose und Rückmeldung spezifischer Stärken und Schwächen • Priorisierung von Validität, Praktikabilität und

positiven Washback • eher geringer Fokus auf Reliabilität

Rüdiger Grotjahn 72

Page 73: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Unterrichtsnahes Evaluieren: Qualitätskriterien

Begründung für Marginalisierung der Reliabilität: • keine Rangordnung der Lernenden intendiert • im Gegensatz zu Deutschprüfungen wie

Goethe Zertifikate, ÖSD oder TestDaF: im Unterrichtskontext in der Regel mehrfache Testung des gleichen Merkmals möglich ( Erhöhung der Messgenauigkeit)

Rüdiger Grotjahn 73

Page 74: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

positive Rückwirkung (Washback) als Qualitätskriterium Auswahl aus einer Checkliste von Leitlinien (vgl. Grotjahn 2009; Grotjahn/Kleppin 2014)

potentiell positiver Backwash: Möglichst viele der folgenden Leitlinien beachten!

Rüdiger Grotjahn 74

Page 75: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 75

Überprüfen Sie die Kompetenzen, die Sie in Ihrem

Unterricht fördern möchten, möglichst breit! Setzen Sie z.B. zur Förderung mündlicher

Kompetenzen neben schriftlichen Prüfungen auch (aufwändigere) mündliche Prüfungen ein!

Page 76: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 76

Setzen Sie in Ihren Prüfungen möglichst realistische Anforderungen, damit Ihre Lernenden nicht

demotiviert werden!

Page 77: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 77

Nutzen Sie eine Vielzahl von möglichen Aufgaben- und Prüfungsformaten, um auch den individuellen

Unterschieden zwischen Ihren Lernenden gerecht zu werden!

Page 78: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 78

Setzen Sie auch formative Verfahren ein, damit die Lernenden ihren Lernprozess und Lernfortschritt

verfolgen und reflektieren können!

Page 79: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 79

Machen Sie die Kriterien, die Sie bei der Evaluation produktiver Kompetenzen verwenden, für die

Lernenden transparent!

Page 80: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 80

Formulieren Sie Ihre Rückmeldungen zu Prüfungsergebnissen so transparent und informativ, dass die Lernenden auch im Hinblick auf ihr weiteres

Lernen profitieren!

Page 81: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Optimierung der Rückwirkungen von Prüfungen im Unterrichtskontext

Rüdiger Grotjahn 81

Regen Sie ihre Lernenden zur Selbst- und Peer-Evaluation an, damit diese in Zukunft ihr Lernen

besser reflektieren und steuern können!

Page 82: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Danke für Ihre Interesse!

Rüdiger Grotjahn 82

Page 83: Testen, Prüfen und Evaluieren: Aspekte der Qualitätssicherung · 1. Funktionen/Ziele von Evaluationen 2. Typen von Evaluation 3. Qualitätsstandards: a) Berufsvereinigungen, b)

Fragen ?

Rüdiger Grotjahn 83