Evaluation
Evaluation oder Evaluierung, aus lateinisch valere „stark, wert sein“, bedeutet sach- und fachgerechte Untersuchung und Bewertung.[1][2]
Dieser Artikel wurde im Portal Wissenschaft zur Verbesserung eingetragen. Hilf mit, ihn zu bearbeiten, und beteilige dich an der Diskussion! |
Überblick
Unter Evaluation wird meist die Bewertung bzw. Begutachtung von Projekten, Prozessen und Funktionseinheiten (z. B. von Geräten, Objekten) sowie: Organisationseinheiten verstanden. Dabei können Kontext, Struktur, Prozess, Aufwand und Ergebnis einbezogen werden. Im Allgemeinen lässt sich als Evaluation auch die grundsätzliche Untersuchung begreifen, ob und inwieweit etwas geeignet erscheint, einen angestrebten Zweck zu erfüllen. Im Sprachgebrauch werden auch Evaluation, Untersuchung und Analyse gleichbedeutend im Sinne einer Bestandsaufnahme ohne besondere Zweckorientierung gebraucht.
Anwendungsbereiche der Evaluation sind etwa Bildung, Soziale Arbeit, Verwaltung, Wirtschaft oder Politikberatung. Für eine Evaluation werden Daten methodisch erhoben und systematisch dokumentiert, um die Untersuchung, das Vorgehen und die Ergebnisse nachvollziehbar und überprüfbar zu machen. Standardverfahren zur internen und externen Datenerfassung sind Befragung, Beobachtung, Monitoring, Test, Fragebogen, und Materialanalyse. Die Bewertung erfolgt durch den Vergleich der ermittelten Ist-Werte mit vorher explizit festgelegten, operationalisierten und begründeten Soll-Werten anhand festgelegter Indikatoren. Evaluation muss bestimmte „Gütekriterien“ erfüllen: neben den Grundvoraussetzungen Nützlichkeit und Objektivität sind dies Reliabilität, Validität, Ökonomie und Normierung.
Evaluation dient der rückblickenden Wirkungskontrolle, der vorausschauenden Steuerung und dem Verständnis von Situationen und Prozessen. Anhand der Evaluationsdaten können untersuchte Prozesse angepasst und optimiert werden.[3] Abhängig vom Einsatzzeitpunkt werden folgende Arten von Evaluation unterschieden:[4]
- Antizipatorische oder prospektive Evaluation
- Diese findet vor einer Maßnahme statt.
- Formative Evaluation
- Die formative oder prozessbegleitende Evaluation wird während einer Maßnahme durchgeführt. Die Maßnahme wird in regelmäßigen Abständen untersucht und Zwischenresultate erhoben, um sie bestmöglich durchzuführen und bei Fehlentwicklungen anzupassen. Diese neuen Maßnahmen können wiederum evaluiert werden. Zusätzlich besteht im Rahmen der formativen Evaluation die Möglichkeit subjektive Eindrücke von Betroffenen zu erhalten (ohne retrospektive Verzerrungen).
- Summative Evaluation
- Als summative Evaluation wird eine ergebnisbewertende, also nach dem Abschluss einer Maßnahme stattfindende, Evaluation bezeichnet. Dies ermöglicht, die Wirksamkeit einer Maßnahme zusammenfassend zu bewerten. Das kann sich auf Konzeption, Durchführung, Wirksamkeit und Effizienz beziehen.
Mit der Forschung verbindet Evaluation das Bemühen um empirische Überprüfbarkeit, allerdings untersucht sie konkrete Einzelfälle und ist praxisorientiert.
Wortherkunft
Das Wort Evaluation (Bewertung, Auswertung) wurde zuerst im 19. Jahrhundert im Französischen verwendet, mit Beginn des 20. Jahrhunderts auch im Englischen. In den USA ist es im modernen Verständnis seit den 1930er Jahren gebräuchlich (seit der Eight-Years-Study 1933–1941 von Ralph W. Tyler u. a.).[5] Tylers verhaltensorientiertes Konzept wurde nach dem Sputnikschock 1957 in der danach einsetzenden Bildungsreform kritisiert und verändert. In Deutschland wurde das englische Wort Evaluation Ende der 1960er Jahre aus dieser amerikanischen Tradition übernommen; wichtig dafür wurde eine von Christoph Wulf herausgegebene Sammlung von Übersetzungen englischsprachiger Publikationen v. a. im Kontext der Curriculumsforschung.[6] Die Wortbedeutung „Bewertung“ wurde dabei zunächst verengt auf die Bewertung insbesondere der Arbeit von Bildungsinstitutionen (die Curriculum-Entwicklung seit den 1930er-Jahren). Inzwischen wird, wie in den USA seit langer Zeit, auch in anderen sozialen Handlungsbereichen in Deutschland „evaluiert“.
Abgrenzung
Professionell durchgeführte Evaluationen unterscheiden sich nach Balzer durch folgende Kriterien von alltäglicher Bewertung:[7]
- auf klar definierten Gegenstand bezogen
- von Experten durchgeführt
- Bewertung anhand präzise festgelegter und offengelegter Kriterien (Evaluations‐/Bewertungskriterien)
- Informationsgewinnung durch empirische Datenerhebung
- Systematische Informationsbewertung anhand bestimmter Regeln
Balzer unterscheidet: „Evaluation ist ein Prozess, … bei dem nach zuvor festgelegten Zielen und explizit auf den Sachverhalt bezogenen und begründeten Kriterien ein Evaluationsgegenstand bewertet wird. Dies geschieht unter Zuhilfenahme sozialwissenschaftlicher Methoden durch Personen, welche hierfür besonders qualifiziert sind. Das Produkt eines Evaluationsprozesses besteht in der Rückmeldung verwertbarer Ergebnisse in Form von Beschreibungen, begründeten Interpretationen und Empfehlungen an möglichst viele Beteiligte und Betroffene, um den Evaluationsgegenstand zu optimieren und zukünftiges Handeln zu unterstützen.“[7]
Die Beurteilung von Personen oder Institutionen, die mit (oftmals negativen) Sanktionen verbunden ist, ist zu unterscheiden von der Beurteilung von Maßnahmen, die auf ihre Wirksamkeit hin untersucht werden und als Evaluation im eigentlichen Sinne bezeichnet werden können. Auf der Basis einer Zielvereinbarung wird eine Ausgangserhebung durchgeführt, es werden daraufhin Maßnahmen geplant, mit denen die Ziele erreicht werden sollen. Dann müssen Messinstrumente / Beurteilungskriterien entwickelt werden, mit denen man überprüfen kann, ob die Maßnahmen zum Erfolg geführt haben. Eventuell nach Zwischenerhebungen während der Durchführung wird in einer Schlusserhebung der Erfolg der Maßnahme überprüft, um daraus neue Zielvereinbarungen zu treffen und erneut in den Kreislauf einzutreten. Betroffene sollen zu Beteiligten werden, so dass der Prozess konsensual verläuft und nicht durch fremde Interessen und unklare Kriterien bestimmt wird.
Modelle
Es gibt im Wesentlichen drei verschiedene Richtungen in der Evaluation:[8]
Methodenorientiert
- Objectives-Oriented Evaluation (Ralph W. Tyler)
- The methodological View (Donald T. Campbell)
- Evaluative Research (E. A. Suchman)
- Causal Generalization (T. Cook)
- Theory Driven Evaluation (H.-T. Chen)
- Evaluation as Art (L. J. Cronbach)
Nutzenorientiert
- CIPP Model (D. L. Stufflebeam)
- Evaluation Research, Political Context & Enlightment (C. H. Weiss)
- Utilization-focused Evaluation (M. Q. Patton)
- The Four Levels (Donald Kirkpatrick)
- Empowerment Evaluation (D. Fettermann)
Bewertungsorientiert
- Valuing (M. Scriven)
- Responsive Evaluation (R. E. Stake)
- 4th Generation – Constructivist Evaluation (Guba & Lincoln)
- Adversery Evaluation (Owens & Wolf)
- Connoisseurship Model (E. W. Eisner)
Methoden
Bortz & Döring unterscheiden drei Typen von Methoden:[9]
Populationsbeschreibend
Sie „ermöglichen eine Abschätzung der Verbreitung und der Hintergründe eines Sachverhaltes und erleichtern die Definition der Zielpopulation.“
Explorativ
Sie „dienen der Erkundung von Interventionsprozessen und deren Wirkungen. Sie zielen auf die Formulierung bzw. Konkretisierung von Wirkhypothesen ab und tragen dazu bei, die relevanten Variablen zu identifizieren und zu operationalisieren.“
Hypothesenprüfend
Sie „testen den Einfluss der untersuchten Intervention auf sinnvoll operationalisierte Wirkkriterien.“[10]
Methoden zur Datengewinnung und Datenverarbeitung sind:
- Beobachtung
- Monitoring
- Experiment
- Fallstudie
- Fragebogen
- Interview
- Klinische Studie
- Qualitative Forschung (Qualitative Methoden)
- Quantitative Forschung (Quantitative Methoden)
- Statistische Methoden
- Wirkungsanalyse
Standards
Andreas Gruschka formuliert 1976 anlässlich eines Kollegstufenversuchs in Nordrhein-Westfalen, was seither in die Handbücher Eingang gefunden hat: „Gütekriterien der Evaluation sind nicht mehr primär Validität, Reliabilität und Objektivität, sondern Kommunikation, Intervention, Transparenz und Relevanz.“[11]
Die Deutsche Gesellschaft für Evaluation hat Evaluationsstandards erarbeitet, die eine objektive Vergleichbarkeit von Evaluationsergebnissen gewährleisten und Konflikten vorbeugen soll. Sie unterscheidet dabei vier Standards, die jeweils durch Richtlinien präzisiert werden. Nützlichkeitsstandards sollen sicherstellen, dass sich die Evaluationen an den geklärten Zielen und am Informationsbedarf der vorgesehenen Nutzer ausrichten.[12] Die Regeln der Durchführbarkeitsstandards dienen dazu, Schaden vom Evaluationsgegenstand abzuwenden und dadurch Belastungen der Beteiligten zu reduzieren, und schließlich dem Kosten-Nutzen-Verhältnis der Evaluation ein ausgewogenes Maß zukommen zu lassen.[13] Sie sollen somit eine gut geplante, realistische, diplomatische und kostenbewusste Ausführung einer Evaluation gewährleisten.[12] Die Standards der Fairness sollen gewährleisten, dass der Umgang zwischen den beteiligten Personen fair und respektvoll abläuft.[12] Die Aufgabe von Genauigkeitsstandards ist sicherzustellen, dass Evaluationen fachlich angebrachte Informationen über die Güte und die Möglichkeit der Verwendung des evaluierten Programms hervorbringen und übermitteln.[14]
Bereiche
Wichtige Anwendungsbereiche sind z. B.[15]
Qualitätsmanagement
Evaluation hat im Qualitätsmanagement (TQM, ISO 9000, 2Q, Q2E) schon lange einen festen Platz. Im EFQM-Modell wird Evaluation z. B. gefordert, um die Ergebnisse (der Arbeit) bei Kunden, Mitarbeitern und der Gesellschaft zu erfassen. Evaluation fungiert hier als Rückkopplungselement für die Prozesssteuerung im Rahmen der Organisations- und Qualitätsentwicklung. Es wird dabei überprüft, ob die Interventionen auch tatsächlich die gewünschten Ergebnisse bzw. Wirkungen produzieren (Ursache-Wirkungs-Beziehung). Erfasst werden sowohl subjektive Daten über die Wahrnehmung der Betroffenen, also der Mitarbeiter und Kunden, als auch objektive Leistungsindikatoren, die intern im Unternehmen erfasst werden können.
Neben der Evaluation der Ergebnisse fordert das EFQM-Modell auch die direkte Evaluation der Abläufe, Interventionen und Maßnahmen in den Bereichen Führung, Strategie und Personal. Hier kommt die Methode der Selbstevaluation zur Anwendung, um die Prozesse zu bewerten und schließlich zu verbessern. Die Führungskräfte und Mitarbeiter des Unternehmens evaluieren sich, ihre Teams und ihre Organisation selbst anhand vorgegebener Kriterien. Sie nutzen dazu eigens für das Qualitätsmanagement (QM) entwickelte, möglichst objektive, verlässliche und valide Instrumente und Methoden. Auf Basis der gewonnenen Daten, Einschätzungen und Belege werden Handlungsempfehlungen und Veränderungsmaßnahmen abgeleitet.
Sowohl die Selbst- als auch Fremd-Evaluationen können durch Benchmarking ergänzt und damit aussagekräftiger gemacht werden. Als Benchmarks dienen Daten aus anderen vergleichbaren Organisationen. Sie liefern Maßstäbe für die Bewertung und die Interpretation der eigenen Werte und damit der eigenen Situation. Im Idealfall kann auch die konkrete Kontaktaufnahme mit den Besten der Branche ein gemeinsames Lernen ermöglichen.
Neben diesen rein internen Evaluationen werden zu Zertifizierungszwecken auch externe Evaluationen gefordert: externe unabhängige Auditoren evaluieren die Organisation anhand derselben Kriterien und geben ihre Bewertung ab. Die traditionellen Ansätze von EFQM oder ISO9000 beruhen meist auf sehr linearen Ursache-Wirkungsmodellen. Beispiele für andere Herangehensweisen sind zum Beispiel die kybernetischen Ansätze von Fredmund Malik.
Bildung
Als pädagogischer bzw. andragogischer Fachbegriff bedeutet Evaluation „das methodische Erfassen und das begründete Bewerten von Prozessen und Ergebnissen zum besseren Verstehen und Gestalten einer Praxis-Maßnahme im Bildungsbereich durch Wirkungskontrolle, Steuerung und Reflexion.“[16] Gegenstand von Evaluation können Prozesse und Ergebnisse aus dem Bereich der Mikrodidaktik sowie der Makrodidaktik sein. Des Weiteren können gesamte Programme evaluiert werden.
Umwelt
Der Umweltschutz gehört bisher weder in den USA noch in Europa zu den zentralen Anwendungsgebieten der Evaluation. Sozialwissenschaftliche Studien zur Evaluation von Umweltproblemen sind abgesehen von einigen Ausnahmen vor allem im Bereich des Energieverbrauchs, des Lärmschutzes und der Abfallproduktion selbst im Rahmen größerer politischer Programme eher selten.
Eine Ursache ist sicherlich in der vergleichsweise geringen Anerkennung der Sozialwissenschaften als kompetente Ansprechpartner in Umweltfragen zu sehen, was sich erst angesichts mangelnder Erfolge von Maßnahmen zur Steigerung des Umweltbewusstseins in den neunziger Jahren grundlegend verändert hat. Nachdem die Formel Umweltaufklärung schafft Umweltbewusstsein und Umweltbewusstsein führt zu einem entsprechenden Verhalten durch eine Vielzahl sozialwissenschaftlicher Studien widerlegt und auf die Bedeutung sozialer Faktoren für das umweltrelevante Individualverhalten hingewiesen wurde, begann sich die Umweltdiskussion auch für sozialwissenschaftliche Fragestellungen zu öffnen und verabschiedete sich zunehmend von der Auffassung, dass Umweltprobleme rein durch technische Lösungen zu bewältigen seien.
Gegenwärtig ist die Nachfrage nach Umweltevaluationen sehr stark durch öffentliche Auftraggeber bestimmt. Die Aufträge beziehen sich vorrangig auf die Bewertung politischer Programme oder einzelner Projekte. Insbesondere bei internationalen Organisationen sind dabei Tendenzen zur Entwicklung von Qualitätsanforderungen, die eine Einführung von Umweltevaluationen als Regelverfahren bei der Durchführung politischer Verfahren vorbereiten sollen, zu erkennen. In Deutschland sind auf Bundes- und Landesebene bei den politischen Instanzen bisher bestenfalls erste Ansätze in dieser Richtung wahrzunehmen. Durch den großen Stellenwert von Evaluationen bei der Stadt- und Raumplanung ist eine Etablierung von sozialwissenschaftlichen Umweltevaluationen durch Einbindung in bestehende, eher technisch orientierte (Planungs-)Verfahren wie z. B. die Umweltverträglichkeitsprüfung sogar eher auf regionaler und kommunaler Ebene zu erwarten. Die private Nachfrage nach Umweltevaluationen sowohl durch Unternehmen als auch durch Verbände und zivilgesellschaftliche Organisationen ist dagegen noch sehr gering. Trotz der Entwicklung von Umweltmanagementsystemen (z. B. EMAS) ist eine Einbindung der Erkenntnisse der sozialwissenschaftlichen Evaluation in die Qualitätsmanagementsysteme der Betriebe bisher nicht gelungen.
Auf der Angebotsseite dominieren zumindest teilweise staatlich finanzierte Forschungsinstitute den Markt. Institute, die sich ausschließlich auf die Durchführung von Umweltevaluationen spezialisiert haben, gibt es dabei jedoch nicht. Am weitesten geht hier die Entwicklung beim Centrum für Evaluation der Universität des Saarlandes und dem Centre for Sustainable Management (CSM) der Universität Lüneburg.
Auch bei den privaten Consultings haben nur wenige den Schwerpunkt ihrer Tätigkeiten auf sozialwissenschaftliche Umweltevaluationen gelegt. Hier sind als Beispiele das Institut für sozial-ökologische Forschung (ISOE) und das Institut für ökologische Wirtschaftsforschung (IÖW) zu erwähnen. Darüber hinaus haben auch eingeführte Umweltwissenschaftliche Institute wie das Wuppertal-Institut, das Öko-Institut in Freiburg oder das IFEU-Institut in Heidelberg ihr Angebot in Richtung sozialwissenschaftlicher Forschungsarbeiten erweitert, ohne hierin jedoch ein primäres Geschäftsfeld zu sehen und entsprechende Aufbauarbeiten zu leisten. Angesichts der steigenden Anforderungen, die sich durch das Leitbild der „nachhaltigen Entwicklung“ für die Einführung entsprechender Maßnahmen ergeben, ist allerdings trotz der schwierigen Ausgangslage auch im Umweltbereich eine expansive Entwicklung des Evaluationsmarktes und eine fortschreitende Professionalisierung des Angebots zu erwarten.
Internationale Entwicklungszusammenarbeit
Evaluationen in der Entwicklungszusammenarbeit haben bereits eine lange Tradition. Der Schwerpunkt liegt dabei auf Evaluationen von Projekten und Programmen.
Die ausgeprägte Evaluationskultur innerhalb der Entwicklungszusammenarbeit ist vor allem darin begründet, dass die im Rahmen von Projekten und Programmen eingesetzten Mittel stets gegenüber den Geldgebern gerechtfertigt werden mussten und müssen.
Evaluationsansätze in der Entwicklungszusammenarbeit werden darüber hinaus stark durch internationale Abmachungen, insbesondere der Millenniumserklärung und der Pariser Erklärung geformt. Die sog. „Harmonisierung“ als durchgängiges Prinzip der Entwicklungszusammenarbeit schlägt sich beispielsweise in der Forderung nach Gemeinschaftsevaluierungen der Akteure nieder. In Deutschland haben sich staatliche Organisationen der „Entwicklungszusammenarbeit aus einem Guss“ verpflichtet und streben auch bei Evaluationen ein einheitliches Vorgehen an. Partnerländer übernehmen zunehmend die Rollen des Auftraggebers und des Durchführenden von Evaluation.
Was die Evaluationsgegenstände betrifft, so verlagert sich der Fokus immer mehr von der Output-Evaluation als Leistungsnachweis hin zu Evaluation der Wirkungen (Outcomes und Impacts) von Projekten und Programmen auf dem Gebiet der Entwicklungszusammenarbeit. Man arbeitet mit Wirkungsketten und ausgefeilten Evaluationsdesigns, wie z. B. der Logical Framework Matrix („Logframe“).
Traditionelle Evaluationskonzepte- und methoden, die auf linearen Kausalitätsmodellen beruhen, werden jedoch zunehmend hinterfragt und durch kybernetische Ansätze ergänzt oder gar verdrängt. Eine ähnliche Entwicklung, wie sie derzeit auch im Bereich der Organisationsentwicklung und -evaluation stattfindet. Neben der Suche nach innovativen (Selbst-)Evaluationsmethoden (z. B. Lernhelix) erscheint die (Weiter-)Entwicklung wissenschaftlich fundierter Konzepte als Grundlagen für Evaluation – wie z. B. das Dienstleistungsqualitäts- oder das Lebensqualitätskonzept – als besonders wichtig. Im Vergleich zu anderen Branchen, wie z. B. dem Bildungs- oder dem Gesundheits- und Sozialwesen, findet in der Entwicklungszusammenarbeit vergleichsweise wenig wissenschaftliches Knowhow („evidence base“) Eingang in die Evaluation.
Organisationen
Im internationalen Bereich haben Organisationen wie die UN, EU, OECD, der IWF, die GIZ usw. eigene Evaluations-Abteilungen, welche jeweils neben der Bearbeitung konkreter Fragestellungen auch allgemeine Standards und Methoden sammeln, entwickeln und aufbereiten.
Im deutschsprachigen Raum gibt es die Deutsche Gesellschaft für Evaluation, DeGeVal. Sie hat zahlreiche methodische und sektorale Arbeitskreise und gibt Standards, Empfehlungen und Handreichungen zur Planung und Durchführung von Evaluationen heraus. Ihre Mitglieder stammen überwiegend aus Deutschland und Österreich. Daneben sind Forschungsorganisationen wie das Centrum für Evaluation im Saarland oder die proEval in Österreich an der Professionalisierung des Themas Evaluation beteiligt.
Siehe auch
- Evaluation in der Kriminalprävention
- Bewertung – Begriffsklärungsseite (BKS)
Literatur
- Deutsche Gesellschaft für Evaluation e.V. (Hrsg.): Standards für Evaluationen. Redaktion: Dr. Wolfgang Beywl, Zimmermann-Medien, Köln 2002, ISBN 3-00-009022-3.
- Lars Balzer: Wie werden Evaluationsprojekte erfolgreich? – Ein integrierender theoretischer Ansatz und eine empirische Studie zum Evaluationsprozess. Verlag Empirische Pädagogik, Landau 2005, ISBN 3-937333-24-X.
- Wolfgang Beywl: Zur Weiterentwicklung der Evaluationsmethodologie. Grundlegung, Konzeption und Anwendung eines Modells der responsiven Evaluation. Peter Lang, Frankfurt am Main 1984.
- Nicola Döring, Jürgen Bortz: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. / unter Mitarbeit von Sandra Pöschl. 5. vollst. überarb., aktualis. und erw. Aufl., Springer, Berlin [2016], ISBN 978-3-642-41088-8.
- H. Kromrey: Evaluation – ein vielschichtiges Konzept. Begriff und Methodik von Evaluierung und Evaluationsforschung. Empfehlungen für die Praxis. Sozialwissenschaften und Berufspraxis 24 (2001), 105–129.
- Hans Merkens (Hrsg.): Evaluation in der Erziehungswissenschaft. Schriftenreihe der DGFE, VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH, Wiesbaden 2004, ISBN 3-531-14470-7.
- M. Ruep, G. Keller: Schulevaluation. Frankfurt am Main 2007.
- James R. Sanders: Handbuch der Evaluationsstandards. Die Standards des „Joint Committee on Standards for Educational Evaluation“, Übersetzt von W. Beywl und T. Widmer, 3. Auflage, Wiesbaden 2006.
- Reinhard Stockmann (Hrsg.): Handbuch zur Evaluation. Eine praktische Handlungsanleitung. Waxmann, Münster u. a. 2007.
- H. Wottawa, H. Thierau: Lehrbuch Evaluation. 2. Auflage. Hans Huber, Bern 1998.
- H. Wottawa: Evaluation. In: A. Krapp, B. Weidenmann (Hrsg.): Pädagogische Psychologie. Beltz, Weinheim 2001, S. 649–674.
Weblinks
- Centrum für Evaluation (CEval) der Universität des Saarlandes
- Web-basierte Evaluation von realen Anwendungen, Forschungsgruppe Human-Computer Interaction und Visual Analytics der Hochschule Darmstadt
- Gesellschaft für Evaluation (DeGEval)
- Eval-Wiki: Glossar der Evaluation, hrsg. Univation, Institut für Evaluation
- Jan Hense: Wörterbuch Evaluation, LMU München; 2010
- Christine Schwarz: Evaluation als modernes Ritual (PDF-Datei; 166 kB), Vortrag, Heinrich-Böll-Stiftung, Berlin; 2004
- en:Monitoring and Evaluation
Einzelnachweise
- Evaluation – Duden, Bibliographisches Institut; 2017
- Lars Balzer, Andreas Frey, Peter Nenniger: Was ist und wie funktioniert Evaluation? Empirische Pädagogik, Zeitschrift zu Theorie und Praxis erziehungswissenschaftlicher Forschung (1999), 13 (4), 393–413
- K. Götz: Zur Evaluierung beruflicher Weiterbildung. Deutscher Studienverlag, Weinheim; 1993
- Markus Pospeschill: Empirische Methoden in der Psychologie. Band 4010. UTB, München 2013, ISBN 978-3-8252-4010-3.
- Vgl. Craig Kridel, Robert V. Bullough: Stories of the Eight-Year Study. State University of New York Press, New York 2007; Peter Hlebowitsh: Ralph W. Tyler (1902–1994). Contribution to Testing and Curriculum Development, Advisory Role, in: Education Encyclopedia, StateUniversity.com.
- Christoph Wulf (Hrsg.): Evaluation. Beschreibung und Bewertung von Unterricht, Curricula und Schulversuchen. Erziehung in Wissenschaft und Praxis 18, Piper, München 1972 (Inhaltsverzeichnis).
- L. Balzer: Wie werden Evaluationsprojekte erfolgreich? – Ein integrierender theoretischer Ansatz und eine empirische Studie zum Evaluationsprozess. Verlag Empirische Pädagogik, Landau 2005.
- Marvin C. Alkin, Christina A. Christie: An Evaluation Theory Tree. In: Marvin C. Alkin (Hrsg.): Evaluation Roots. Tracing Theorists’ Views and Influences. Thousand Oaks: Sage 2004, S. 12–65.
- J. Bortz, N. Döring: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 3., überarb. Aufl., Nachdruck, Springer, Berlin 2005, ISBN 3-540-41940-3, S. ?.
- J. Bortz, N. Döring: Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler. 3., überarb. Aufl., Nachdruck, Springer, Berlin 2005, ISBN 3-540-41940-3, S. 118.
- Andreas Gruschka (Hrsg.): Ein Schulversuch wird überprüft. Das Evaluationsdesign für Kollegstufe NW als Konzept handlungsorientierter Begleitforschung, Kronberg 1976, S. 142–151; vielfach zitiert oder reformuliert, z. B. bei Bortz & Döring 2006 oder Reinhard Stockmann: Evaluation in Deutschland. In: Ders. (Hrsg.): Evaluationsforschung: Grundlagen und ausgewählte Forschungsfelder, Waxmann, Münster 3. A. 2006, S. 15–46, hier S. 23.
- Vgl. Deutsche Gesellschaft für Evaluation e.V. (Hrsg.): Standards für Evaluationen. Redaktion: Dr. Wolfgang Beywl, Zimmermann-Medien, Köln 2002, ISBN 3-00-009022-3, S. 8 f.
- Vgl. Hans Merkens (Hrsg.): Evaluation in der Erziehungswissenschaft. Schriftenreihe der DGFE, VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH, Wiesbaden 2004, ISBN 3-531-14470-7, S. 29.
- Vgl. James R. Sanders: Handbuch der Evaluationsstandards. Die Standards des „Joint Committee on Standards for Educational Evaluation“. Übersetzt von W. Beywl und T. Widmer, 3. Auflage, Wiesbaden 2006, S. 155.
- Einen umfassenden Überblick zum deutschsprachigen Raum geben: Widmer, Thomas/Beywl, Wolfgang/Fabian, Carlo (Hrsg.) (2009): Evaluation. Ein systematisches Handbuch. Wiesbaden: VS Verlag.
- Jost Reischmann: Weiterbildungs-Evaluation. Lernerfolge messbar machen, Grundlagen der Weiterbildung Arbeitshilfen, Luchterhand, Neuwied 2003, S. 18; Augsburg 2. A. 2006.