Eignungstest für das Medizinstudium

Logo

Der Eignungstest für das Medizinstudium (EMS) ist ein fachspezifischer Studierfähigkeitstest zur Erfassung der Studieneignung für ein Medizinstudium. Ausrichter des EMS ist das Zentrum für Testentwicklung und Diagnostik (ZTD) an der Universität Freiburg/Schweiz, es besteht eine enge Zusammenarbeit mit dem Entwickler des Tests für medizinische Studiengänge (TMS) in Deutschland, der ITB Consulting GmbH in Bonn, von dem der EMS eine Weiterentwicklung darstellt. Von 1998 bis 2006 war und ab 2013 ist wieder der Name "Eignungstest für das Medizinstudium in der Schweiz" bzw. Test d’aptitudes pour les études de médecine en Suisse (französisch) und Test attitudinale per lo studio di medicina in Svizzera (italienisch). Als Abkürzung für beide letztgenannten wird AMS verwendet.

Inhaltsverzeichnis

Einsatz in der Schweiz

Der EMS wird in der Schweiz im Rahmen von universitären Auswahlverfahren als Zulassungskriterium für ein Medizinstudium verwendet. Für Humanmedizin (seit 1998) und Chiropraktik (seit 2008), Veterinärmedizin (seit 1999) und Zahnmedizin (seit 2004) ist ein Numerus clausus (NC) für Personen notwendig, die sich an den Universitäten Basel, Bern, Freiburg oder Zürich angemeldet haben. Seit 2001 steigen dort die Anmeldezahlen einem linearen Trend folgend an, sodass die Kriterien für eine Notwendigkeit von NC und EMS auch in absehbarer Zeit bestehen bleiben.

Der Test kommt seit 1998 in der Schweiz (10 Testorte, dezentrale Durchführung) zur Anwendung und findet Anfang Juli statt[1]. In der Schweiz wird ein Numerus clausus (NC) und damit der Test bei Notwendigkeit (20 % Kapazitätsüberschreitung bei den Anmeldungen Mitte Februar, keine Umleitungsmöglichkeiten zwischen den Universitäten) durchgeführt. Die Empfehlung an die Kantone erfolgt durch die Schweizerische Universitätskonferenz Anfang März jeden Jahres. Die Einführung des NC unterliegt dann dem jeweiligen kantonalen Recht und wird je nach Rechtslage durch Regierung oder Parlament beschlossen.

2010 bis zunächst 2012 wird der EMS auch obligatorisch aber nichtselektiv an der Universität Genf eingesetzt. Man erwartet, dass aufgrund einer Rückmeldung über die Reihung im Eignungstest die Personen ihre Chancen auf einen erfolgreichen Studienverlauf besser einschätzen und Schlussfolgerungen daraus ziehen - bis zum Bewerbungsverzicht. In Genf bestehen ca. 50 % der Bewerber nach dem ersten Jahr eine Prüfung nicht. Diese dient allerdings auch dazu, die Studierendenzahl den Ausbildungskapazitäten anzupassen, damit die Studienqualität annähernd gewährleistet bleibt (sogenannte inneruniversitäre Selektion als „versteckter“ NC).[2] Die dissuasive (abschreckende) Wirkung als Bewerbungsverzicht bei relativ geringerer Studierfähigkeit ist sehr moderat, auch das Anbebot eines Beratungsgespräches für die 30 % (in 2012 40 %) Testschlechtesten wurde kaum in Anspruch genommen. Dennoch "funktioniert" der EMS auch unter diesen Bedingungen: Die Vorhersagekorrelationen für Prüfungserfolg liegen um 0.50. [3]

Einsatz in Österreich

Von 2006 bis 2012 wurde der Test auch an den Medizinischen Universitäten Innsbruck und Wien eingesetzt. Es kam die jeweils gleiche Testversion wie in der Schweiz am gleichen Tag zum Einsatz, Bereitstellung und Auswertung erfolgten durch die Schweizer Seite auf Lizenzbasis. Die Schweizer Seite hat diese Zusammenarbeit ab dem Jahr 2013 aufgekündigt[4].

Österreich musste nach einem Urteil des Europäischen Gerichtshofs im Juli 2005 seine Hochschulen für Bewerber aus anderen EU-Staaten öffnen. Zuvor wurde in Österreich ein Studienplatz im Herkunftsland verlangt, um einen Zugang zu österreichischen Universität zu erhalten (Herkunftslandprinzip). Da eine massive Überlastung der österreichischen Universitäten durch deutsche Studenten befürchtet wurde, erhielten die Universitäten daraufhin die Möglichkeit, in acht Studienfächern, darunter Medizin, ihre künftigen Studenten auszuwählen. Eine besondere Rolle spielt dabei ein Quotensystem, wonach 75 % der Studienplätze Bewerbern mit österreichischem Reifeprüfungszeugnis oder gleichgestellten Staatsangehörigen (Südtiroler, Luxemburger, Liechtensteiner) vorbehalten sind. 20 % sind für Personen reserviert, die ihr Reifezeugnis innerhalb der EU abgelegt haben, 5 % für solche, die dies außerhalb der EU taten.

In Österreich besitzen die Universitäten Autonomie in Bezug auf die Wahl der Auswahlverfahren. Im Jahr 2006 musste sehr schnell eine bewährte Lösung der Zulassungsregulierung gefunden werden, nachdem 2005 das Datum des Poststempels der Anmeldung für die Zulassung zählte, was so nicht wiederholbar war. Die Schweiz erklärte sich bereit, kurzfristig zu helfen und den EMS zeitweilig gemeinsam durchzuführen. Aufgrund der besonderen Situation in Österreich (z.B. österreichspezifischer Gender-Gap) ist die österreichische Seite angehalten, ein eigenes nationales Zulassungsverfahren zu entwickeln, was jetzt in Angriff genommen wird [5]. Nationale Besonderheiten gibt es bereits heute: So verwendet beispielsweise die Medizinische Universität Graz einen Wissenstest als Auswahlverfahren (wo immer vergleichbare, im Jahr 2012 sogar größere Genderdifferenzen zugunsten der Männer auftreten)[6]. 2012 wird in Innsbruck und Wien ein spezielles Zulassungsverfahren (EZS-AT) für Zahnmedizin eingesetzt. Es besteht aus einem auf 7 Untertests verkürzten EMS (EMS-Z) und einem manipulativen Geschicklichkeitstest, deren Ergebnisse mittels vorgegebener Gewichtungen (70:30) gemittelt werden. Im September 2012 hat die Schweizer Seite die weitere Bereitstellung von EMS-Versionen für Österreich aufgekündigt.

Konzept des Tests - Was misst der EMS?

Der EMS besteht aus zehn Untertests, die als Eintagesassessment von 9 bis 17 Uhr mit einer einstündigen Pause am Testtag zu bearbeiten sind. Die Belastung gehört mit zum Konzept des Tests, weil Medizinstudium und Beruf eine hohe Belastbarkeit voraussetzen. Im Unterschied zu einer Prüfung kann man den Test genau genommen nicht "bestehen" oder "nicht bestehen", er ist ein wettbewerbsorientiertes Reihungsverfahren: Es steht eine bestimmte Studienplatzanzahl zur Verfügung, die Plätze werden unter der Bedingungen eines Numerus clausus an die Testbesten vergeben. Auch für die Vergabe eines Platzes der gewünschten Universität oder eine notwendige Umleitung an weniger ausgelastete Universitäten wird der Testwert herangezogen.

Es sollen diejenigen Personen bevorzugt einen Platz erhalten, die für das Studium am besten geeignet sind und von denen erwartet wird, das sie es in einer angemessen (kurzen) Studienzeit mit guten Ergebnissen beenden können. Es wurde in Studien nachgewiesen, dass der Testwert des EMS diesen Studienerfolg gut vorhersagen kann (mittlerweile auch für Österreich geltend). Auch für den Einzelfall gilt: "Je höher der Testwert, umso wahrscheinlicher das Bestehen der Prüfungen". Aus diesem Grunde werden die vorhandenen Studienplätze dann entsprechend der Höhe des Testwertes zugeteilt.

Ein (ganzzahliger) Testwert wird jährlich so berechnet, dass der erzielte Punktwert auf Mittelwert und Standardabweichung der jeweiligen Kohorte standardisiert wird. Der mittlere Testwert liegt so in jedem Jahr bei 100 mit einer Standardabweichung von 10. Da die Kohorten-Mittelwerte und Standardabweichungen länderspezifisch sind, ist keine Übertragung von Testergebnissen zwischen Ländern möglich. Auf der Basis des Testwertes findet die Zulassung statt. Bei gleichem Testwert entscheidet der durchschnittliche Rangplatz als gemittelter Rangplatz in allen zehn Untertests eines Bewerbers.

Untertests oder Aufgabengruppen

Die zehn Untertests bzw. Aufgabengruppen des EMS sind:

Untertest Aufgaben und Dauer Beschreibung
Quantitative und Formale Probleme 20 Aufgaben, 50 Minuten Test zu mathematischen Fähigkeiten im naturwissenschaftlichen Kontext
Schlauchfiguren 20 Aufgaben, 12 Minuten mentaler Rotationstest zu räumlichen Fähigkeiten;
Textverständnis 18 Aufgaben, 45 Minuten Test zum Lesesinnverständnis im naturwissenschaftlichen Kontext
Planen und Organisieren 20 Aufgaben, 60 Minuten Test zur Planungskompetenz
Konzentriertes und Sorgfältiges Arbeiten Blatt mit 1600 Zeichen, 8 Minuten Aufmerksamkeitsbelastungstest
Figuren lernen 20 Aufgaben, 4 Minuten lernen, 5 Minuten reproduzieren Test der figuralen Merkfähigkeit
Fakten lernen 20 Aufgaben, 6 Minuten lernen, 7 Minuten reproduzieren Test der verbalen Merkfähigkeit und assoziativen Erinnerungsbildung;
Medizinisch-Naturwissenschaftliches Grundverständnis 20 Aufgaben, 50 Minuten Test zu naturwissenschaftlichem Denken
Muster zuordnen 20 Aufgaben, 18 Minuten Test der visuellen Strukturierungsfähigkeit
Diagramme und Tabellen 20 Aufgaben, 50 Minuten Test zum Verständnis und zur Interpretation von Diagrammen und Tabellen.

Nach dem Untertest "Konzentriertes und Sorgfältiges Arbeiten" erfolgt eine einstündige Pause. Zwischen den Lernphasen und der Reproduktion bei "Figuren lernen" und "Fakten lernen" wird "Medizinisch-naturwissenschaftliches Grundverständnis" durchgeführt, d.h. mindestens 50 Minuten müssen die Dinge behalten werden.

Mit Hilfe der Faktorenanalyse wurde ermittelt, welche gemeinsamen Komponenten sich in den zehn Aufgabengruppen finden. Etwa 30 % der Varianz der Testergebnisse werden durch einen Faktor "Schlussfolgerndes Denken (Reasoning)" aufgeklärt, etwa 15 % Anteil hat die "Merkfähigkeit" und etwa 20 % "Visuelle Fähigkeiten und Konzentrationsfähigkeit"[7]. 35 % der Varianz sind spezifisch für die einzelnen Aufgabengruppen oder andere Anteile.

Der EMS ist ein psychometrisches Verfahren in der Tradition der Klassischen Testtheorie. Die Subtests sind nicht - wie etwa der amerikanische Scholastic Aptitude Test bzw. die PISA-Studie nach dem Rasch-Modell konzipiert, d. h. die Subtests sind nicht eindimensional, sondern sollen bewusst komplexe Studienanforderungen ("Arbeitsproben") nachempfinden.

Wie funktioniert der Test?

Der Test ist auf die Messung der Studieneignung, der optimalen Vorhersage des Studienerfolges ausgelegt. Die Zulassung nach dem Testergebnis ist dann gerecht, wenn Personen mit besserem Testergebnis tatsächlich mit höherer Wahrscheinlichkeit das Studium abschließen bzw. bessere Ergebnisse erreichen. Ohne NC in überlasteten Universitäten beendeten in der Schweiz bis zu 60 % der Personen das Studium vorzeitig, verschwendete Ausbildungskapazität und verlorene Ausbildungszeit für die Personen selbst waren das Ergebnis. In zahlreichen Validierungsstudien Wie prognostiziert das Testergebnis den Studienabschluss und die Noten? konnte nachgewiesen werden, dass der EMS bzw. in Deutschland der TMS ein den Schulnoten vergleichbares Niveau erreicht - kein anderes Kriterium (Eignungsgespräche, allgemeine Tests) erreichen dieses hohe Niveau. Dazu gewährleistet der Test aber eine hohe Vergleichbarkeit der Bedingungen (unterschiedliche Bewertungs-Maßstäbe, unterschiedliche Notenstrenge oder individuelle Bevorteilungen/Benachteiligungen sind praktisch nicht möglich).[8].

Zur Berechnung eines Testwerts werden zunächst der Mittelwert und die Standardabweichung der Gesamtpunktzahl aller 10 Untertests bestimmt. Der Testwert kommt dadurch zustande, dass man von der Gesamtpunktzahl den Mittelwert der Punktzahlen aller Testteilnehmenden subtrahiert und die Differenz durch den Wert der Standardabweichung dividiert. Anschließend wird zur leichteren Handhabung noch mit 10 multipliziert und der Wert 100 addiert. Der mittlere Testwert beträgt dadurch 100 und seine Standardabweichung 10. Der niedrigste vergebene Testwert ist 70, der höchste 130. Ist ein Testwert größer als 100, dann wurde eine überdurchschnittliche Leistung erbracht. Liegt der Testwert unter 100, dann hat er ein unterdurchschnittliches Resultat erzielt - immer bezogen auf die Menge aller Bewerberinnen und Bewerber. Durch diese Standardisierung sind Testwerte zwischen den Jahren vergleichbar und können auch ins Folgejahr übernommen werden.

Bei gleichem Testwert werden die Personen in der Reihenfolge des mittleren Rangplatzes aller Untertests berücksichtigt, wenn die Kapazität keine Zulassung aller Personen mit einem Testwert zulässt bzw. für Umleitungen eine Differenzierung notwendig ist. Um auch hier eine Vergleichbarkeit zwischen den Jahren herzustellen, werden die Rangplätze auf jeweils 1000 Personen bezogen umgerechnet. Diese Auswertung wichtet gute Leistungen in schwereren Untertests höher als der einfache Punktwert[9].

Grundsätzlich können in einem Eignungstest als Groß-Gruppentest nur ganz bestimmte Merkmale geprüft werden:

  • Leistungsmerkmale, wo es eindeutig richtige/falsche Lösungen gibt, die Zahl richtiger Lösungen für Eignung steht. Der Richtigkeitsnachweis muss justitiabel sein (z.B. die Trennschärfen werden als Kenngrössen verwendet);
  • nicht verfälschbare Merkmale (z.B. keine Urteile nach der sozialen Erwünschtheit);
  • ökonomisch erfassbare Merkmale, Eignung für Groß-Gruppentestung, automatisierte Auswertbarkeit (z.B. keine Videopräsentationen realistisch);
  • geringe Trainierbarkeit (nicht zu verwechseln mit Notwendigkeit der Vorbereitung) – die empfohlene Selbstvorbereitung muss mit kommerziellen Trainingskursen vergleichbar bleiben.

Mögliche weitere Faktoren, die das Testergebnis beeinflussen:

  • Güte der schulischen Ausbildung als Training der Studierfähigkeit (wahrscheinlich);
  • Motivationale Faktoren bezogen auf Medizinstudium/Medizinalberuf und Testmotivation (sicher);
  • Geübtheit, Vorbereitung (sicher);
  • Belastbarkeit (der Test dauert fast sechs Stunden - diese Anforderung ist allerdings Bestandteil des Testkonzeptes, weil auch der Medizinalberuf in der Regel hohe Belastbarkeit fordert), (sehr wahrscheinlich);
  • Testangst (wahrscheinlich).

Unterschiede zum deutschen TMS

Der EMS basiert auf dem Konzept des Test für Medizinische Studiengänge (TMS). Die Unterschiede sind:

  • ein veränderter Konzentrationstest (der nun auch in den neuen TMS Eingang fand);
  • ein neuer Untertest Planen und Organisieren, der aufgrund einer neuen Anforderungsanalyse für das Medizinstudium aufgenommen wurde und Planungskompetenz erfassen soll;
  • eine veränderte Reihenfolge der Untertests und der Verzicht auf Einstreuaufgaben; damit ist die Aufgabenanzahl im Vergleich zum TMS in den meisten Aufgabengruppen um vier reduziert und der EMS trotz des zusätzlichen Untertests in etwa gleich lang;
  • die Verwendung des gemittelten Rangplatzes über die Untertests, der hohe Punktzahlen in schwierigeren Untertests höher gewichtet als in leichteren, als Entscheidungskriterium für die Zulassung bei gleichem Testwert;
  • äquivalente Testformen in den (Landes-)Sprachen der Schweiz: Deutsch, Französisch und Italienisch.

Verschiedene Sprachversionen

Bedingt durch die Mehrsprachigkeit der Schweiz wird der Test in deutscher, italienischer und französischer Sprache entwickelt. Dabei werden die Aufgaben hinsichtlich ihrer unterschiedlichen Wirkung in den verschiedenen Sprach- und Länderversionen mit Hilfe der sog. DIF-Analyse überprüft. Für Fragen, die in der französisch- oder italienischsprachigen Version im Vergleich zur Erwartung aufgrund der deutschsprachigen Version deutlich schwerer sind, werden den dadurch möglicherweise testbedingt benachteiligten Teilnehmern (Zehntel-)Bonuspunkte gutgeschrieben.

Studieneignung, Berufseignung und Soziale Kompetenz

Man hat sich beim Zulassungstest bewusst auf Kompetenzen der Studieneignung beschränkt, weil vor Einführung des NC 50-60 % der Personen Prüfungen nicht bestanden und das Studium abbrachen. Medizin ist und bleibt ein anspruchsvolles Studium hinsichtlich der geforderten mathematisch-naturwissenschaftlichen Kompetenzen. Verlagert man das Gewicht des Tests zu sehr auf soziale Kompetenzen (die weniger prüfungsrelevant sind), besteht die Gefahr, dass die Zulassung nicht mehr nach der Erfolgsaussicht geschieht und dass die Abbruchraten wieder ansteigen. Wurde die Zulassung begrenzt, würde die Ausbildungskapazität vor allem im Fachstudium dann nicht mehr optimal genutzt.

Die Studieneignung als "Studierfähigkeit" (sich neues Wissen effektiv aneignen) wird allerdings auch als Kernkompetenz der Berufseignung gesehen, vor allem im Hinblick auf Modelle der zunehmend geforderten kontinuierlichen lebenslangen Weiter- und Fortbildung in der Medizin.

Bezüglich der Sozialkompetenz ist die Suche nach einem verfälschungssicheren Paradigma mit Eignung für den Zulassungstest beständig (und erfolglos) weiter erfolgt: Die „Situational Judgement Tests“ (SJT) erfüllten die Hoffnungen nicht[10]. Eine Darbietung auf Papier hat in Belgien keine ausreichende Vorhersage für kognitive oder soziale Studienerfolgskriterien erlaubt; eine Darbietung per Video wäre aussichtsreicher, ist aber aufgrund des Aufwandes und der technischen Voraussetzungen nicht realistisch. Aufgrund eines ausführlichen Workshops in Wien wurde auf eine Pilotstudie mit einer Papierversion verzichtet. Andere auf Selbstbeurteilung beruhende Paradigmen sind allenfalls für das Self Assessment geeignet – nicht aber für einen wie oben charakterisierten Zulassungstest (auch wegen der Verfälschbarkeit und Trainierbarkeit).

Es liegen außerdem keine ausreichend differenzierten Anforderungsanalysen vor, um Berufseignung für die verschiedenen Medizinalberufe tatsächlich zu beschreiben und nachfolgend mit einem Zulassungstest zu erfassen. Die einzelnen Fachgebiete (z.B. Chirurgie vs. Psychiatrie) und Arbeitsorte (z.B. Labor vs. Praxis) unterscheiden sich beträchtlich. Keines dder Merkmale hat die Qualität, dass es als "hartes" Kriterium für die Zulassung praktisch verwendbar wäre (es sind ggf. Beurteiler notwendig, die unterschiedliche Maßstäbe haben können, erwünschtes Verhalten ist stark trainierbar, einige Merkmale bilden sich erst während des Studiums heraus bzw. sind selbst Ausbildungsziele).

Ergänzendes Self Assessment für Soft Skills

Ergänzend wird zum EMS seit 2010 ein Online Self Assessment zur Erfassung studienrelevanter Persönlichkeitsmerkmale, von Interessen für Medizinstudium und -beruf sowie von Wissen bzw. Erwartungen bezüglich eines Medizinstudiums/Medizinalberufes seit 2010 eingesetzt, um auch Soft Skills in den Entscheidungsprozess für eine Zulassung der Bewerber einzubeziehen[11].

Trainierbarkeit des EMS

Die Trainierbarkeit des EMS stellt für viele Bewerber ein wichtiges Thema dar, da sie sich auf den Test gut vorbereiten möchten, weshalb es auch einen florierenden Trainingsmarkt in diesem Bereich gibt. Von Seiten der Testentwickler wird zu einer Vorbereitung auf den Test dringend geraten.

Grundsätzlich gilt für den EMS das sogenannte Testing-the-Limits-Paradigma, d.h. dass der Test mit zunehmender Übung und Praxis an Differenzierungsfähigkeit gewinnt und die Werte sich von Testung zu Testung auf einem stabileren Level (der individuellen Leistungsasymptote) einpendeln, da Startvorteile, die in Vorwissensunterschieden oder einer besseren schulischen Ausbildung begründet liegen können, zwischen den Bewerbern ausgeglichen werden. Das heißt, dass die Reliabilität des Messinstruments von Testung zu Testung zunimmt, wie in verschiedenen Untersuchungen bestätigt werden konnte. Das gleiche gilt auch für Training. Je besser die Trainingsintervention ist, umso schneller erreicht jemand seine individuelle Leistungsasymptote. Übung und Training stellen daher eine Notwendigkeit für die Bewerber dar, weshalb Originalversionen des Tests öffentlich erhältlich sind, die am besten unter Echtzeitbedingungen absolviert werden sollten.

Im Rahmen der Evaluierungen des EMS wurde auch die Auswirkung verschiedener Vorbereitungsarten untersucht. Insgesamt konnte ein Optimum bei einer selbständigen Vorbereitungsdauer von 30 bis 35 Stunden statistisch aufgefunden werden. Außerdem scheint eine positive Wirkung der gemeinsamen Vorbereitung in Gruppen zu bestehen. Positiv auf die Vorbereitung wirkt sich auch das Durchführen eines Tests unter Echtzeitbedingungen aus. In Bezug auf den Erfolg von zusätzlichen Testtrainings konnten keine signifikanten Vorteile von Teilnehmern festgestellt werden. Selbstständige Vorbereitung scheint überdies mehr zu bewirken als die Teilnahme an Kursen, da gezeigt werden konnte, dass jene Kursteilnehmer, die nur einen kurzen Kurs (Dauer < 8h) besuchten und sich intensiv selbst beschäftigten besser abschnitten als jene, die an einem längeren Kurs teilnahmen (Kurs > 8 h)"[12][13][14].

Im Rahmen einer großangelegten Untersuchung 1982 zeigte Bernhard Deter[15], dass nicht einmal Unterschiede zwischen Teilnehmern eines Kurses und jenen, die nur eine Testbroschüre erhielten aufgefunden werden konnten, was damals dazu geführt hat, dass die Testinformationsbroschüre eingeführt wurde. Die Kombination von Testbroschüre und Originalversionen heute und die Daten der Evaluierungen lassen vermuten, dass keine Einschränkungen der Testfairness durch Trainingskurse zu erwarten sind.

Ein interessanter Zusammenhang besteht bezüglich der Frage, welche Subtests des EMS sich besonders gut und welche sich besonders schlecht trainieren lassen. Diesbezüglich konnte ein Zusammenhang mit der Faktorenstruktur des Tests gefunden werden, wenn diese Daten mit der groß angelegten Trainingsstudie von Deter (1982) in Verbindung gesetzt werden. Je höher die Ladung des Subtests auf dem Faktor "Schlussfolgerndes Denken" desto niedriger sind die zu erwartenden Trainingsgewinne. Je höher die Ladung allerdings auf dem Faktor "Visuelle Fähigkeiten" desto höher ist der zu erwartende Gewinn. In Zusammenhang mit dem Faktor "Merkfähigkeit" gibt es keinen Zusammenhang mit der Trainierbarkeit der Subtests. Daraus ergibt sich eine Reihenfolge der Subtests hinsichtlich ihrer Trainierbarkeit, auf die auch bei der Vorbereitung im Falle einer Prioritätensetzung geachtet werden kann:

  • 1. Muster zuordnen
  • 2. Figuren lernen
  • 3. Fakten lernen
  • 4. Schlauchfiguren
  • 5. Diagramme und Tabellen
  • 6. medizinisch-naturwissenschaftliches Grundverständnis
  • 7. quantitative und formale Probleme
  • 8. Textverständnis.

Geschlechterunterschiede und Genderfairness

Geschlechtsunterschiede beim EMS waren immer wieder Gegenstand von Diskussionen, da Testfairness eine Chancengleichheit voraussetzt. Chancengleichheit bedeutet, dass bei gleicher Eignung (hier Studieneignung, s.o.) gleiche Ergebnisse erzielt werden können. Chancengleichheit ist nicht mit Ergebnisgleichheit zu verwechseln (wenn etwa gleiche Mittelwerte für alle Gruppen zwingend erwartet werden), da sich objektiv vorhandene Eignungsunterschiede auch im Ergebnis widerspiegeln müssen. Außerdem sind die Kohorten der Männer und Frauen, die sich für ein Medizinstudium bewerben, nicht repräsentativ für die jeweiligen Altersgruppen und auch miteinander nicht zwingend vergleichbar, weil die Studienwahl jeweils unterschiedlich motiviert sein kann.

Mittelwertsunterschiede vor allem in Österreich

Es zeigte sich, dass weibliche Teilnehmer im Mittel in allen Jahren vor allem in Österreich beim Test schlechter abschnitten als männliche. So lag die Mittelwertsdifferenz der Geschlechter für die Schweiz immer im Bereich von etwa ein bis zwei Testwertpunkten (d.h. 0.1 bis maximal 0,2 Standardabweichungen) an der Grenze zur Signifikanz - entsprach ziemlich genau realen Unterschieden beim Prüfungserfolg[16], während er in Österreich in den Jahren 2006 und 2007 sowie 2009 ca. 0,4 Standardabweichungen betrug. 2008 hatte er sich allerdings verringert, was auf die Sensibilisierung und entsprechende Maßnahmen durch die Diskussion in den beiden Vorjahren zurückgeführt wird. 2009 hat er sich wieder leicht vergrößert und liegt in den Jahren 2010 und 2011 noch immer bei 4 Testwerten bzw. 0,4 Standardabweichungen. [17]. Auch vom in Deutschland eingesetzten Test für Medizinische Studiengänge werden derartige Unterschiede nicht berichtet.

Bei nahezu allen Aufgabengruppen sind die Mittelwerte entweder des einen oder anderen Geschlechts besser, wobei weibliche Teilnehmer bei den Gedächtnistests (Figuren lernen und Fakten lernen) sowie bei "Konzentriertem und Sorgfältigem Arbeiten" in der Schweiz besser abschneiden, bei den meisten anderen Subtests aber die mittleren Leistungen von männlichen Teilnehmern besser sind. Am deutlichsten ist dieser Unterschied in Österreich v.a. bei den Subtests "Quantitative und Formale Probleme" und "Diagramme und Tabellen" sowie 2011 "Medizinisch naturwissenschaftliches Grundverständnis" zu Gunsten der Männer. Unterschiede bei "Räumlichem Vorstellen" sind weniger dominierend als behauptet: Bei "Schlauchfiguren" ist der Unterschied nur etwa 1 Punkt, bei "Figuren lernen" sind Frauen sogar besser als Männer[18].

Mögliche Ursachen für die Genderdifferenzen in Österreich

Bezüglich dieser Unterschiede wird die Debatte darum geführt, ob diese testbedingt sind (und ein "genderfairer" Test, der immer noch Eignung erfasst, entwickelt werden könnte) oder ob diese Eignungsunterschiede objektiv vorhanden sind und ein Test diese sogar abbilden muss, solange hohe Studienanforderungen auch an mathematisch-naturwissenschaftliche Fähigkeiten gestellt werden.

Zahlreiche Ergebnisse sprechen dafür, dass die Genderdifferenzen im Test auf objektiven Eignungsunterschieden beruhen:

Dass sich 60 % Frauen und 40 % Männer in beiden Ländern im Durchschnitt bewerben, wird als eine erste Ursache für die Mittelwertsdifferenzen in Repräsentativitätsunterschieden beider Gruppen gesehen, eine Mittelwertsgleichheit ist unter diesen Bedingungen eher unwahrscheinlich.[19][20]

Die Bildungspsychologin Christiane Spiel versuchte 2008 im Rahmen einer Untersuchung in Österreich diese Unterschiede zu erklären, und führt in erster Linie klassische Rollenbilder als Ursache an, die sich auch im Schulunterricht auswirken.[21] Die Befunde zeigen zweierlei.

  • Erstens besteht ein linearer Zusammenhang zwischen den Noten in den naturwissenschaftlichen Fächern und der Leistung im Eignungstest. Je besser die mittleren Schulnoten sind, desto besser ist die Testleistung.
  • Zweitens zeigen die Befunde einen deutlichen Geschlechtsunterschied. Frauen haben bei gleichen Schulnoten deutlich schlechtere Testleistungen und zwar durchgängig für alle Schulnoten. Die Unterschiede sind substanziell. […] Der Unterschied in der Testleistung beträgt somit 5,39 Punkte bei gleichen Schulnoten.[22]

Klassische Rollenbilder sollen das Erziehungsverhalten vieler Bezugs- und Lehrpersonen noch immer prägen. Mädchen werden mehr für Fleiß und Anpassung gelobt - an Knaben werden höhere Leistungsanforderungen gestellt, speziell in Mathematik und Naturwissenschaften. Mädchen bekämen zudem oft vermittelt, dass Mathematik für sie nicht sehr berufsrelevant wäre. Daraufhin komme ein Kreisprozess in Gang, dass Mädchen weniger Vertrauen in ihre mathematisch-naturwissenschaftlichen Fähigkeiten entwickeln, was sich auf die Motivation und das Investment für die Fächer auswirke und sich dann in geringerem Können (Leistungen) niederschlage.[23] Dies bedeutet, dass alle an der Sozialisation Beteiligten schon sehr früh an der Veränderung der Rahmenbedingungen mitwirken müssen. Dies bedeutet aber auch, dass die festgestellten Unterschiede im Test selbst nicht überraschend sein sollten.

Der Salzburger Erziehungswissenschaftler Ferdinand Eder konnte Benotungsunterschiede zwischen Jungen und Mädchen in Österreich identifizieren: Jungen bekommen bei vergleichbaren Leistungen oft schlechtere Noten als Mädchen, bei Mädchen fließt ein "Betragensbonus" in die fachliche Benotung mit ein[24]. Die bessere Beurteilung kann sich auf die Selbsteinschätzung der eigenen Leistungsfähigkeit verzerrend auswirken und auch das Studienwahl-Verhalten derart beeinflussen, dass die höheren mathematisch-naturwissenschaftlichen Anforderungen eines Medizinstudiums unterschätzt werden. Auch das Interesse für mathematisch-naturwissenschaftliche Sachverhalte scheint sich zu unterscheiden und dieses müsste besonders bei Frauen stärker gefördert werden, weil das Medizinstudium dies zwingend voraussetzt.[25]

Auch bei den Ergebnissen der letzten PISA-Studie 2009 wurde für Naturwissenschaften (science) eine Differenz von -6 (das Mittel für alle Länder ist 0), für Mathematik von -19 (hier das Mittel sogar +14) zugunsten der Jungen in Österreich festgestellt (negative Vorzeichen sprechen für bessere Werte der Jungen). In der Lesekompetenz sind Frauen mit +41 besser, hier liegt das Mittel für alle Länder bei +39[26].Besonders die Schlussfolgerungen von Spiel hinsichtlich der Mathematik werden bestätigt - hier sogar in repräsentativeren Stichproben für die Altersgruppe als es die Medizinbewerbungen sind.

Dass der EMS chancengleich nach gleicher Eignung zulässt und die Unterschiede nicht testbedingt sind, zeigt sich weiterhin in gleichen Notenmittelwerten bei der ersten Prüfung im Studium (SIP-1) für Männer und Frauen. Die zugelassenen Gruppen unterscheiden sich nicht hinsichtlich des Studienerfolges (um den Preis der geringeren Zulasssungsquote für Frauen). Schon in der ersten Evaluation 2007 zeigte sich, dass der SIP-1-Punktwert mit dem EMS-Wert für Frauen mit. 53 - für Männer mit. 50 korrelierte, es die gleiche Vorhersagebeziehung für beide Geschlechter gibt.[27] Der Test sagt die Studieneignung daher unverzerrt und gleich gut für beide Geschlechter vorher. Siehe dazu auch die Stellungnahme des ZTD zur Studie von Spiel [28].

Ob einzelne Fragen für Männer und Frauen unterschiedlich funktionieren, wurde mit dem für diese Fragestellung international üblichen DIF-Verfahren überprüft. In der Schweiz werden damit in unterschiedlichen Sprachgruppen anders funktionierende Items identifiziert und ggf. korrigiert. Es konnten allerdings auch hier keine systematischen Unterschiede identifiziert werden, 2007 wiesen nur 2, 2008 nur 3 der 178 Items DIF auf [29][30].

Auch die Ergebnisse des Zulassungstest in Graz zeigen, dass die Unterschiede vor allem im naturwissenschaftlichen Bereich liegen. Im Jahr 2012 bewarben sich dort 57 % Frauen, zugelassen wurden nur 42 %. Diese Differenz von 15 % stellt für alle Jahre und Orte sogar ein Maximum dar. Dort resultieren die Unterschiede vor allem aus dem Wissensteil, insbesondere dem Bereich der Physik. Dieser Testteil ähnelt am ehesten einer standardisierten Maturitätsprüfung - die Ergebnisse bestätigen ebenfalls die Ergebnisse der Studie von Spiel[31].

Man muss zusammenfassen, dass die Genderdifferenz in zwei ganz unterschiedlichen Tests (einmal Wissenstest, einmal Eignungstest) über mehrere Jahre festgestellt wurde und alle empirischen Belege dafür sprechen, dass es sich um objektive Eignungsunterschiede zwischen den Geschlechtern handelt.

Genderspezifische Auswertung an der Medizinischen Universität Wien 2012

Aufgrund der bisher unterschiedlichen Zulassungswahrscheinlichkeiten für Männer und Frauen trifft die Medizinische Universität Wien für 2012 die umstrittene Entscheidung, dass die Ermittlung des Testwertes geschlechtsspezifisch zu erfolgen hat.[32] Die dort beschlossene geschlechtsspezifische Auswertung bedeutet, dass für Frauen und Männer bei der Bildung der Testwerte gruppenspezifische Mittelwerte und Standardabweichungen verwendet werden. Da Frauen im Mittel schlechter abschneiden, bedeutet dies faktisch eine Anhebung der Testwerte für Frauen und Absenkung der Testwerte für Männer. Der "durchschnittliche Mann" und die "durchschnittliche Frau" haben jeweils einen Testwert von 100[33] [34]

Die HochschülerInnenschaft an der Medizinischen Universität Wien hält dieses Verfahren für rechtswidrig und hat klagewilligen Testteilnehmern ihre Unterstützung zugesagt.[35][36]

Die Wahl eines Nachteilsausgleichs wurde gegenüber dem Gleichbehandlungsgebot (gleiche Eignung = gleiche Zulassungschance) als vorrangig abgewogen. Wegen des sogenannten "Paternostereffektes" (bevorzuge ich die einen, benachteilige ich in gleicher Weise andere) wird es individuelle Benachteiligungen geben. Der für diesen Ausgleich gegeben Begründung "Wenn eine Gruppe signifikant weniger gut abschneidet, dann ist offenkundig, dass etwas mit dem Verfahren nicht stimmt"[37] widerspricht der Schweizer Testanbieter unter Bezugnahme auf die Befunde, dass es sich um tatsächliche Eignungsunterschiede handelt, die ein Test zunächst auch abbilden muss. Die Entscheidung für eine genderspezifische Auswertung ist politisch begründet, aus psychodiagnostischen Gründen wäre sie nur dann geboten, wenn der Test die Eignung von Frauen systematisch unterschätzen würde. Dafür gibt es aufgrund der empirischen Befundlage aber keine Anhaltspunkte.[38]. Bisherige Förderungsprogramme für Frauen gehen davon aus, bei gleicher Eignung Frauen zu bevorzugen (etwa wenn bestimmte Quoten vorgegeben werden). Wenn es sich bei den festgestellten Unterschieden um tatsächliche Eignungsunterschiede handelt, wären erstmals weniger geeignete Personen solchen mit höherer Eignung vorgezogen.

Presseecho und Kommentare

Die Entscheidung für die genderspezifische Auswertung wurde in zahlreichen österreichischen und auch deutschen Medien kritisch diskutiert[39]. Besonders erwähnenswert sind die vielen kritischen Kommentare - auch im Forum von Medizinstudium.at[40]. Im Standard brachte es ein Beitrag auf über 1200 Leserkommentare [41]. Es werden auch Klagen gegen diese Maßnahme angekündigt[42]. Die Medizinische Universität Wien will nun 60 zusätzliche Plätze anbieten, diese aber nach den genderkorrigierten Werten verteilen (d.h. auch für diese 60 Plätze gelten unterschiedliche Leistungsanforderungen für beide Geschlechter und es erhöht sich die Zahl der Männer, die trotz besserer Leistung als für eine Zulassung der Frauen erforderlich, nicht zugelassen werden)[43].

Keine genderspezifische Auswertung in Innsbruck

An der Medizinischen Universität Innsbruck wurde keine Veränderung vorgenommen, der Test wurde wie bisher für Männer und Frauen gleich ausgewertet.

Weitere politische Diskussionen

Die sonstigen politischen Diskussion prägen v.a. folgende Themen:

  • Probleme steigenden Ärztebedarfes, ein aktueller Ärztemangel sowie in der Schweiz der hohe Ausländeranteil bei Ärzten könnten durch Abschaffung des NC gelöst werden. Begrenzend für die Zulassung zum Medizinstudium sind die Ausbildungskapazitäten vor allem im Fachstudium, wo entsprechende Klinikkapazitäten vorhanden sein müssen (Betten bzw. Patienten, Technik, Betreuung) – das Medizinstudium ist auch eine Berufsausbildung mit praktischen Anteilen. Dieser Ausbau ist teuer, die Kantone als Träger der Universitäten können zusätzliche Mittel nur begrenzt aufbringen. Die Zahl der Personen, die den Eignungstest für das Medizinstudium (EMS) absolviert haben, ist in der Schweiz von 670 im Jahr 2000 auf 2363 im Jahr 2012 gewachsen. Um die Nachfrage befriedigen und die gleiche Studienqualität wie im Jahr 2000 ohne NC aufrechterhalten zu können, hätte man 11 Universitäten wie Basel oder 6 wie Zürich zusätzlich benötigt. [44]. Nachfrage nach Studienplätzen und sinnvoller Kapazitätsausbau sind zwei verschiedene Fragen geworden.
  • Die Sinnhaftigkeit von Zulassungsbegrenzungen wird infrage gestellt, sowie ein freier Hochschulzugang gefordert. Dies ist damit auch eine politische Entscheidung, die nichts mit dem Test selbst zu tun hat.
  • Die Begründung der Verwendung eines Eignungstests wird hinterfragt. Nicht zuletzt deshalb wird die Vorhersagefähigkeit des Prüfungserfolges laufend evaluiert. Auch im Vergleich mit anderen Zulassungskriterien (Abiturnote, Aufnahmegespräche, Sozialpraktika, intrauniversitäre Selektion nach dem ersten Jahr) hat der Test aber Vorteile (siehe FAQ unter Weblinks).

Siehe auch

Weblinks

Einzelnachweise

  1. Es ist in der Regel der erste Freitag - liegt dieser wegen der Maturitätsprüfungen zu früh, wird auf den zweiten Freitag gewechselt
  2. http://www.unige.ch/medecine/enseignement/demarchesPratiques/conditionsDAdmission/testAptitude.html
  3. Bericht 18 des ZTD, Seite 11
  4. Mitteilung im BLOG des ZTD
  5. http://www.kleinezeitung.at/nachrichten/politik/2970739/medizin-aufnahmetest-frauen-bevorzugt.story
  6. Vergleich Bewerber- und Zulassungsquoten nach Geschlecht
  7. Bericht 13 des ZTD, S. 84
  8. Metaanalyse Prädiktoren des Studienerfolges von Hell u.a. (Gruppe Schuler)
  9. siehe Seite 44 im Bericht 18 zum EMS 2011
  10. Konzeptpapier des ZTD zum SJT
  11. Projektseite Self Assessment Medizin
  12. Vorbereitungsreport 2005
  13. Vorbereitungsreport 2004
  14. Vorbereitunsreport 2003
  15. Deter, B.(1982). Zum Einfluss von Übung und Training auf den Test für Medizinische Studiengänge. Braunschweig: Agentur Pedersen.
  16. FAQ zum EMS Seite 24
  17. "Statistischer Bericht zum EMS-AT 2011"
  18. http://www.eignungstest-medizin.at/Bericht_EMSAT10.pdf
  19. http://www.ots.at/presseaussendung/OTS_20090814_OTS0092/ems-test-in-wien-und-innsbruck-frauen-schneiden-erneut-schlechter-ab-als-die-maennlichen-bewerber
  20. http://diepresse.com/home/bildung/universitaet/681996/Medizin_Viele-Frauen-scheitern-an-EMSTest-
  21. Christiane Spiel et al.: Evaluation der Eignungstests für das Medizinstudium in Österreich. Fakultät für Psychologie, Universität Wien, 2008, S. 163, abgerufen am 21. April 2012 (PDF, 28MB).
  22. An der Schnittstelle zwischen Schule und Hochschule: Kompetenz, Eignung und Begabung auf dem Prüfstand
  23. Studie von Spiel u.M. Seite 192
  24. Studie von EDER bei ORF.at
  25. Medizin-Aufnahmetest: Frauen schneiden erneut schlechter ab. derStandard.at, 23. Juli 2010, abgerufen am 2012-.
  26. OECD (2010), PISA 2009 Results: What Students Know and Can Do: Student Performance in Reading,Mathematics and Science (Volume I), OECD Publishing
  27. Statistischer Bericht 2011 um EMS-AT
  28. Stellungnahme des ZTD Freiburg/Schweiz zur Studie von Spiel u.M.
  29. Bericht 2007 zum EMS-AT S. 57ff
  30. Bericht 2008 zum EMS-AT S. 53ff
  31. DerStandard vom 1. August 2012
  32. §10(1) der 7. Änderung der Verordnung über die Zulassungsbeschränkung zu den Diplomstudien Human- und Zahnmedizin an der Medizinischen Universität Wien, S. 8
  33. Statistischer Bericht 2011 zum EMS-AT
  34. Frauen bei Medizinaufnahmetest bevorzugt. ORF, abgerufen am 14. Juli 2012.
  35. Rosa Schmidt-Vierthaler: Med-Uni Wien: Test zum Vorteil der Frauen ausgewertet. DiePresse.com, 10. Mai 2012, abgerufen am 14. Juli 2012.
  36. http://www.uv-medizin.at/homepage
  37. Der Standard vom 6. August 2012
  38. Seite zum EMS des ZTD
  39. Berichterstattung zur genderspezifischen Auswertung
  40. http://www.medizinstudium.at/forum/medizinstudiumat/allgemeines/ems
  41. http://derstandard.at/1343743730235/Mediziner-Test-Maenner-fuehlen-sich-benachteiligt
  42. http://diepresse.com/home/bildung/universitaet/1279628/Frauenbonus-bei-Test_Wiener-MedizinUni-unter-Druck?_vl_backlink=/home/bildung/universitaet/index.do Die Presse vom 15. August 2012]
  43. http://derstandard.at/1347493236069/Zusaetzliche-60-Plaetze-an-Wiener-Meduni-fix Der Standard vom 21. September 2012
  44. http://www.unifr.ch/ztd/ems/doc/pruefungserfolg10.pdf Analyse Studienerfolg an Universitäten mit und ohne NC in der Schweiz