05. Mai 2017

100 Jahre Forschung: Das sind die besten Personalauswahl-Methoden


Die Validität von Auswahlverfahren wird seit ca. 100 Jahren erforscht. Eine neue Studie zeigt, was funktioniert und was nicht.

Die Wirtschaftspsychologie beschäftigt sich schon lange mit der Frage, wie sich berufliche Leistung vorhersagen lässt. Die wohl bekannteste Untersuchung zu diesem Thema stammt von Schmidt und Hunter aus dem Jahr 1998. Die Autoren fassten frühere Studienergebnisse in einer sogenannten Meta-Analyse zusammen, um so zu allgemeingültigen Aussagen darüber zu kommen, welche Auswahlmethoden funktionieren und welche nicht. Knapp 20 Jahre später haben die US-Forscher Schmidt, Oh und Shaffer eine neue Untersuchung vorgelegt, die sie der Fachwelt nun als Working Paper zur Verfügung gestellt haben. Die aktuelle Studie:

  • beinhaltet neue Daten aus der Forschung der letzten 20 Jahre,
  • berücksichtigt forschungs-methodische Fortschritte und liefert daher genauere Ergebnisse,
  • beinhaltet neue und damals nicht berücksichtigte Auswahlmethoden und -kriterien, wie z.B. Telefoninterviews und Schulnoten.

Bevor wir die wichtigsten Erkenntnisse der neuen Studie vorstellen, möchten wir kurz darauf eingehen, was Validität ist und wozu sie wichtig ist.

Was ist Validität?

Die (prognostische) Validität eines Auswahlverfahrens sagt etwas darüber aus, wie gut es die spätere berufliche Leistung eines Bewerbers vorhersagen kann. Validitäten werden in der Regel als Zahl zwischen 0 und 1 angegeben. Ein Wert von 0 bedeutet, dass zwischen dem Auswahlinstrument und der späteren Leistung kein Zusammenhang besteht, man also genausogut nach Zufallsprinzip auswählen könnte. Bei einem Wert von 1 wäre der Zusammenhang zwischen Auswahlinstrument und Leistung perfekt, was in der Realität aber nicht vorkommt. Die höchste praktisch erreichbare Validität liegt derzeit bei 0,78 (was in der Fachsprache meist als .78 angegeben wird).

Wozu ist Validität wichtig?

Die Validität gibt den Zusammenhang zwischen dem Auswahlkriterium (z. B. Punkte im Test oder Schulnote) und der späteren Leistung wider, was sich am besten graphisch veranschaulichen lässt. Schwache Zusammenhänge sehen kreisförmig aus (linke Grafik), starke Zusammenhänge ellipsenförmig (rechte Grafik). Gehen wir zur Vereinfachung davon aus, dass ein Bewerber entweder geeignet oder ungeeignet ist und er entweder eingestellt oder abgelehnt wird. Wir können bei der Auswahl nun zwei richtige und zwei falsche Entscheidungen treffen: Richtig ist es, einen geeigneten Bewerber einzustellen und einen ungeeigneten abzulehnen. Falsch ist es, einen geeigneten Bewerber abzulehnen und einen ungeeigneten Bewerber einzustellen.

Validitaet

Wenn unser Auswahlverfahren eine geringe Validität hat, kann es nur schlecht zwischen geeigneten und ungeeigneten Bewerbern unterscheiden, es kommt also zu mehr Fehlentscheidungen. So sind in der linken Grafik von 50 eingestellten Bewerbern nur 28 für die Stelle geeignet; eine Trefferquote von gerade einmal 56 Prozent. Nutzen wir hingegen ein hoch valides Verfahren (rechte Grafik), treffen wir mehr richtige Entscheidungen: Unter den 50 eingestellten Bewerbern sind nur noch 8 ungeeignet, die Trefferquote ist auf 84 Prozent gestiegen.

Valide Auswahlverfahren sind auch finanziell von Vorteil: Der Grund, wieso wir überhaupt Personalauswahl betreiben, ist, dass Menschen mit verschiedenen Eigenschaften und Fähigkeiten unterschiedlich gute Leistungen im Job erbringen (denn würden alle die gleiche Leistung erbringen, könnten wir uns jedes Auswahlverfahren sparen). Schätzungen zufolge liegt der Leistungsunterschied zwischen einem über- und einem unterdurchschnittlichen Stelleninhaber bei ca. 80% eines Jahresgehalts. Bei einem Jahresgehalt von 40.000 € erwirtschaftet ein überdurchschnittlicher Mitarbeiter somit 32.000 € mehr Output als ein Unterdurchschnittlicher. Mit anderen Worten: je höher die Validität des Auswahlverfahrens, umso größer der zu erwartende finanzielle Nutzen.

Das sind die besten und schlechtesten Auswahlverfahren

Die Tabelle gibt eine Übersicht über die Validitäten der verschiedenen Auswahlverfahren und -kriterien, die in den letzten 100 Jahren erforscht wurden. Die Spalte „Validität (einzeln)“ gibt die Validität an, wenn nur dieses Kriterium genutzt wird. Die Spalte „Validität (mit Intelligenz)“ gibt an, wie hoch die Validität ist, wenn man das jeweilige Kriterium zusammen mit Intelligenz zur Auswahl nutzt. Die letzte Spalte gibt die zusätzliche (sog. inkrementelle) Validität an. Diese zeigt, wie viel Validität das Auswahlkriterium über Intelligenz hinaus beiträgt. (Anmerkung: In der Studie wurden noch weitere Auswahlkriterien sowie Zusammenhänge zum Trainingserfolg untersucht, worauf hier der Übersicht halber verzichtet wird.)

 

Validitaetstabelle

Das beste Auswahlkriterium sind die kognitiven Fähigkeiten (oder allgemeine Intelligenz) des Bewerbers. Vor allem bei komplexen Jobs hängen kognitive Fähigkeiten und Berufserfolg stark miteinander zusammen, aber auch bei mittleren und weniger komplexen Tätigkeiten ist Intelligenz für die Leistung von Vorteil. Die Forscher erklären den Effekt damit, dass klügere Personen über mehr job-bezogenes Wissen verfügen und sich neues Wissen schneller aneignen können. Intelligenz hilft außerdem dabei, komplexe Zusammenhänge zu verstehen und wichtige von unwichtigen Informationen zu trennen. Intelligentere Personen können daher bessere Strategien entwickeln und bessere Entscheidungen treffen.

Integritätstests nehmen ebenfalls eine besondere Rolle ein, da sie die höchste zusätzliche Validität (.13) über kognitive Leistungsfähigkeit hinaus liefern. Bei derartigen Tests werden Bewerber gefragt, ob sie bei früheren Arbeitgebern durch Fehlverhalten, wie z. B. Alkohol, Diebstahl oder längere Fehlzeiten aufgefallen sind. Ein offensichtliches Problem derartiger Tests ist die Wirkung auf den Bewerber, der solche Fragen leicht als feindliche Unterstellung wahrnehmen könnte. Es ist daher kein Wunder, dass Integritätstests im deutschsprachigen Raum eher selten zum Einsatz kommen.

Glücklicherweise schneiden Interviews fast genauso gut ab. Die zusätzliche Validität strukturierter Interviews (mit Leitfaden und Auswertungsschema) ist dabei etwas höher als die unstrukturierter Interviews „aus dem Bauch heraus“. Telefoninterviews, die sich vor allem zur Vorauswahl und zum ersten Kennenlernen eignen, haben zwar eine etwas geringere Validität (.46), tragen aber dennoch substantiell über die kognitive Leistungsfähigkeit hinaus zur Validität bei.

Das wohl bekannteste und am besten erforschte Modell der Persönlichkeit ist das der „Big Five“, demzufolge sich die Persönlichkeit auf den fünf Dimensionen Extraversion, Verträglichkeit, Offenheit, Gewissenhaftigkeit und emotionale Stabilität beschreiben lässt. Die Studie zeigt, dass vor allem Gewissenhaftigkeit (u.a. Fleiß, Ordnungsliebe und Strukturiertheit) zur Validität der Auswahl beitragen kann. Die übrigen Dimensionen haben sehr geringe Einzelvaliditäten und/oder tragen nichts zur Validität über kognitive Fähigkeiten hinaus bei. Die Validität von Persönlichkeitsfragebögen kann allerdings durch Kontextualisierung der Fragen gesteigert werden.

Ein interessantes und unerwartetes Ergebnis ist das schlechte Abschneiden von Praktika und Arbeitsproben. Wer die klassische Studie von Schmidt und Hunter kennt, erinnert sich an die hohe Validität, die Arbeitsproben attestiert wurde. Diese wurde seinerzeit aber auf Basis von gerade einmal sieben Studien ermittelt. Berücksichtigt man die vielen neuen Studien der letzten Jahrzehnte, fällt das Ergebnis mit .33 deutlich moderater aus als bei Schmidt und Hunter (.54). Praktika sind zwar für sich genommen recht valide Auswahlinstrumente, sind aber sehr aufwendig und tragen nichts zur Validität über kognitive Leistungsfähigkeit hinaus bei. Kein Wunder: Wenn Intelligenz die Leistung im Job vorhersagt, dann natürlich auch die Leistung im Praktikum.

Das Schlusslicht bilden Graphologie (Analyse der Handschrift) und Alter. Die Annahme, die Handschrift lasse Rückschlüsse auf die Persönlichkeit eines Menschen zu, hat sich in der Forschung wiederholt als haltlos erwiesen, sie hängt allenfalls mit der Feinmotorik zusammen. Auch das Alter sagt nichts über die zu erwartende berufliche Leistung aus und sollte daher (und aus Gründen der Gleichbehandlung) keine Rolle bei der Personalauswahl spielen.

Was bedeutet das für die Praxis?

Die höchste Validität lässt sich mit einem kognitivem Leistungstest in Kombination mit einem strukturierten Interview oder einem Integritätstest erzielen. Bei der Wahl zwischen Interview und Integritätstest sollte aus Gründen der Candidate Experience dem Interview der Vorzug gegeben werden — zumal Interviews ohnehin Bestandteil nahezu jedes Auswahlprozesses sind. Sollten kognitive Leistungstests für die Auswahl nicht in Frage kommen (z. B. aus Sorge vor geringer Akzeptanz bei der Auswahl von Top-Managern), sollten Kriterien mit hoher Einzelvalidität, wie z.B. Interviews, Fachwissen oder Assessment Center herangezogen werden.

Employers must make hiring decisions; they have no choice about that. But they can choose which methods to use in making those decisions. (Schmidt, Oh, & Shaffer, 2016, p. 47)

In keinem Bereich der Personalarbeit liegen Wissenschaft und Praxis so weit auseinander wie in der Personalauswahl. So werden z. B. in Frankreich immer noch häufig graphologische Analysen bei der Auswahlentscheidung berücksichtigt. Aber auch hierzulande sind die Erkenntnisse der Wirtschaftspsychologie noch nicht flächendeckend in den Personalabteilungen angekommen. So werden Bewerber zum Beispiel nicht selten danach ausgewählt, ob sie „zum Unternehmen passen“. Wir hoffen, dass die Zusammenfassung der aktuellen Studienlage zum Transfer wissenschaftlicher Erkenntnisse in die Praxis und damit schlussendlich zu besseren Auswahlentscheidungen beiträgt.


Schmidt, F. L., Oh, I.-S., & Shaffer, J. A. (2016). The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 100 years of research findings. Working paper retrieved from www.researchgate.net. doi: 10.13140/RG.2.2.18843.26400

Wie ist Ihre Meinung?