05. Mai 2017

100 Jahre Forschung: Das sind die besten Personalauswahl-Methoden


Die Vali­di­tät von Aus­wahl­ver­fah­ren wird seit ca. 100 Jah­ren erforscht. Eine neue Stu­die zeigt, was funk­tio­niert und was nicht.

Die Wirt­schafts­psy­cho­lo­gie beschäf­tigt sich schon lan­ge mit der Fra­ge, wie sich beruf­li­che Leis­tung vor­her­sa­gen lässt. Die wohl bekann­tes­te Unter­su­chung zu die­sem The­ma stammt von Schmidt und Hun­ter aus dem Jahr 1998. Die Auto­ren fass­ten frü­he­re Stu­di­en­ergeb­nis­se in einer soge­nann­ten Meta-Ana­ly­se zusam­men, um so zu all­ge­mein­gül­ti­gen Aus­sa­gen dar­über zu kom­men, wel­che Aus­wahl­me­tho­den funk­tio­nie­ren und wel­che nicht. Knapp 20 Jah­re spä­ter haben die US-For­scher Schmidt, Oh und Shaf­fer eine neue Unter­su­chung vor­ge­legt, die sie der Fach­welt nun als Working Paper zur Ver­fü­gung gestellt haben. Die aktu­el­le Stu­die:

  • beinhal­tet neue Daten aus der For­schung der letz­ten 20 Jah­re,
  • berück­sich­tigt for­schungs-metho­di­sche Fort­schrit­te und lie­fert daher genaue­re Ergeb­nis­se,
  • beinhal­tet neue und damals nicht berück­sich­tig­te Aus­wahl­me­tho­den und -kri­te­ri­en, wie z.B. Tele­fon­in­ter­views und Schul­no­ten.

Bevor wir die wich­tigs­ten Erkennt­nis­se der neu­en Stu­die vor­stel­len, möch­ten wir kurz dar­auf ein­ge­hen, was Vali­di­tät ist und wozu sie wich­tig ist.

Was ist Validität?

Die (pro­gnos­ti­sche) Vali­di­tät eines Aus­wahl­ver­fah­rens sagt etwas dar­über aus, wie gut es die spä­te­re beruf­li­che Leis­tung eines Bewer­bers vor­her­sa­gen kann. Vali­di­tä­ten wer­den in der Regel als Zahl zwi­schen 0 und 1 ange­ge­ben. Ein Wert von 0 bedeu­tet, dass zwi­schen dem Aus­wahl­in­stru­ment und der spä­te­ren Leis­tung kein Zusam­men­hang besteht, man also genau­so­gut nach Zufalls­prin­zip aus­wäh­len könn­te. Bei einem Wert von 1 wäre der Zusam­men­hang zwi­schen Aus­wahl­in­stru­ment und Leis­tung per­fekt, was in der Rea­li­tät aber nicht vor­kommt. Die höchs­te prak­tisch erreich­ba­re Vali­di­tät liegt der­zeit bei 0,78 (was in der Fach­spra­che meist als .78 ange­ge­ben wird).

Wozu ist Validität wichtig?

Die Vali­di­tät gibt den Zusam­men­hang zwi­schen dem Aus­wahl­kri­te­ri­um (z. B. Punk­te im Test oder Schul­no­te) und der spä­te­ren Leis­tung wider, was sich am bes­ten gra­phisch ver­an­schau­li­chen lässt. Schwa­che Zusam­men­hän­ge sehen kreis­för­mig aus (lin­ke Gra­fik), star­ke Zusam­men­hän­ge ellip­sen­för­mig (rech­te Gra­fik). Gehen wir zur Ver­ein­fa­chung davon aus, dass ein Bewer­ber ent­we­der geeig­net oder unge­eig­net ist und er ent­we­der ein­ge­stellt oder abge­lehnt wird. Wir kön­nen bei der Aus­wahl nun zwei rich­ti­ge und zwei fal­sche Ent­schei­dun­gen tref­fen: Rich­tig ist es, einen geeig­ne­ten Bewer­ber ein­zu­stel­len und einen unge­eig­ne­ten abzu­leh­nen. Falsch ist es, einen geeig­ne­ten Bewer­ber abzu­leh­nen und einen unge­eig­ne­ten Bewer­ber ein­zu­stel­len.

Validitaet

Wenn unser Aus­wahl­ver­fah­ren eine gerin­ge Vali­di­tät hat, kann es nur schlecht zwi­schen geeig­ne­ten und unge­eig­ne­ten Bewer­bern unter­schei­den, es kommt also zu mehr Fehl­ent­schei­dun­gen. So sind in der lin­ken Gra­fik von 50 ein­ge­stell­ten Bewer­bern nur 28 für die Stel­le geeig­net; eine Tref­fer­quo­te von gera­de ein­mal 56 Pro­zent. Nut­zen wir hin­ge­gen ein hoch vali­des Ver­fah­ren (rech­te Gra­fik), tref­fen wir mehr rich­ti­ge Ent­schei­dun­gen: Unter den 50 ein­ge­stell­ten Bewer­bern sind nur noch 8 unge­eig­net, die Tref­fer­quo­te ist auf 84 Pro­zent gestie­gen.

Vali­de Aus­wahl­ver­fah­ren sind auch finan­zi­ell von Vor­teil: Der Grund, wie­so wir über­haupt Per­so­nal­aus­wahl betrei­ben, ist, dass Men­schen mit ver­schie­de­nen Eigen­schaf­ten und Fähig­kei­ten unter­schied­lich gute Leis­tun­gen im Job erbrin­gen (denn wür­den alle die glei­che Leis­tung erbrin­gen, könn­ten wir uns jedes Aus­wahl­ver­fah­ren spa­ren). Schät­zun­gen zufol­ge liegt der Leis­tungs­un­ter­schied zwi­schen einem über- und einem unter­durch­schnitt­li­chen Stel­len­in­ha­ber bei ca. 80% eines Jah­res­ge­halts. Bei einem Jah­res­ge­halt von 40.000 € erwirt­schaf­tet ein über­durch­schnitt­li­cher Mit­ar­bei­ter somit 32.000 € mehr Out­put als ein Unter­durch­schnitt­li­cher. Mit ande­ren Wor­ten: je höher die Vali­di­tät des Aus­wahl­ver­fah­rens, umso grö­ßer der zu erwar­ten­de finan­zi­el­le Nut­zen.

Das sind die besten und schlechtesten Auswahlverfahren

Die Tabel­le gibt eine Über­sicht über die Vali­di­tä­ten der ver­schie­de­nen Aus­wahl­ver­fah­ren und -kri­te­ri­en, die in den letz­ten 100 Jah­ren erforscht wur­den. Die Spal­te „Vali­di­tät (ein­zeln)“ gibt die Vali­di­tät an, wenn nur die­ses Kri­te­ri­um genutzt wird. Die Spal­te „Vali­di­tät (mit Intel­li­genz)“ gibt an, wie hoch die Vali­di­tät ist, wenn man das jewei­li­ge Kri­te­ri­um zusam­men mit Intel­li­genz zur Aus­wahl nutzt. Die letz­te Spal­te gibt die zusätz­li­che (sog. inkre­men­tel­le) Vali­di­tät an. Die­se zeigt, wie viel Vali­di­tät das Aus­wahl­kri­te­ri­um über Intel­li­genz hin­aus bei­trägt. (Anmer­kung: In der Stu­die wur­den noch wei­te­re Aus­wahl­kri­te­ri­en sowie Zusam­men­hän­ge zum Trai­nings­er­folg unter­sucht, wor­auf hier der Über­sicht hal­ber ver­zich­tet wird.)

 

Validitaetstabelle

Das bes­te Aus­wahl­kri­te­ri­um sind die kogni­ti­ven Fähig­kei­ten (oder all­ge­mei­ne Intel­li­genz) des Bewer­bers. Vor allem bei kom­ple­xen Jobs hän­gen kogni­ti­ve Fähig­kei­ten und Berufs­er­folg stark mit­ein­an­der zusam­men, aber auch bei mitt­le­ren und weni­ger kom­ple­xen Tätig­kei­ten ist Intel­li­genz für die Leis­tung von Vor­teil. Die For­scher erklä­ren den Effekt damit, dass klü­ge­re Per­so­nen über mehr job-bezo­ge­nes Wis­sen ver­fü­gen und sich neu­es Wis­sen schnel­ler aneig­nen kön­nen. Intel­li­genz hilft außer­dem dabei, kom­ple­xe Zusam­men­hän­ge zu ver­ste­hen und wich­ti­ge von unwich­ti­gen Infor­ma­tio­nen zu tren­nen. Intel­li­gen­te­re Per­so­nen kön­nen daher bes­se­re Stra­te­gi­en ent­wi­ckeln und bes­se­re Ent­schei­dun­gen tref­fen.

Inte­gri­täts­tests neh­men eben­falls eine beson­de­re Rol­le ein, da sie die höchs­te zusätz­li­che Vali­di­tät (.13) über kogni­ti­ve Leis­tungs­fä­hig­keit hin­aus lie­fern. Bei der­ar­ti­gen Tests wer­den Bewer­ber gefragt, ob sie bei frü­he­ren Arbeit­ge­bern durch Fehl­ver­hal­ten, wie z. B. Alko­hol, Dieb­stahl oder län­ge­re Fehl­zei­ten auf­ge­fal­len sind. Ein offen­sicht­li­ches Pro­blem der­ar­ti­ger Tests ist die Wir­kung auf den Bewer­ber, der sol­che Fra­gen leicht als feind­li­che Unter­stel­lung wahr­neh­men könn­te. Es ist daher kein Wun­der, dass Inte­gri­täts­tests im deutsch­spra­chi­gen Raum eher sel­ten zum Ein­satz kom­men.

Glück­li­cher­wei­se schnei­den Inter­views fast genau­so gut ab. Die zusätz­li­che Vali­di­tät struk­tu­rier­ter Inter­views (mit Leit­fa­den und Aus­wer­tungs­sche­ma) ist dabei etwas höher als die unstruk­tu­rier­ter Inter­views „aus dem Bauch her­aus“. Tele­fon­in­ter­views, die sich vor allem zur Vor­auswahl und zum ers­ten Ken­nen­ler­nen eig­nen, haben zwar eine etwas gerin­ge­re Vali­di­tät (.46), tra­gen aber den­noch sub­stan­ti­ell über die kogni­ti­ve Leis­tungs­fä­hig­keit hin­aus zur Vali­di­tät bei.

Das wohl bekann­tes­te und am bes­ten erforsch­te Modell der Per­sön­lich­keit ist das der „Big Five“, dem­zu­fol­ge sich die Per­sön­lich­keit auf den fünf Dimen­sio­nen Extra­ver­si­on, Ver­träg­lich­keit, Offen­heit, Gewis­sen­haf­tig­keit und emo­tio­na­le Sta­bi­li­tät beschrei­ben lässt. Die Stu­die zeigt, dass vor allem Gewis­sen­haf­tig­keit (u.a. Fleiß, Ord­nungs­lie­be und Struk­tu­riert­heit) zur Vali­di­tät der Aus­wahl bei­tra­gen kann. Die übri­gen Dimen­sio­nen haben sehr gerin­ge Ein­zel­va­li­di­tä­ten und/oder tra­gen nichts zur Vali­di­tät über kogni­ti­ve Fähig­kei­ten hin­aus bei. Die Vali­di­tät von Per­sön­lich­keits­fra­ge­bö­gen kann aller­dings durch Kon­tex­tua­li­sie­rung der Fra­gen gestei­gert wer­den.

Ein inter­es­san­tes und uner­war­te­tes Ergeb­nis ist das schlech­te Abschnei­den von Prak­ti­ka und Arbeits­pro­ben. Wer die klas­si­sche Stu­die von Schmidt und Hun­ter kennt, erin­nert sich an die hohe Vali­di­tät, die Arbeits­pro­ben attes­tiert wur­de. Die­se wur­de sei­ner­zeit aber auf Basis von gera­de ein­mal sie­ben Stu­di­en ermit­telt. Berück­sich­tigt man die vie­len neu­en Stu­di­en der letz­ten Jahr­zehn­te, fällt das Ergeb­nis mit .33 deut­lich mode­ra­ter aus als bei Schmidt und Hun­ter (.54). Prak­ti­ka sind zwar für sich genom­men recht vali­de Aus­wahl­in­stru­men­te, sind aber sehr auf­wen­dig und tra­gen nichts zur Vali­di­tät über kogni­ti­ve Leis­tungs­fä­hig­keit hin­aus bei. Kein Wun­der: Wenn Intel­li­genz die Leis­tung im Job vor­her­sagt, dann natür­lich auch die Leis­tung im Prak­ti­kum.

Das Schluss­licht bil­den Gra­pho­lo­gie (Ana­ly­se der Hand­schrift) und Alter. Die Annah­me, die Hand­schrift las­se Rück­schlüs­se auf die Per­sön­lich­keit eines Men­schen zu, hat sich in der For­schung wie­der­holt als halt­los erwie­sen, sie hängt allen­falls mit der Fein­mo­to­rik zusam­men. Auch das Alter sagt nichts über die zu erwar­ten­de beruf­li­che Leis­tung aus und soll­te daher (und aus Grün­den der Gleich­be­hand­lung) kei­ne Rol­le bei der Per­so­nal­aus­wahl spie­len.

Was bedeutet das für die Praxis?

Die höchs­te Vali­di­tät lässt sich mit einem kogni­ti­vem Leis­tungs­test in Kom­bi­na­ti­on mit einem struk­tu­rier­ten Inter­view oder einem Inte­gri­täts­test erzie­len. Bei der Wahl zwi­schen Inter­view und Inte­gri­täts­test soll­te aus Grün­den der Can­di­da­te Expe­ri­ence dem Inter­view der Vor­zug gege­ben wer­den — zumal Inter­views ohne­hin Bestand­teil nahe­zu jedes Aus­wahl­pro­zes­ses sind. Soll­ten kogni­ti­ve Leis­tungs­tests für die Aus­wahl nicht in Fra­ge kom­men (z. B. aus Sor­ge vor gerin­ger Akzep­tanz bei der Aus­wahl von Top-Mana­gern), soll­ten Kri­te­ri­en mit hoher Ein­zel­va­li­di­tät, wie z.B. Inter­views, Fach­wis­sen oder Assess­ment Cen­ter her­an­ge­zo­gen wer­den.

Employ­ers must make hiring deci­si­ons; they have no choice about that. But they can choo­se which methods to use in making tho­se deci­si­ons. (Schmidt, Oh, & Shaf­fer, 2016, p. 47)

In kei­nem Bereich der Per­so­nal­ar­beit lie­gen Wis­sen­schaft und Pra­xis so weit aus­ein­an­der wie in der Per­so­nal­aus­wahl. So wer­den z. B. in Frank­reich immer noch häu­fig gra­pho­lo­gi­sche Ana­ly­sen bei der Aus­wahl­ent­schei­dung berück­sich­tigt. Aber auch hier­zu­lan­de sind die Erkennt­nis­se der Wirt­schafts­psy­cho­lo­gie noch nicht flä­chen­de­ckend in den Per­so­nal­ab­tei­lun­gen ange­kom­men. So wer­den Bewer­ber zum Bei­spiel nicht sel­ten danach aus­ge­wählt, ob sie „zum Unter­neh­men pas­sen“. Wir hof­fen, dass die Zusam­men­fas­sung der aktu­el­len Stu­di­en­la­ge zum Trans­fer wis­sen­schaft­li­cher Erkennt­nis­se in die Pra­xis und damit schluss­end­lich zu bes­se­ren Aus­wahl­ent­schei­dun­gen bei­trägt.


Schmidt, F. L., Oh, I.-S., & Shaf­fer, J. A. (2016). The vali­di­ty and uti­li­ty of selec­tion methods in per­son­nel psy­cho­lo­gy: Prac­tical and theo­reti­cal impli­ca­ti­ons of 100 years of rese­arch fin­dings. Working paper retrie­ved from www.researchgate.net. doi: 10.13140/RG.2.2.18843.26400

Wie ist Ihre Meinung?