Personaldiagnostik

Testverfahren in der Personaldiagnostik

Die gegenwärtige Personaldiagnostik und Laufbahnberatung ist Schauplatz allerlei psychologisch anmutender und zweifelhafter Verfahren, die massive Mängel aufweisen und deren Anwendung mehr als bedenklich ist.

Während die Risiken von älteren, psychologischen Verfahren zur Persönlichkeitserfassung und ihre pseudowissenschaftliche Grundlage den meisten Menschen wohlbekannt ist (zum Beispiel Rorschachtest, Graphologie, Phrenologie), ebenso wie darauf begründete Fehlentscheidungen, werden diese bei den neueren Verfahren (DISG, INSIGHTS MDI, MBTI um nur einige zu nennen) kaum hinreichend kritisch hinterfragt und erforscht. So wird leider immer häufiger offensichtlich, dass sich auch hinter den heute populären Hochglanztests der Personaldiagnostik unwissenschaftliche Verfahren verstecken, die nicht selten der Astrologie sehr ähnlich zu sein scheinen und keine fundierte, valide Grundlage für Entscheidungsprozesse bereitstellen. Victor Lau spricht in diesem Zusammenhang von „unheilvoller Managementesoterik“. Es scheint somit allmählich durchzusickern, dass diese Verfahren gravierende Mängel aufweisen. Dieser Artikel soll möglichst übersichtlich darstellen, worin die Problematik bei der Anwendung dieser Tests besteht und dazu auffordern, sie in der Personaldiagnostik und Beratung zumindest kritisch zu betrachten und stattdessen nach brauchbaren Alternativen zu suchen. Denn die Folgen dieser Entwicklung sind vielfältig und weitreichend. Hierzu zählen Fehleinschätzungen von Mitarbeitern und Klienten, was Unternehmen viel Geld kosten und Wettbewerbsnachteile nach sich ziehen kann, Fehlinvestitionen, ethische Fehltritte und falsche Hinweise für wichtige Entscheidungen.

Wie kann es sein, dass diese Verfahren dennoch so häufig zur Anwendung kommen und die meisten von ihnen (wie DISG, MBTI, INSIGHTS MDI) bereits zum Standardrepertoire in der Personaldiagnostik vieler Unternehmen gehören?

Die Antwort ist ebenso einfach wie effektvoll: das Mittel der Wahl ist starkes Marketing und einfache, gut verständliche Lösungen. Also: gut verpackte, bunte, ansprechende, alltagspsychologische Konzepte, mit denen sich leicht jonglieren lässt. Ein ansprechendes Marketing und eine gute Verpackung für die praktische Anwendung zu liefern ist zunächst einmal nichts Verwerfliches. Und tatsächlich finden sich durchaus weitere positive Aspekte für den Einsatz dieser Verfahren.

Ein wichtiger Punkt, der beachtet werden muss, betrifft ein allgemein anerkanntes Qualitätsmerkmal psychologischer Testverfahren: die Akzeptanz. Ein weit verbreitetes Verfahren ausgewählt zu haben, das sich offensichtlich gut etabliert hat und das eine so intuitiv zugängliche Lösung bietet, dass diese einfach richtig sein muss (Augenscheinvalidität), führt naturgemäß zu hoher Akzeptanz, nicht nur bei Bewerbern und Mitarbeitern, sondern auch bei Kollegen und Vorgesetzten. Außerdem von den meisten pseudowissenschaftlichen Testverfahren ebenfalls erfüllter Anspruch an ein Testverfahren: die Ökonomie. Meist sind diese Tests sehr leicht durchzuführen (sowohl in der Anwendung als auch was das inhaltliche Verständnis betrifft). Die Anwendung nimmt nicht viel Zeit in Anspruch und liefert augenscheinlich ein hilfreiches, ausführliches Ergebnis.

Natürlich sind all dies wichtige Voraussetzung für ein psychologisches Testverfahren, sie allein machen aber noch keinen guten Test!

Psychologische Effekte in der Personaldiagnostik

Die Herausgeber dieser Testverfahren profitieren des Weiteren von verschiedenen grundlegenden psychologischen Effekten. Der wichtigste hier zu nennende Effekt ist zweifelsohne der Barnumeffekt. Dieser beschreibt die Neigung von Menschen, vage, allgemeingültige, positiv formulierte Aussagen über die eigene Person als zutreffend zu akzeptieren. Typische Merkmale von Beschreibungen, bei denen dieser Effekt greift, sind nicht objektiv und vor allem nicht falsifizierbar. Sie treffen also auf die meisten Menschen zu und sind so vage formuliert, dass sie kaum zu widerlegen sind. Sie liefern allerdings auch keinen Erkenntnismehrwert. Irgendetwas Wahres werden sie immer enthalten.

​Und hier greift auch schon der nächste psychologische Effekt, dem wir Menschen uns nicht entziehen können. Es ist der Effekt der kognitiven Dissonanz, welche die Neigung bezeichnet, ein in sich stimmiges Selbst- und Weltbild aufzubauen und aufrechtzuerhalten. Hat man also einem Teil der Ergebnisse eines Tests schon einmal zugestimmt, interpretiert man den Rest ebenfalls als zutreffend. Des Weiteren wird selektiv nach Informationen gesucht, die das eingangs erhaltene Bild bestätigen. Der Mensch ist also sehr daran interessiert, die ihm dargebotenen Ergebnisse eines Tests für sich stimmig zu interpretieren und in sein eigenes Selbstbild zu integrieren, wodurch schon einmal eine lästige, gegenläufige Teilaussage unter den Teppich gekehrt werden kann. Und so zieht nun jeder aus der allgemeingültig formulierten Beschreibung die Facetten heraus, die seiner Meinung nach zu ihm passen.

Doch selbst wenn diese Testverfahren Ergebnisse liefern, die jeder Mensch gerne für sich annimmt, sind ihre Probleme nicht von der Hand zu weisen. Was genau sind diese Probleme im Einzelnen?

Werfen wir mal einen Blick auf die momentan am häufigsten eingesetzten Verfahren.

INSIGHTS MDI

Dieser Test besteht aus 4 großen Einheiten, die menschliches Verhalten erfassen sollen: Verhaltensweisen und -motive, Kompetenzen, Anforderungen der Situation. Daraus resultieren für diesen Test 8 Verhaltens- und 60 Mischtypen. Der wohl aussagekräftigste und bekannteste Kritikpunkt, der außerdem bezeichnend für alle der hier beleuchteten Testverfahren ist, dürfte wohl seine mangelnde theoretische Fundierung sein, die mittlerweile über 80 Jahre alt ist und nie empirisch nachgewiesen werden konnte. Würde ein Arzt Ihnen ein Medikament gegen Ihre Grippe verschreiben und Sie würden rein interessehalber einmal nachfragen, wie das denn eigentlich wirkt und wie schnell Sie wieder gesund sein werden und er würde Ihnen Folgendes antworten: „Wissen Sie, vor fast hundert Jahren lebte einmal ein Weiser, dem eines nachts eine Eingebung kam, dass dieser Wirkstoff eigentlich wunderbar an bestimmten Proteinen ansetzen und damit die Grippe heilen könnte. Es wurde zwar nie experimentell überprüft, ob und wie genau das eigentlich wirkt, aber bei einigen Leuten ist die Grippe tatsächlich nach kurzer Zeit weggegangen.“, würden Sie das Medikament nehmen? Wohl kaum. Würden Sie sich nicht fragen, was die Nebenwirkungen sein könnten? Und würden Sie nicht die Heilung einiger weniger Leute auf den Zufall schieben? Dieses Beispiel ist natürlich rein fiktiv, aber es zeigt doch deutlich, was eine mangelnde theoretische Fundierung bedeutet. So hat denn auch eine Integration von neuen Erkenntnissen aus der Biologie und Psychologie in die Theorie des INSIGHTS nie stattgefunden. Das Verfahren basiert auf der Klassifikation „Psychologische Typen“ von C. G. Jung (1921), sowie auf der Typologie Marstons „Emotions of Normal People“ (1928). In Fachkreisen gelten diese mittlerweile als theoretisch veraltet und empirisch nicht gesichert. Bereits ein erstes Gutachten hatte ergeben, dass es sich um ein „unbrauchbares Instrument [handelt], dessen schwache theoretische Fundierung durch eine fehlerhafte Operationalisierung verschlimmert wurde und keine partielle Verbesserung zulässt.“ (Jäger, 2004). An dieser Bewertung hat sich auch in folgenden Gutachten nichts verändert.

Nun könnte man annehmen, diese mangelhafte Grundlage wäre letztlich kein Ausschlusskriterium für einen Test, wenn er durchaus auch positive Effekte in manchen Fällen erzielen kann. Das Problem hierbei ist, dass diese positiven Effekte häufig einzig und allein auf den oben genannten psychologischen Effekten beruhen. Beispielhaft soll hier ein Satz aus dem Musterreport im INSIGHTS MDI-Internetauftritt zitiert werden: „[Bernd Muster] kann anderen gegenüber sowohl rücksichtsvoll als auch sehr direkt und forsch sein“ (s.o. Barnum Effekt). Natürlich kann ein Test außerdem auch rein zufällig mal einen Treffer landen oder tatsächlich dazu beitragen, dass Menschen beginnen, sich mit ihren intrinsischen Motiven auseinanderzusetzen. Für eine zielführende Personalarbeit oder auch erfolgreiche Karriereberatung ist er deshalb allerdings noch lange nicht geeignet. Eine mangelnde theoretische Grundlage bedeutet für den Test, dass er vorgibt, eine Eigenschaft zu messen, die als solche vielleicht gar nicht existiert. Dahinter könnte sich eine rein zufällige Stimmungslage verbergen, ein Bündel von bestimmten Teilen mehrerer Eigenschaften, die nicht systematisch zusammenhängen müssen oder einfach ein Persönlichkeitszug, der kein bisschen entscheidend für den Berufserfolg ist. So könnte es sein, dass eine Person eine Führungsposition zugeteilt bekommt, da sie durch den Test als ein bestimmter Typ „identifiziert“ wurde. Aufgrund der mangelnden Qualität des Testverfahrens könnte es sein, dass die Dimensionen, die abgefragt wurden, überhaupt nicht entscheidend für den Erfolg in dieser Position sind. Auch ist es möglich, dass sich der diagnostizierte Typ nicht bedeutend von einem anderen in dem Test beschriebenen Typus unterscheidet oder, dass die Unterschiede zwar an dem Tag vorhanden sind, sich aber sowieso von Tag zu Tag oder Jahr zu Jahr verändern. Es ist außerdem keineswegs gesichert, dass die durch den Test beschriebenen Typen überhaupt existieren, dass also die zugrundeliegenden Dimensionen überhaupt geeignet sind, um Menschen voneinander zu unterscheiden. Der Mischtyp aus den als blau und rot dargestellten Typen, wirkt zum Beispiel stark konstruiert. Die Merkmale strategisch und unentschlossen/sprunghaft bilden vollkommen gegensätzliche Orientierungen ab, gleichzeitig wirkt die Unterscheidung zwischen dem „Initiator“ und „Motivator“ sehr gestelzt und nicht plausibel. Die von dem Test postulierten Typen werden vage und oberflächlich beschrieben und weisen konzeptuelle Überschneidungen untereinander auf. Das Ergebnis des Einsatzes eines solchen Tests ist, dass Personen nicht in den für sie geeigneten Positionen landen und die Positionen folglich von dafür ungeeigneten Personen besetzt werden. Somit wird das Ziel der gesamten Personalarbeit vollkommen verfehlt und man könnte genauso gut Grundsätze einführen wie: „Wer zuerst kommt, mahlt zuerst“.

Weitere Probleme:

  • mangelnde Anzahl an Items:ein Test, der nur ein paar Minuten Bearbeitungszeit in Anspruch nimmt, kann keine umfassende Beschreibung von komplexen Zügen der Persönlichkeit liefern
  • Standards zur Testentwicklung wurden nicht eingehalten: Adaptationsstandards zur Übersetzung aus dem Englischen wurden ignoriert und es existiert kein den Standards entsprechendes Manual
  • somit keine Beschreibung über korrekte Durchführung des Tests + Interpretation der Ergebnisse, dies führt zu vollkommener Subjektivität
  • kein Peer-Review, also keine Überprüfung durch unabhängige Autoren

Wie kann dieses Verfahren trotzdem der DIN-Norm 33430 zur Qualitätssicherung und -optimierung in der Personaldiagnostik entsprechen?

Gib deinen Text hier ein …Dass ein solches Verfahren, wie oben beschrieben, überhaupt irgendeiner Norm entsprechen könnte, macht wohl stutzig. Und in der Tat ist hier Vorsicht geboten. Es muss dringend beachtet werden, dass die DIN Norm sich auf den gesamten Prozess der Personalauswahl bezieht und damit einzelne Tests gar nicht durch sie zertifiziert werden können.

DISG

Dieses Verfahren gehört wohl zu den bekanntesten Persönlichkeitstests in deutschen Unternehmen. Hier werden 4 Verhaltenstypen unterschieden: Dominant, Initiativ, Stetig, Gewissenhaft. Je nach Version existieren außerdem 15-20 Mischtypen. Die Typen werden ermittelt, indem der Proband verschiedene Eigenschaften auf einer Skala von 1-4 bewerten soll, inwieweit sie auf ihn zutreffen.

Der Test beruht, wie auch der INSIGHTS MDI, auf der Typologie Marstons. Diese wurde durch sozialpsychiatrische Beobachtungen an verhaltensgestörten Kindern und Gefängnisinsassen entwickelt und ist deshalb für den Unternehmenskontext gänzlich ungeeignet. Solche Konzepte dürfen niemals 1:1 von einem psychiatrischen in ein unternehmerisches Modell übertragen werden, sonst werden Äpfel mit Birnen verglichen.

Der DISG ist außerdem ein Paradebeispiel für ein wichtiges, viel zu wenig beachtetes Problem von Testgütekriterien (die eigentlich die Qualität diagnostischer Testverfahren sicherstellen sollen). Häufig werden bei den hier beschriebenen pseudopsychologischen Testverfahren die Gütekriterien nicht einfach weggelassen, im Gegenteil! Sie werden gerne genannt und ausgeschlachtet, da sie ja die Seriösität dieser so großartigen Verfahren vollkommen zweifelsfrei feststellen lassen. So ist es keineswegs. Irgendwelche Gütekriterien statistisch absichern zu lassen macht keinen guten Test. Nicht aussagekräftige statistische Kennzahlen aufzulisten, zeigt lediglich, dass die Bedeutung dieser kaum durchdrungen wurde. Hohe Konstruktvalidität beispielsweise zeigt nur, dass die Items das gleiche Etwas erfassen (was ja prinzipiell so sein sollte, wenn sie die gleiche Eigenschaft messen sollen). Ohne plausible Theorie allerdings, dass es sich bei diesem Etwas tatsächlich um das zu interessierende Merkmal handelt, ergibt auch eine hohe Konstruktvalidität wenig bis keinen Sinn. Auch hohe Retest-Reliabilitäten, die der Test durchaus aufweist, bedeuten einzig und allein, dass der Test bei wiederholter Anwendung sehr ähnliche Ergebnisse liefert (was natürlich ebenfalls notwendig ist, allerdings auch wieder Nonsens, wenn man nicht weiß, was tatsächlich gemessen wird und ob das, was man misst, tatsächlich relevant für die fragliche Position/den Beruf etc. ist). Dagegen wirklich wichtig wäre das Kriterium der berufsbezogenen Prognosevalidität. Dies ist doch das, was eigentlich interessiert: wie hängt denn nun z.B. das Ergebnis des Tests mit Zufriedenheit/Beförderungen/Gehalt etc. in ein paar Jahren zusammen? Genau das wird aber beim DISG und auch allen anderen Verfahren schlichtweg ignoriert.

Dies ist der Punkt, warum die vorliegenden Verfahren ungeeignet für die Personaldiagnostik, -auswahl und -entwicklung sind. Hier sollen Entscheidungen getroffen werden, die zum Erfolg des Unternehmens und seinen Mitarbeitern beitragen. Dies wird nicht der Fall sein, wenn Entscheidungen auf einer Grundlage fußen, bei der nicht gesichert ist, dass die erfassten Konstrukte überhaupt relevante und stabile Eigenschaften einer Person erfassen. Die vom DISG dargestellten Verhaltensweisen sind zwar bekannt und es ist wahrscheinlich, dass man sie bei vielen Menschen vorfinden wird. Jedoch ist keineswegs ersichtlich, warum ausgerechnet diese ausschlaggebend sein sollten, um zwischen mehreren Individuen zu unterscheiden und sie bestimmten Positionen/Berufen zuzuordnen. Die dargestellten Typen sind also beliebig und es könnten genauso gut andere gefunden werden. Ein Test, der eine Eigenschaft erfasst, die vielleicht intuitiv passend erscheint, aber nicht tatsächlich zum Erfolg in einer bestimmten Position beiträgt oder der irgendetwas abbildet, was eventuell von Tag zu Tag oder über Jahre zu stark variiert, ist gelinde gesagt vollkommen unbrauchbar (s.o.: INSIGHTS MDI).

Weitere Probleme:

  • auch hier: übertriebene Reduzierung des komplexen Persönlichkeitsmodells auf 4 Typen, sowie vage und oberflächliche Beschreibung der Typen und konzeptuelle Überschneidungen zwischen ihnen (stetig vs. gewissenhaft)

MBTI: Myers-Briggs Typenindikator

Der MBTI weist alle Probleme der zuvor beschriebenen Verfahren auf und besitzt dabei eine fast noch schwächere theoretische Grundlage und stellt gewissermaßen das i-Tüpfelchen im Dschungel der pseudopsychologischen Testverfahren dar. Er beruht auf der Typenlehre C. G. Jungs (s.o.) und wurde daran anschließend von Katherine Briggs und ihrer Tochter Isabel Myers-Briggs modifiziert und intuitiv weiterentwickelt. Sie haben aus 4 Gegensatzpaaren 16 Typen gebildet, ebenfalls ohne weitere theoretische Fundierung. Diese 16 Typen sind ebenso wohlwollend wie schwammig formuliert, was wieder zu hoher Akzeptanz und gleichzeitig keinerlei Aussagekraft führt. Hier kommt der eingangs beschriebene Barnum-Effekt wohl am beeindruckendsten zur Geltung (Beispiel Typ ESTP: „Beschäftigen sich mit Mathematik und Naturwissenschaft, wenn sie es für notwendig ansehen.“, Typ ESFJ: „Arbeiten am besten, wenn man sie ermutigt und lobt.“).

Weitere Probleme:

  • Re-Test-Reliabilitäten: äußerst variabel
  • keine Angaben zur Konstrukt- und Prognosevalidität
  • erschreckend breites Einsatzspektrum (auch für persönliche Partnerschaftsfragen): keine spezifische Anpassung an den Unternehmenskontext
  • Typen: priorisierte subjektive Modalitäten und Verhaltensweisen statt Diagnostik von Fähigkeiten oder Eigenschaften
  • viele Items werden für mehrere Typen eingesetzt, einige Typen unterscheiden sich quasi nicht (Beispiel: ENFP und ENTP)

Viele Probleme der in der Personaldiagnostik eingesetzten Verfahren werden übereinstimmend bei den meisten von ihnen gefunden. Sie scheitern oft bereits an basalen Vorgaben der Testkonstruktion. Dies führt dazu, dass die Verfahren meist nicht einmal das messen, was sie zu messen vorgeben und damit jedwede Aussagekraft verlieren. Außerdem messen sie das, was sie messen, nicht reliabel, das heißt nicht zuverlässig über die Zeit und bei wiederholter Messung (Menschen werden also beispielsweise an verschiedenen Tagen verschiedenen Typen zugeordnet), was es somit nicht nur unmöglich macht, die Testwerte eines einzigen Individuums sinnvoll zu interpretieren sondern auch noch, zwischen mehreren Individuen zu vergleichen. Was wiederum die gesamte Aussagekraft dieser Tests ad absurdum führt.

Ist unsere einzige Möglichkeit nun die Rückkehr zum Pendel oder Würfel? Gibt es bereits Alternativen?

Es lassen sich fundiertere Verfahren finden, aber nach diesen muss gezielter gesucht werden, da sie meist von Hochschulen/Forschungsinstituten konzipiert und weniger gut vermarktet werden. Außerdem muss sich meines Erachtens intensiver mit den doch komplexeren Ergebnissen beschäftigt werden, um Verständnis und Akzeptanz bei dem Befragten sicherzustellen. Dies sollte allerdings nicht der Grund sein, auf unsichere Verfahren zurückzugreifen. Der BIP (Bochumer Inventar zur berufsbezogenen Persönlichkeitsbeschreibung) und das Hamburger Führungsmotivationsinventar sind meines Erachtens valide Verfahren, die in der Personaldiagnostik sowie auch beim Coaching und in der Karriereberatung äußerst hilfreiche Instrumente sind, um beispielsweise bei Beförderungsentscheidungen eine Unter- oder Überforderung zu vermeiden, Entwicklungspotentiale festzustellen oder eine geringe Passung zum Team/Chef/Firmenkultur etc. zu verhindern. Diese Testfahren sind zumindest eine sehr wertvolle Ergänzung, wenn sichergestellt ist, dass die Interpretation der Ergebnisse nicht überstrapaziert wird und bodenständig durchgeführt wird.

BIP

Dieser Test wurde spezifisch für den Berufskontext konzipiert, somit enthält er auch nur relevante Items und wirft keine ethischen oder rechtlichen Probleme bei seinem Einsatz auf. Die Normierung des Tests ist ebenfalls zielgruppenspezifisch, also an Berufstätigen, was eine gute Vergleichsmöglichkeit schafft. Er besteht aus 210 Items, was einerseits mehr Aufwand bedeutet, andererseits der Komplexität der Persönlichkeit eher gerecht wird und somit umfangreiche Ergebnisse liefern kann, die sich an den tatsächlich abgefragten Verhaltensweisen orientieren und nicht auf simplen subjektiven Interpretationen beruhen. Seine Gütekriterien sind veröffentlicht und zugänglich (was offenbar keine Selbstverständlichkeit ist) und durch umfangreiche Stichproben erfasst worden. Somit kann davon ausgegangen werden, dass das Verfahren das misst, was es zu messen vorgibt (was ebenfalls die Grundvoraussetzung für den Einsatz eines Tests sein sollte, da ansonsten ebenso gut geraten oder gewürfelt werden könnte). Es existiert außerdem ein ergänzendes Verfahren der Fremdbeurteilung, womit der Komplexität Rechnung getragen wird und ebenso der Tatsache, dass Selbstbeurteilungstests immer Raum für Verzerrungstendenzen und Antworten im Sinne sozialer Erwünschtheit bieten.

Hamburger Führungsmotivationsinventar

Das Verfahren wurde konzipiert, um das Führungsmotiv des Probanden zu erfassen. Dieses bezeichnet den individuellen Antrieb, Führungsverantwortung im beruflichen Kontext zu übernehmen. Damit ist das Verfahren wie der BIP konkret für den Unternehmenskontext konzipiert und angepasst. Die Prognosevalidität ergab deutliche Zusammenhänge mit tatsächlichem Führungsverhalten und es konnte gezeigt werden, dass Führungskräfte eine höhere Führungsmotivation zeigen als Angestellte. Somit kann die theoretische Fundierung über die Testgütekriterien abgesichert werden. Durch verschiedene Normstichproben ist es möglich, gezielte Vergleiche anzustellen. Der Nachteil dieser Testverfahren liegt darin, dass es durch ein nicht so ausgereiftes Marketingkonzept an Übersichtlichkeit und Eindrucksstärke fehlt. Zur verstärkten Implementierung in der Praxis wäre ein ansprechendes Design hilfreich. Nun wurde das Problem umfangreich dargestellt und Kritik und Lob nicht nur ausgesprochen, sondern umfassend dargelegt.

Was soll nun die Quintessenz sein?

In der Personaldiagnostik sollte man meiner Meinung nach die Finger lassen von schillernden Hochglanztests, die alles und nichts versprechen. Es mag zwar durchaus korrekt sein, dass die oben beschriebenen Tests für eine Reflexion der eigenen Vorlieben und Verhaltensweisen im privaten Bereich geeignet sein können und einen Ansatzpunkt darstellen, um Persönlichkeitszüge überhaupt erst benennen zu können und zum Gegenstand von Kommunikation zu machen. Dieser Gewinn ist in der Tat nicht zu unterschätzen, denn der führt auch dazu, dass die Wahrnehmung von menschlichen Eigenschaften differenzierter wird, wenn man Begriffe für etwas hat.

Diese Pluspunkte können die offensichtlichen Mängel allerdings nicht einfach verschwinden lassen. Der Mehrwert, den sie scheinbar für das Unternehmen bieten und die illusorische Hilfe für Entscheidungssituationen in der Personaldiagnostik, im Coaching und in der Laufbahnberatung, entpuppen sich bei genauerem Hinsehen als sehr warme Luft. Die hohe Akzeptanz dieser Verfahren bei Personalern, Mitarbeitern, Kollegen und Klienten, die zu einem Großteil durch die oben beschriebenen psychologischen Effekte zustande kommt, sollte nicht der Grund dafür sein, Testverfahren zu akzeptieren und anzuwenden, die keineswegs valide und belastbar sind. Denn durch die bereits dargelegten Mängel werden Entscheidungen höchstens minimal über dem Zufallsniveau getroffen.

Obwohl es verlockend ist, einfache, überzeugend erscheinende Verfahren zu benutzen, ist es notwendig, der Komplexität von Prognosen, Persönlichkeitskriterien und Personalentscheidungen in diesem Zusammenhang Rechnung zu tragen und sich genauer und tiefer mit dem Thema Personaldiagnostik zu beschäftigen, um eine belastbare Entscheidungsgrundlage zu schaffen. Wichtig ist eine detaillierte Auseinandersetzung mit der Frage, welches Verfahren wozu eingesetzt werden soll und die passenden Verfahren an der richtigen Stelle einzusetzen. Hierzu ist allgemeines diagnostisches Wissen, sowie Wissen über die Korrelate von Persönlichkeitsmerkmalen und die Stabilität dieser Eigenschaften dringend notwendig.

Alles in allem ist es äußerst erfreulich, dass wir eine Richtung weg von Handschriften- und Schädeldeutung im beruflichen Kontext bereits eingeschlagen haben. Dies kann aber nur einen ersten Schritt darstellen, um vertrauensvolle Empfehlungen auszusprechen und gewissenhafte Entscheidungen zu treffen. Lassen Sie uns hier nicht stehen bleiben.

Bild © Everett Collection/shutterstock​