Verhaltensverankerte Bewertungsskalen (BARS – Behaviorally Anchored Rating Scales) sind ein strukturiertes Beurteilungsinstrument, das jede Leistungsstufe mit konkreten, beobachtbaren Verhaltensbeschreibungen verknüpft. Sie machen Personalbeurteilungen objektiver, vergleichbarer und weniger anfällig für Unconscious Bias. BARS eignen sich besonders für strukturierte Interviews, Assessment Center und Mitarbeitergespräche.
Was sind verhaltensverankerte Bewertungsskalen (BARS)?
Verhaltensverankerte Bewertungsskalen wurden 1963 von den Psychologinnen Patricia Cain Smith und Lorne Kendall entwickelt und erstmals im Journal of Applied Psychology veröffentlicht. Ihr Ziel war es, die Subjektivität klassischer Leistungsbeurteilungen zu reduzieren – ein Problem, das bis heute im HR-Alltag allgegenwärtig ist.
Bei klassischen Ratingskalen wählen Beurteiler:innen zwischen abstrakten Kategorien wie „sehr gut", „befriedigend" oder „ungenügend". Was genau eine „sehr gute" Kommunikationsfähigkeit ausmacht, bleibt dabei offen – und wird von Person zu Person unterschiedlich interpretiert. BARS lösen dieses Problem: Jede Stufe einer Skala wird durch einen Verhaltensanker definiert, also eine konkrete, beobachtbare Beschreibung typischen Verhaltens. Beurteiler:innen müssen nicht mehr interpretieren – sie gleichen beobachtetes Verhalten mit vordefinierten Ankerpunkten ab.
Damit erhöhen BARS die Interrater-Reliabilität – das Ausmaß, in dem verschiedene Beurteiler:innen beim gleichen Kandidaten oder der gleichen Mitarbeiterin zu übereinstimmenden Ergebnissen kommen. Das ist nicht nur ein Qualitätsmerkmal fairer Personalarbeit, sondern auch eine wichtige Grundlage für rechtssichere Dokumentation von Auswahlentscheidungen.
Aufbau und Komponenten: Wie funktioniert BARS?
Eine verhaltensverankerte Bewertungsskala besteht aus zwei Grundelementen:
1. Kompetenzdimensionen: Die Leistungsbereiche, die bewertet werden sollen – zum Beispiel Kommunikationsfähigkeit, Problemlösungskompetenz, Teamfähigkeit oder Kundenorientierung. Diese Dimensionen werden spezifisch für die jeweilige Rolle definiert und basieren auf einer sorgfältigen Anforderungsanalyse.
2. Verhaltensanker: Für jede Kompetenzdimension werden konkrete Verhaltensbeispiele formuliert und den Stufen der Skala zugeordnet. Typisch sind fünf Stufen – von deutlich unterdurchschnittlichem bis zu herausragendem Verhalten.
Beispiel: BARS-Skala für die Kompetenz „Kommunikationsfähigkeit"
Dieses Beispiel zeigt: Nicht die subjektive Einschätzung „gut" oder „schlecht" steht im Mittelpunkt, sondern das konkret beobachtbare Verhalten. Das macht Bewertungen nachvollziehbar, anfechtbar und lernbar.
Schritt-für-Schritt: So entwickelst du eine BARS-Skala
Die Entwicklung verhaltensverankerter Bewertungsskalen ist aufwendig – dieser Nachteil sollte bei der Entscheidung für das Instrument ehrlich berücksichtigt werden. Für eine einzelne Kompetenz sind in der Regel mehrere Arbeitsstunden einzuplanen, für ein vollständiges Anforderungsprofil mit fünf bis acht Dimensionen entsprechend mehr. Dafür zahlt sich die Investition durch dauerhaft belastbare Beurteilungen aus.
Phase 1: Anforderungsanalyse und Dimensionen definieren
Kläre zunächst, welche Kompetenzen für die jeweilige Rolle entscheidend sind. Basis ist ein valides Anforderungsprofil, das du am besten gemeinsam mit Führungskräften und erfahrenen Stelleninhabenden entwickelst. Pro Rolle empfehlen sich fünf bis acht Dimensionen – mehr macht die Beurteilung unhandlich.
Phase 2: Kritische Ereignisse sammeln
Befrage Personen, die die Rolle gut kennen – sowohl Führungskräfte als auch erfahrene Mitarbeitende: „Beschreibe eine Situation, in der jemand in diesem Bereich besonders effektiv war – und eine, in der jemand deutlich unterdurchschnittlich abgeschnitten hat." Diese Methode geht auf die Kritische-Ereignis-Technik zurück und liefert das Rohmaterial für die späteren Verhaltensanker.
Phase 3: Verhaltensanker formulieren
Die gesammelten Ereignisse werden verdichtet und in klare Verhaltensaussagen überführt. Wichtig: Die Anker müssen beobachtbar, konkret und eindeutig formuliert sein – nicht bewertend oder interpretierend. „Geht offen auf Kolleginnen und Kollegen zu" ist ein guter Anker; „ist ein Teamplayer" ist keiner.
Phase 4: Retranslation und Validierung
Ein Kernschritt der BARS-Methodik ist die sogenannte Retranslation: Unabhängige Personen, die nicht an der Entwicklung beteiligt waren, ordnen die formulierten Verhaltensanker blind den richtigen Kompetenzdimensionen zu. Nur Anker, die klar und konsistent zugeordnet werden, kommen ins finale Instrument. Dieser Schritt sichert die inhaltliche Validität der Skala.
Phase 5: Kalibrierung und Schulung
Bevor BARS im Einsatz ist, sollten alle Beurteiler:innen geschult werden – idealerweise anhand konkreter Übungsszenarien. Kalibrierungsrunden, in denen alle dasselbe Beispielverhalten bewerten und die Ergebnisse besprechen, erhöhen die Interrater-Reliabilität erheblich.
Vorteile und Grenzen von BARS im Überblick
Stärken: Objektivität, Bias-Reduktion, Rechtssicherheit
Der größte Vorteil verhaltensverankerter Bewertungsskalen liegt in ihrer Fähigkeit, häufige Beurteilungsfehler und Unconscious Bias zu reduzieren. Klassische Effekte wie der Halo-Horns-Effekt – bei dem ein positiver Gesamteindruck alle Einzelbewertungen verfärbt – werden abgeschwächt, weil jede Dimension separat und anhand konkreter Verhaltensbeschreibungen beurteilt wird. Gleiches gilt für den Recency-Effekt (jüngste Ereignisse werden übergewichtet) oder den Affinity Bias (sympathische Personen werden systematisch besser bewertet).
Weitere Stärken:
- Rechtssicherheit: Beurteilungen sind nachvollziehbar dokumentiert und können bei Bedarf begründet werden.
- Entwicklungsförderlichkeit: Mitarbeitende erhalten klares, verhaltensorientiertes Feedback, das konkrete Ansätze zur Verbesserung liefert.
- Akzeptanz: Verhaltensbasierte Rückmeldungen werden von Betroffenen häufig als fairer empfunden als abstrakte Einschätzungen.
Limitationen: Entwicklungsaufwand und Rollenbindung
BARS sind rollenspezifisch – eine Skala für den Vertriebsinnendienst lässt sich nicht eins zu eins auf eine Führungsposition übertragen. Das macht sie aufwendig in der Entwicklung und in der Pflege. Unternehmen sollten zudem einplanen, dass die Anker bei veränderten Rollenanforderungen – etwa durch Digitalisierung oder Umstrukturierung – überarbeitet werden müssen.
Außerdem ersetzen BARS keine Beurteiler:innen-Schulungen: Das Instrument reduziert Bias, eliminiert ihn aber nicht vollständig. Regelmäßige Kalibrierungsrunden bleiben auch nach der Einführung wichtig.
BARS in der Praxis: Assessment Center und strukturierte Interviews
Verhaltensverankerte Bewertungsskalen entfalten ihr Potenzial besonders in zwei Settings:
Im Assessment Center beobachten mehrere Beurteiler:innen Kandidat:innen in simulierten Aufgaben und Übungen. Ohne einheitliche Bewertungsmaßstäbe führen diese Mehrperspektivenurteile schnell zu Inkonsistenz. BARS schaffen hier einen gemeinsamen Bewertungsrahmen, der die Vergleichbarkeit der Ergebnisse deutlich erhöht.
Im strukturierten Interview – beispielsweise bei verhaltensbasierten Fragen nach der STAR-Methode (Situation, Task, Action, Result) – ermöglichen BARS eine unmittelbare Einordnung der Antworten. Beurteiler:innen müssen ihre Einschätzung nicht aus dem Gefühl heraus treffen, sondern orientieren sich an klar definierten Ankerpunkten.
Verhaltensverankerte Beurteilungsverfahren sind dabei nur ein Baustein moderner, objektiver Personalauswahl. Ergänzend setzen Unternehmen zunehmend auf wissenschaftlich validierte Online Assessments, die Potenziale und Kompetenzen unabhängig von Interviewsituationen erfassen. Die digitale Plattform Aivy ermöglicht als wissenschaftliche Ausgründung der Freien Universität Berlin eine solche kompetenzbasierte Diagnostik, die Beurteiler-Bias strukturell reduziert. Unternehmen wie Lufthansa erzielen mit dieser Kombination aus strukturierter Verhaltensbeobachtung und objektiver Diagnostik eine Trefferquote von 96 % im Vergleich zu klassischen Inhouse-Assessments – bei gleichzeitig 81 % Zufriedenheit bei den Bewerbenden. Mehr Einblick bietet die Lufthansa-Erfolgsgeschichte.
Häufige Fragen zu verhaltensverankerten Bewertungsskalen
Was ist der Unterschied zwischen BARS und klassischen Bewertungsskalen?
Klassische Skalen verwenden numerische Werte (1–5) oder abstrakte Adjektive wie „sehr gut" bis „ungenügend", ohne zu definieren, was diese Bewertungen inhaltlich bedeuten. BARS definieren jede Stufe durch eine konkrete Verhaltensbeschreibung. Das erhöht die Interrater-Reliabilität, weil alle Beurteiler:innen am selben Maßstab orientieren – nicht an ihrer eigenen Vorstellung von „gut".
Wie viele Stufen sollte eine BARS-Skala haben?
Fünfstufige Skalen sind am verbreitetsten und haben sich in der Praxis als gut handhabbar erwiesen. Sieben- oder neunstufige Skalen erlauben eine feinere Differenzierung, sind aber schwerer zu kalibrieren und erhöhen den Entwicklungsaufwand. Für die meisten HR-Kontexte ist eine fünfstufige Skala ausreichend präzise.
Wie lange dauert die Entwicklung einer BARS-Skala?
Das ist der entscheidende Nachteil der Methode: Für eine einzige Kompetenzdimension sind mit Expertengruppe, Retranslation und Kalibrierung in der Regel drei bis acht Stunden einzuplanen. Ein vollständiges Anforderungsprofil mit fünf bis acht Dimensionen kann mehrere Tage in Anspruch nehmen. Dieser Aufwand amortisiert sich über den langfristigen Einsatz, sollte aber bei der Entscheidung realistisch einkalkuliert werden.
Kann ich BARS im strukturierten Interview einsetzen?
Ja – das ist sogar einer der häufigsten Einsatzbereiche. Bei verhaltensbasierten Interviewfragen, die nach konkreten Situationen aus der Vergangenheit fragen (STAR-Methode), ermöglichen BARS eine unmittelbare und konsistente Einordnung der Antworten. Beurteiler:innen gleichen das Geschilderte mit den Verhaltensankern ab, anstatt aus dem Bauchgefühl heraus zu bewerten. Das erhöht auch die rechtliche Absicherung von Auswahlentscheidungen.
Was ist der Unterschied zwischen BARS und BOS?
Beide Instrumente basieren auf konkreten Verhaltensbeschreibungen, unterscheiden sich aber in der Bewertungslogik: Bei BARS wählen Beurteiler:innen den Ankerpunkt, der das beobachtete Verhalten am besten beschreibt. Bei BOS (Behavioral Observation Scales) geben Beurteiler:innen an, wie häufig ein bestimmtes Verhalten gezeigt wird – etwa auf einer Skala von „fast nie" bis „fast immer". BOS sind oft einfacher zu entwickeln; BARS sind präziser, wenn es um qualitative Leistungsunterschiede geht.
Wie reduziert BARS Unconscious Bias?
BARS wirken auf mehreren Ebenen. Der Halo-Horns-Effekt wird abgeschwächt, weil jede Kompetenzdimension separat beurteilt wird – ein positiver Gesamteindruck färbt nicht automatisch alle Einzelbewertungen. Der Primacy- und Recency-Effekt (erster und letzter Eindruck dominieren) wird reduziert, weil Beurteiler:innen sich an verhaltensbasierten Ankern orientieren statt an Erinnerungseindrücken. Mehr über die systematische Überwindung von Urteilsfehlern im Recruiting erfährst du im Artikel zur Überwindung des Unconscious Bias im Recruiting.
Für welche Berufsfelder eignen sich BARS?
Grundsätzlich lassen sich BARS für alle Rollen entwickeln. Besonders wertvoll sind sie in Bereichen mit klar definierten Verhaltensanforderungen: Vertrieb, Kundenservice, Führungspositionen und Ausbildungsberufe. Weniger geeignet sind BARS für hochkreative Tätigkeiten, bei denen die Qualität von Ergebnissen stark variiert und schwer in konkreten Verhaltensankern abzubilden ist.
Muss ich BARS regelmäßig aktualisieren?
Ja. Verhaltensanker spiegeln den Stand der Rollenanforderungen zum Zeitpunkt ihrer Entwicklung wider. Wenn sich Tätigkeiten verändern – durch neue Technologien, veränderte Kundenbedürfnisse oder Umstrukturierungen – sollten die Anker entsprechend überarbeitet werden. Empfohlen wird eine Überprüfung alle zwei bis drei Jahre sowie bei wesentlichen Rollenveränderungen. Ergänzend sind regelmäßige Beurteiler:innen-Schulungen notwendig, um die Qualität der Anwendung zu sichern.
Fazit
Verhaltensverankerte Bewertungsskalen sind ein leistungsstarkes Instrument für objektivere, fairere und rechtssichere Personalbeurteilungen. Indem sie abstrakte Bewertungsstufen durch konkrete Verhaltensbeschreibungen ersetzen, reduzieren sie systematische Urteilsfehler und erhöhen die Vergleichbarkeit von Beurteilungen – egal ob im Mitarbeitergespräch, strukturierten Interview oder Assessment Center.
Der Entwicklungsaufwand ist hoch, die Wirkung aber dauerhaft: BARS investieren in die Qualität und Fairness jedes Beurteilungsprozesses, in dem sie eingesetzt werden. Wer strukturierte Personalauswahl ernst nimmt, sollte BARS zumindest für zentrale Kompetenzen seiner wichtigsten Rollen entwickeln.
Du möchtest wissen, wie Potenzialanalyse und wissenschaftliche Eignungsdiagnostik verhaltensbasierte Beurteilungsverfahren sinnvoll ergänzen können? Erfahre mehr über die Möglichkeiten der digitalen Plattform Aivy: Jetzt Aivy kennenlernen.
Quellen
- Smith, P.C. & Kendall, L.M. (1963). Retranslation of Expectations: An Approach to the Construction of Unambiguous Anchors for Rating Scales. Journal of Applied Psychology, 47(2), 149–155. https://doi.org/10.1037/h0047060
- Deutsche Gesellschaft für Personalführung (DGFP) (2020). Leitfaden Personalbeurteilung. https://www.dgfp.de
- Nerdinger, F.W., Blickle, G. & Schaper, N. (2019). Arbeits- und Organisationspsychologie (4. Aufl.). Springer. https://link.springer.com/book/10.1007/978-3-662-56666-4
- Thornton, G.C. & Rupp, D.E. (2006). Assessment Centers in Human Resource Management. Lawrence Erlbaum Associates.
Triff eine bessere Vorauswahl – noch vor dem Erstgespräch!
Aivy zeigt dir auf einen Blick, welche Kandidat:innen wirklich zur Rolle passen.




















