Als Privatperson deine Stärken erkunden?

Hier

Verhaltensverankerte Bewertungsskalen (BARS) – Definition, Aufbau & Praxis

Home
-
Lexikon
-
Verhaltensverankerte Bewertungsskalen (BARS) – Definition, Aufbau & Praxis
Verhaltensverankerte Bewertungsskalen (BARS) – Definition, Aufbau & Praxis

Verhaltensverankerte Bewertungsskalen (BARS – Behaviorally Anchored Rating Scales) sind ein strukturiertes Beurteilungsinstrument, das jede Leistungsstufe mit konkreten, beobachtbaren Verhaltensbeschreibungen verknüpft. Sie machen Personalbeurteilungen objektiver, vergleichbarer und weniger anfällig für Unconscious Bias. BARS eignen sich besonders für strukturierte Interviews, Assessment Center und Mitarbeitergespräche.

Was sind verhaltensverankerte Bewertungsskalen (BARS)?

Verhaltensverankerte Bewertungsskalen wurden 1963 von den Psychologinnen Patricia Cain Smith und Lorne Kendall entwickelt und erstmals im Journal of Applied Psychology veröffentlicht. Ihr Ziel war es, die Subjektivität klassischer Leistungsbeurteilungen zu reduzieren – ein Problem, das bis heute im HR-Alltag allgegenwärtig ist.

Bei klassischen Ratingskalen wählen Beurteiler:innen zwischen abstrakten Kategorien wie „sehr gut", „befriedigend" oder „ungenügend". Was genau eine „sehr gute" Kommunikationsfähigkeit ausmacht, bleibt dabei offen – und wird von Person zu Person unterschiedlich interpretiert. BARS lösen dieses Problem: Jede Stufe einer Skala wird durch einen Verhaltensanker definiert, also eine konkrete, beobachtbare Beschreibung typischen Verhaltens. Beurteiler:innen müssen nicht mehr interpretieren – sie gleichen beobachtetes Verhalten mit vordefinierten Ankerpunkten ab.

Damit erhöhen BARS die Interrater-Reliabilität – das Ausmaß, in dem verschiedene Beurteiler:innen beim gleichen Kandidaten oder der gleichen Mitarbeiterin zu übereinstimmenden Ergebnissen kommen. Das ist nicht nur ein Qualitätsmerkmal fairer Personalarbeit, sondern auch eine wichtige Grundlage für rechtssichere Dokumentation von Auswahlentscheidungen.

Aufbau und Komponenten: Wie funktioniert BARS?

Eine verhaltensverankerte Bewertungsskala besteht aus zwei Grundelementen:

1. Kompetenzdimensionen: Die Leistungsbereiche, die bewertet werden sollen – zum Beispiel Kommunikationsfähigkeit, Problemlösungskompetenz, Teamfähigkeit oder Kundenorientierung. Diese Dimensionen werden spezifisch für die jeweilige Rolle definiert und basieren auf einer sorgfältigen Anforderungsanalyse.

2. Verhaltensanker: Für jede Kompetenzdimension werden konkrete Verhaltensbeispiele formuliert und den Stufen der Skala zugeordnet. Typisch sind fünf Stufen – von deutlich unterdurchschnittlichem bis zu herausragendem Verhalten.

Beispiel: BARS-Skala für die Kompetenz „Kommunikationsfähigkeit"

Stufe Bezeichnung Verhaltensanker
5 Herausragend Erklärt komplexe Sachverhalte klar und verständlich, passt Sprache aktiv an die Zuhörenden an, stellt sicher, dass Inhalte verstanden wurden, und gibt strukturiertes Feedback.
4 Gut Erklärt Sachverhalte verständlich, fragt nach, ob alles klar ist, und passt bei Bedarf die Darstellung an.
3 Durchschnittlich Kommuniziert verständlich, ohne aktiv zu prüfen, ob Inhalte angekommen sind. Auf Nachfrage werden Erklärungen ergänzt.
2 Unterdurchschnittlich Erklärt unstrukturiert, reagiert auf Verständnisfragen einsilbig und geht kaum auf das Gegenüber ein.
1 Deutlich unterdurchschnittlich Kommuniziert so, dass Missverständnisse entstehen; auf Nachfragen reagiert die Person abweisend oder unvollständig.

Dieses Beispiel zeigt: Nicht die subjektive Einschätzung „gut" oder „schlecht" steht im Mittelpunkt, sondern das konkret beobachtbare Verhalten. Das macht Bewertungen nachvollziehbar, anfechtbar und lernbar.

Schritt-für-Schritt: So entwickelst du eine BARS-Skala

Die Entwicklung verhaltensverankerter Bewertungsskalen ist aufwendig – dieser Nachteil sollte bei der Entscheidung für das Instrument ehrlich berücksichtigt werden. Für eine einzelne Kompetenz sind in der Regel mehrere Arbeitsstunden einzuplanen, für ein vollständiges Anforderungsprofil mit fünf bis acht Dimensionen entsprechend mehr. Dafür zahlt sich die Investition durch dauerhaft belastbare Beurteilungen aus.

Phase 1: Anforderungsanalyse und Dimensionen definieren

Kläre zunächst, welche Kompetenzen für die jeweilige Rolle entscheidend sind. Basis ist ein valides Anforderungsprofil, das du am besten gemeinsam mit Führungskräften und erfahrenen Stelleninhabenden entwickelst. Pro Rolle empfehlen sich fünf bis acht Dimensionen – mehr macht die Beurteilung unhandlich.

Phase 2: Kritische Ereignisse sammeln

Befrage Personen, die die Rolle gut kennen – sowohl Führungskräfte als auch erfahrene Mitarbeitende: „Beschreibe eine Situation, in der jemand in diesem Bereich besonders effektiv war – und eine, in der jemand deutlich unterdurchschnittlich abgeschnitten hat." Diese Methode geht auf die Kritische-Ereignis-Technik zurück und liefert das Rohmaterial für die späteren Verhaltensanker.

Phase 3: Verhaltensanker formulieren

Die gesammelten Ereignisse werden verdichtet und in klare Verhaltensaussagen überführt. Wichtig: Die Anker müssen beobachtbar, konkret und eindeutig formuliert sein – nicht bewertend oder interpretierend. „Geht offen auf Kolleginnen und Kollegen zu" ist ein guter Anker; „ist ein Teamplayer" ist keiner.

Phase 4: Retranslation und Validierung

Ein Kernschritt der BARS-Methodik ist die sogenannte Retranslation: Unabhängige Personen, die nicht an der Entwicklung beteiligt waren, ordnen die formulierten Verhaltensanker blind den richtigen Kompetenzdimensionen zu. Nur Anker, die klar und konsistent zugeordnet werden, kommen ins finale Instrument. Dieser Schritt sichert die inhaltliche Validität der Skala.

Phase 5: Kalibrierung und Schulung

Bevor BARS im Einsatz ist, sollten alle Beurteiler:innen geschult werden – idealerweise anhand konkreter Übungsszenarien. Kalibrierungsrunden, in denen alle dasselbe Beispielverhalten bewerten und die Ergebnisse besprechen, erhöhen die Interrater-Reliabilität erheblich.

Vorteile und Grenzen von BARS im Überblick

Stärken: Objektivität, Bias-Reduktion, Rechtssicherheit

Der größte Vorteil verhaltensverankerter Bewertungsskalen liegt in ihrer Fähigkeit, häufige Beurteilungsfehler und Unconscious Bias zu reduzieren. Klassische Effekte wie der Halo-Horns-Effekt – bei dem ein positiver Gesamteindruck alle Einzelbewertungen verfärbt – werden abgeschwächt, weil jede Dimension separat und anhand konkreter Verhaltensbeschreibungen beurteilt wird. Gleiches gilt für den Recency-Effekt (jüngste Ereignisse werden übergewichtet) oder den Affinity Bias (sympathische Personen werden systematisch besser bewertet).

Weitere Stärken:

  • Rechtssicherheit: Beurteilungen sind nachvollziehbar dokumentiert und können bei Bedarf begründet werden.
  • Entwicklungsförderlichkeit: Mitarbeitende erhalten klares, verhaltensorientiertes Feedback, das konkrete Ansätze zur Verbesserung liefert.
  • Akzeptanz: Verhaltensbasierte Rückmeldungen werden von Betroffenen häufig als fairer empfunden als abstrakte Einschätzungen.

Limitationen: Entwicklungsaufwand und Rollenbindung

BARS sind rollenspezifisch – eine Skala für den Vertriebsinnendienst lässt sich nicht eins zu eins auf eine Führungsposition übertragen. Das macht sie aufwendig in der Entwicklung und in der Pflege. Unternehmen sollten zudem einplanen, dass die Anker bei veränderten Rollenanforderungen – etwa durch Digitalisierung oder Umstrukturierung – überarbeitet werden müssen.

Außerdem ersetzen BARS keine Beurteiler:innen-Schulungen: Das Instrument reduziert Bias, eliminiert ihn aber nicht vollständig. Regelmäßige Kalibrierungsrunden bleiben auch nach der Einführung wichtig.

BARS in der Praxis: Assessment Center und strukturierte Interviews

Verhaltensverankerte Bewertungsskalen entfalten ihr Potenzial besonders in zwei Settings:

Im Assessment Center beobachten mehrere Beurteiler:innen Kandidat:innen in simulierten Aufgaben und Übungen. Ohne einheitliche Bewertungsmaßstäbe führen diese Mehrperspektivenurteile schnell zu Inkonsistenz. BARS schaffen hier einen gemeinsamen Bewertungsrahmen, der die Vergleichbarkeit der Ergebnisse deutlich erhöht.

Im strukturierten Interview – beispielsweise bei verhaltensbasierten Fragen nach der STAR-Methode (Situation, Task, Action, Result) – ermöglichen BARS eine unmittelbare Einordnung der Antworten. Beurteiler:innen müssen ihre Einschätzung nicht aus dem Gefühl heraus treffen, sondern orientieren sich an klar definierten Ankerpunkten.

Verhaltensverankerte Beurteilungsverfahren sind dabei nur ein Baustein moderner, objektiver Personalauswahl. Ergänzend setzen Unternehmen zunehmend auf wissenschaftlich validierte Online Assessments, die Potenziale und Kompetenzen unabhängig von Interviewsituationen erfassen. Die digitale Plattform Aivy ermöglicht als wissenschaftliche Ausgründung der Freien Universität Berlin eine solche kompetenzbasierte Diagnostik, die Beurteiler-Bias strukturell reduziert. Unternehmen wie Lufthansa erzielen mit dieser Kombination aus strukturierter Verhaltensbeobachtung und objektiver Diagnostik eine Trefferquote von 96 % im Vergleich zu klassischen Inhouse-Assessments – bei gleichzeitig 81 % Zufriedenheit bei den Bewerbenden. Mehr Einblick bietet die Lufthansa-Erfolgsgeschichte.

Häufige Fragen zu verhaltensverankerten Bewertungsskalen

Was ist der Unterschied zwischen BARS und klassischen Bewertungsskalen?

Klassische Skalen verwenden numerische Werte (1–5) oder abstrakte Adjektive wie „sehr gut" bis „ungenügend", ohne zu definieren, was diese Bewertungen inhaltlich bedeuten. BARS definieren jede Stufe durch eine konkrete Verhaltensbeschreibung. Das erhöht die Interrater-Reliabilität, weil alle Beurteiler:innen am selben Maßstab orientieren – nicht an ihrer eigenen Vorstellung von „gut".

Wie viele Stufen sollte eine BARS-Skala haben?

Fünfstufige Skalen sind am verbreitetsten und haben sich in der Praxis als gut handhabbar erwiesen. Sieben- oder neunstufige Skalen erlauben eine feinere Differenzierung, sind aber schwerer zu kalibrieren und erhöhen den Entwicklungsaufwand. Für die meisten HR-Kontexte ist eine fünfstufige Skala ausreichend präzise.

Wie lange dauert die Entwicklung einer BARS-Skala?

Das ist der entscheidende Nachteil der Methode: Für eine einzige Kompetenzdimension sind mit Expertengruppe, Retranslation und Kalibrierung in der Regel drei bis acht Stunden einzuplanen. Ein vollständiges Anforderungsprofil mit fünf bis acht Dimensionen kann mehrere Tage in Anspruch nehmen. Dieser Aufwand amortisiert sich über den langfristigen Einsatz, sollte aber bei der Entscheidung realistisch einkalkuliert werden.

Kann ich BARS im strukturierten Interview einsetzen?

Ja – das ist sogar einer der häufigsten Einsatzbereiche. Bei verhaltensbasierten Interviewfragen, die nach konkreten Situationen aus der Vergangenheit fragen (STAR-Methode), ermöglichen BARS eine unmittelbare und konsistente Einordnung der Antworten. Beurteiler:innen gleichen das Geschilderte mit den Verhaltensankern ab, anstatt aus dem Bauchgefühl heraus zu bewerten. Das erhöht auch die rechtliche Absicherung von Auswahlentscheidungen.

Was ist der Unterschied zwischen BARS und BOS?

Beide Instrumente basieren auf konkreten Verhaltensbeschreibungen, unterscheiden sich aber in der Bewertungslogik: Bei BARS wählen Beurteiler:innen den Ankerpunkt, der das beobachtete Verhalten am besten beschreibt. Bei BOS (Behavioral Observation Scales) geben Beurteiler:innen an, wie häufig ein bestimmtes Verhalten gezeigt wird – etwa auf einer Skala von „fast nie" bis „fast immer". BOS sind oft einfacher zu entwickeln; BARS sind präziser, wenn es um qualitative Leistungsunterschiede geht.

Wie reduziert BARS Unconscious Bias?

BARS wirken auf mehreren Ebenen. Der Halo-Horns-Effekt wird abgeschwächt, weil jede Kompetenzdimension separat beurteilt wird – ein positiver Gesamteindruck färbt nicht automatisch alle Einzelbewertungen. Der Primacy- und Recency-Effekt (erster und letzter Eindruck dominieren) wird reduziert, weil Beurteiler:innen sich an verhaltensbasierten Ankern orientieren statt an Erinnerungseindrücken. Mehr über die systematische Überwindung von Urteilsfehlern im Recruiting erfährst du im Artikel zur Überwindung des Unconscious Bias im Recruiting.

Für welche Berufsfelder eignen sich BARS?

Grundsätzlich lassen sich BARS für alle Rollen entwickeln. Besonders wertvoll sind sie in Bereichen mit klar definierten Verhaltensanforderungen: Vertrieb, Kundenservice, Führungspositionen und Ausbildungsberufe. Weniger geeignet sind BARS für hochkreative Tätigkeiten, bei denen die Qualität von Ergebnissen stark variiert und schwer in konkreten Verhaltensankern abzubilden ist.

Muss ich BARS regelmäßig aktualisieren?

Ja. Verhaltensanker spiegeln den Stand der Rollenanforderungen zum Zeitpunkt ihrer Entwicklung wider. Wenn sich Tätigkeiten verändern – durch neue Technologien, veränderte Kundenbedürfnisse oder Umstrukturierungen – sollten die Anker entsprechend überarbeitet werden. Empfohlen wird eine Überprüfung alle zwei bis drei Jahre sowie bei wesentlichen Rollenveränderungen. Ergänzend sind regelmäßige Beurteiler:innen-Schulungen notwendig, um die Qualität der Anwendung zu sichern.

Fazit

Verhaltensverankerte Bewertungsskalen sind ein leistungsstarkes Instrument für objektivere, fairere und rechtssichere Personalbeurteilungen. Indem sie abstrakte Bewertungsstufen durch konkrete Verhaltensbeschreibungen ersetzen, reduzieren sie systematische Urteilsfehler und erhöhen die Vergleichbarkeit von Beurteilungen – egal ob im Mitarbeitergespräch, strukturierten Interview oder Assessment Center.

Der Entwicklungsaufwand ist hoch, die Wirkung aber dauerhaft: BARS investieren in die Qualität und Fairness jedes Beurteilungsprozesses, in dem sie eingesetzt werden. Wer strukturierte Personalauswahl ernst nimmt, sollte BARS zumindest für zentrale Kompetenzen seiner wichtigsten Rollen entwickeln.

Du möchtest wissen, wie Potenzialanalyse und wissenschaftliche Eignungsdiagnostik verhaltensbasierte Beurteilungsverfahren sinnvoll ergänzen können? Erfahre mehr über die Möglichkeiten der digitalen Plattform Aivy: Jetzt Aivy kennenlernen.

Quellen

  • Smith, P.C. & Kendall, L.M. (1963). Retranslation of Expectations: An Approach to the Construction of Unambiguous Anchors for Rating Scales. Journal of Applied Psychology, 47(2), 149–155. https://doi.org/10.1037/h0047060
  • Deutsche Gesellschaft für Personalführung (DGFP) (2020). Leitfaden Personalbeurteilung. https://www.dgfp.de
  • Nerdinger, F.W., Blickle, G. & Schaper, N. (2019). Arbeits- und Organisationspsychologie (4. Aufl.). Springer. https://link.springer.com/book/10.1007/978-3-662-56666-4
  • Thornton, G.C. & Rupp, D.E. (2006). Assessment Centers in Human Resource Management. Lawrence Erlbaum Associates.

Florian Dyballa

CEO, Co-Founder

Über Florian

  • Gründer & CEO von Aivy – entwickelt innovative Wege der Personaldiagnostik und zählt zu den Top 10 HR-Tech-Gründern Deutschlands (Business Punk)
  • Rund 1 Mio. digitale Eignungstests erfolgreich im Einsatz bei mehr als 200 Unternehmen wie Lufthansa, Würth und Hermes
  • 3x mit dem HR Innovation Award ausgezeichnet und regelmäßig in führenden Wirtschaftsmedien präsent (WirtschaftsWoche, Handelsblatt und FAZ)
  • Verbindet als Wirtschaftspsychologe und Digital-Experte fundierte Tests mit KI für faire Chancen in der Personalauswahl
  • Teilt Expertise als gefragter Vordenker der HR-Tech-Branche – in Podcasts, Medien und auf wichtigen Branchenveranstaltungen
  • Gestaltet aktiv die Zukunft der Arbeitswelt – durch die Verbindung von Wissenschaft und Technologie für bessere und gerechtere Personalentscheidungen
testimonials

Das sagen #HeRoes

Aivy selbst ausprobieren

„Durch die sehr hohe Rücklaufquote überzeugen und binden wir unsere Azubis früh im Bewerbungsprozess.“

Tamara Molitor, Ausbildungsleiterin bei Würth

„Das Stärkenprofil spiegelt 1:1 unsere Erfahrung im persönlichen Gespräch.“

Wolfgang Böhm, Ausbildungsleiter DIEHL

„Durch objektive Kriterien fördern wir Chancengleichheit und Diversität im Recruiting.“

Marie-Jo Goldmann, Head of HR bei Nucao

Aivy ist das beste, was mir im deutschen Diagnostik Start-up Bereich bislang über den Weg gelaufen ist.“

Carl-Christoph Fellinger, Strategic Talent Acquisition bei Beiersdorf

„Auswahlverfahren, die Spaß machen.“

Anna Miels, Manager Learning & Development bei apoproject

„Bewerbende finden heraus, für welche Stelle sie die passenden Kompetenzen mitbringen.“

Jürgen Muthig, Leiter Berufsausbildung bei Fresenius

„Versteckten Potenziale kennenlernen und Bewerber:innen gezielt aufbauen.“

Christian Schütz, HR Manager bei KU64

Spart Zeit und macht viel Spaß bei der täglichen Arbeit.“

Matthias Kühne, Director People & Culture bei MCI Deutschland

Ansprechende Candidate Experience durch Kommunikation auf Augenhöhe.“

Theresa Schröder, Head of HR bei Horn & Bauer

„Sehr solide, wissenschaftlich fundiert, auch aus Kandidatensicht innovativ und in Summe einfach toll durchdacht.“

Dr. Kevin-Lim Jungbauer, Recruiting and HR Diagnostics Expert Beiersdorf
Der Assistent, der Talent erkennt.

Unverbindlich ausprobieren

Werde zum HeRo 🦸 und erkenne mit Aivy wie gut Bewerbende zu euch passen – und das noch vor dem ersten Bewerbungsgespräch...