Gute kollektive Wirkungen mithilfe der Spieltheorie

    Systeme erklären sich durch die Interaktionen zwischen ihren Elementen. Die Spieltheorie befasst sich mit der Erklärung von Interaktionen, insbesondere mit der Frage, wie in wechselseitiger Abhängigkeit Entscheidungen getroffen werden und welche Wirkungen diese erzielen. Die Spieltheorie stellt Modelle für einmalige und wiederholte Spiele, für asymmetrische Information, für Signalspiele und für evolutionäre Spiele bereit, die sich dazu eignen, Grundmuster in Interaktionen zu erkennen und Handlungsoptionen systematisch zu bewerten. Deshalb bietet sich die Spieltheorie als eine nützliche Disziplin sowohl zur Erklärung von Systemen als auch für systemisch sinnvolles Management an.

    ___________

    In diesem Beitrag gehe ich ausschließlich auf Entscheidungssituationen ein, deren Ergebnisse sich aus der Wechselwirkung mit anderen Entscheidungsträgern ergeben, also auf Situationen, in denen die Entscheidung Dritter das Ergebnis der eigenen Entscheidung beeinflusst. Ergebnisse von solchen Entscheidungssituationen in Wirkungsgefügen fallen oft überraschend aus, weil der Entscheidungsprozess instabil ist, oder sind ineffizient. Ein unzureichendes Verständnis der Zusammenhänge (missing „big picture“), das opportunistische Streben der Beteiligten nach individuellen Vorteilen oder Misstrauen führen im Unternehmensalltag immer wieder zu Situationen, in denen kein Optimum in der Zusammenarbeit erreicht wird, obwohl dies möglich wäre.

     

    Wie kann die Spieltheorie dabei helfen, die Ergebnisse für alle Beteiligten zu verbessern?

    Dass Vertrauen und eine gute Kommunikation entscheidenden Einfluss auf die Zusammenarbeit haben, bedarf eigentlich keiner Erwähnung. Aber welche Indizien rechtfertigen wie viel Vertrauen? Was ist unter guter Kommunikation wirklich zu verstehen? Diese Fragen sind nicht trivial. Erreichen wir gute Kommunikation dann, wenn sich jeder Einzelne rational verhält? Am Beispiel des viel zitierten Gefangenendilemmas[1] erkennen wir, dass rationales Verhalten auf individueller Ebene zu kollektiver Selbstschädigung führen kann, die als Kollektivgutproblem (CO2-Emission, Wasserverschmutzung) oder soziales Dilemma (soziale Umverteilung, Krankenkassensysteme) erfahren wird. Die Grundstruktur von Kollektivgutproblemen und sozialen Dilemmata ist, dass mehrere bis viele Akteure, die in wechselseitiger Interdependenz stehen, sich aber nicht unmittelbar miteinander abstimmen können, jeweils über verschiedene Handlungsalternativen verfügen; dabei bestehen symmetrische Auszahlungsmöglichkeiten.

    Auf den Zusammenhang, dass sich irrationale, nicht optimale gesellschaftliche Zustände durchaus als Konsequenz strikt rationalen Handelns individueller Akteure ergeben kann, machten schon Brian M. Barry und Russel Hardin in „Rational Man and Irrational Society“ aufmerksam.[2] Offenbar fallen individuelle und kollektive Rationalität oft auseinander. Dadurch bleiben die Ergebnisse ineffizient. Lösungsmöglichkeiten werden entweder nicht erkannt oder können nicht erreicht werden.

    Der amerikanische Mathematiker und Begründer der Kybernetik Norbert Wiener drückte bereits 1966 in seinem einflussreichen Werk „Mensch und Menschmaschine“ aus, „[…,] dass die Gesellschaft nur durch das Studium der Nachrichten und der zugehörigen Kommunikationsmöglichkeiten verstanden werden kann“[3]. Tatsächlich ist ein gutes Verständnis der Kommunikation der Schlüssel zu Stabilität und zu einer höheren Effizienz. Kommunikation ergibt sich durch das Aussenden, Empfangen und Deuten von Signalen. Das Spektrum der Möglichkeiten, die diese Aktivitäten bergen, ist nicht zu unterschätzen. Häufig ist Information asymmetrisch verteilt, Signale können ehrlich oder (bewusst) falsch (Drohungen, Bluff) sein. Es können unvollständige Informationen vorliegen oder Rationalitätslücken bestehen, die zu falschen Entscheidungen führen; strategische und taktische Interdependenzen zwischen Beteiligten können auch infinite Regresse hervorrufen, die unlösbar erscheinen.

    Spieltheoretische Ansätze, die sich mit Entscheidungen in Situationen strategischer Interdependenz befassen, können helfen, Interaktionsstrukturen zu verstehen, Möglichkeiten besser einschätzen zu können und gute Lösungswege zu erkennen. Die Spieltheorie ist eine mathematische Disziplin. Mithilfe der Mathematik können Methoden und formale Modelle bereitgestellt werden, um soziale Interaktionen formal und präzise zu beschreiben.[4] Für ein grundsätzliches Verständnis der spieltheoretischen Ansätze ist es aber nicht erforderlich, sich in die Tiefen der Mathematik zu begeben. Das ist eine gute Nachricht, denn gute Lösungen können umso besser durchgesetzt werden, je mehr an einem Entscheidungsprozess Beteiligte über einen Einblick in die Prinzipien der Spieltheorie verfügen.

    Die Spieltheorie weist auf wichtige Mittel hin, wie Institutionen, soziale Normen, soziale Sanktionen, Reziprozität und die Selbstorganisation von Kooperation in wiederholten „Spielen“, mit denen Kollektivgutprobleme und soziale Dilemmata gelöst werden können.

    Im Folgenden stelle ich ausgewählte Aspekte der Spieltheorie zusammen, die Erkenntnisse für ein besseres Verständnis von Wirkungszusammenhängen liefern können.

    Grundsätzlich müssen zwei Typen von Spielen unterschieden werden, nämlich Spiele (i) in Situationen, die simultane Entscheidungen verschiedener Beteiligten verlangen, die wechselseitige Auswirkungen haben und nicht miteinander abgestimmt werden können (darstellbar in der Normalform), und (ii) in Situationen, in denen Entscheidungen sequentiell getroffen werden (darstellbar in der Extensivform). In sequentiellen Entscheidungssituationen können zusätzlich zu den oben skizzierten Gründen für Fehlentscheidungen auch Missverständnisse, Täuschungen oder Fehlinterpretationen vorliegen, die als Möglichkeiten berücksichtigt werden sollten, um zu guten Entscheidungen zu gelangen.

    Betreffend die Ausrichtung der Interessen aller Beteiligten gibt es grundsätzlich eine große Bandbreite zwischen den Extrema (i) übereinstimmender und (ii) entgegengesetzter Interessen.

    Um in wechselseitigen Entscheidungssituationen mit übereinstimmenden Interessen ein stabiles und effizientes Ergebnis zu erreichen, ist ein Koordinationsproblem zu bewältigen. Zur Lösung können entweder eine offene und sachbezogene Kommunikation, soziale Normen oder beides beitragen. Durch eine erfolgreiche Koordination können sich alle Beteiligten besser stellen als vor dem Spiel. Gelingt dies, wird gemeinsam Wert geschöpft.

    Sind die Interessen der Beteiligten entgegengesetzt, wird eine Entscheidung bestenfalls auf ein Nullsummenspiel hinauslaufen. Das heißt, dass unter dem Strich kein Wert geschöpft wird, auch wenn sich einzelne Parteien durch das Spiel besser stellen mögen. Bei der Verteilung spielt die jeweilige Ausprägung der beiden Motive, (i) selbst nicht ausgebeutet zu werden (defensives Motiv) und (ii) die anderen möglichst auszubeuten (aggressives Motiv) , eine zentrale Rolle.

    Die meisten realen Entscheidungssituationen werden irgendwo zwischen diesen Extrema ausgetragen. Es wird sowohl übereinstimmende als auch gegenläufige Interessen geben. Diese vermischte Interessenlage erhöht die Komplexität von Entscheidungssituationen. Lösungsmöglichkeiten liegen in einer sinnvollen Kombination von Kooperation und Konfliktbegrenzung. Die Entwicklungsmöglichkeiten können wegen der höheren Komplexität aber nicht so einfach erfasst werden.

     

    Nash-Gleichgewicht nach John F. Nash (1950)

    In der Unternehmenspraxis ist es oft erstrebenswert, kalkulierbare Ergebnisse zu erzielen, auch wenn diese zulasten der möglichen individuellen Auszahlungseffizienz gehen. Ein stabiles, Risiken meidendes Geschäft ist in vielen Unternehmen sogar als eine Grundanforderung in der Corporate Governance festgelegt. In Verhandlungssituationen ist eine solche Konstellation dann gefunden, wenn keiner der anderen Beteiligten einen Anreiz hat, von dieser Konstellation abzuweichen. In der Welt der Spieltheorie haben wir dann ein Nash-Gleichgewicht erreicht.

    Ein Nash-Gleichgewicht[5] liegt bei einer solchen Kombination von Strategien vor, bei der jeder Beteiligte sich für eine Option entscheidet, bei der die anderen Beteiligten keinen Anreiz haben, von dieser Kombination abzuweichen. Alle Spieler wählen wechselseitig ihre beste Antwortstrategie.

    Beispiel „Assurance-Spiel“: Engagieren sich zwei Kooperationspartner für ein Projekt, erhalten sie beide die höchste Auszahlung (4, 4). Engagieren sie sich beide nicht besonders stark, erhalten sie beide nur eine reduzierte Auszahlung (2, 2). Engagiert sich einer der Kooperationspartner voll und der andere nicht, dann erhält derjenige, der sich nicht engagiert, eine hohe, aber nicht die volle Auszahlung, weil er von dem Beitrag des anderen profitiert, sein Beitrag aber im Ergebnis fehlt; der Engagierte erhält unter dem Strich aber nur eine sehr geringe Auszahlung, weil er die ganze Last auf sich genommen hat (3, 1 bzw. 1, 3). Es gibt zwei Nash-Gleichgewichte (4, 4) und (2, 2). Vertrauen die beiden Kooperationspartner ohne Zweifel darauf, dass sich ihr Partner einsetzen wird, werden sie sich für die auszahlungsdominante Konstellation (4, 4) entscheiden; ist dieses Vertrauen nicht hinreichend ausgeprägt, werden sie sich für das Nash-Gleichgewicht auf dem niedrigen Niveau (2, 2) entscheiden. Engagieren sich beide nicht, vermeidet jeder das Risiko, sich mit einer minimalen Auszahlung zufrieden geben zu müssen. Würden sich allerdings beide Partner für „engagieren“ entscheiden, würden sie beide besser abschneiden.

    Das Beispiel zeigt, dass das Nash-Gleichgewicht eine stabile, also kalkulierbare Lösung darstellt, wenngleich sie nicht effizient ist. Liegt hinreichendes Vertrauen vor oder besteht eine wirksame sanktionierende Institution für den Fall einer Abweichung von der Option „Engagieren“, würde die Konstellation zum Tragen kommen, die die Auszahlung für jeden Beteiligten verdoppelt.

    In Organisationen können geeignete Rahmenbedingungen für eine risikoarme, auszahlungsoptimierte Zusammenarbeit geschaffen werden, indem Vertrauen aufgebaut wird und sanktionierende Institutionen eingeführt werden. Dazu bietet es sich an, dafür Sorge zu tragen, dass alle Beteiligten das bestmögliche Verständnis für das Ganze entwickeln, dass sie sich möglichst persönlich kennenlernen und dass vereinbarte Handlungsweisen auch durchgesetzt werden.

    Es kann vorkommen, dass mehrere Nash-Gleichgewichte existieren und dass die Herausforderung darin besteht, das für alle Beteiligten optimale Nash-Gleichgewicht zu wählen. Schwierigkeiten resultieren dabei in der Regel aus einer fehlenden Koordinationsmöglichkeit zwischen den Beteiligten.

    Beispiel „Chicken-Spiel“: Zwei Autofahrer fahren mit Vollgas aufeinander zu. Derjenige, der ausweicht, das „Chicken“ (der Feigling), erhält zwei Punkte, der andere 4. Weicht keiner aus, erhält jeder einen Punkt, aber beide können davon ausgehen, dass sie den Aufprall nicht überleben. Weichen beide gleichzeitig aus, erhält jeder 3 Punkte. Wollen die Beteiligten überleben, gibt es die beiden pareto-optimalen Nash-Gleichgewichte, dass einer der Beteiligten ausweicht, mit den asymmetrischen Auszahlungsvarianten (4, 2) oder (2, 4). Um einen Aufprall sicher zu vermeiden, würden beide Fahrer ausweichen und auf die Möglichkeit einer individuellen Maximalauszahlung verzichten, denn das Koordinationsproblem ist anders nicht lösbar.

    Lösbar sind Koordinationsprobleme bei multiplen Nash-Gleichgewichten, wie sie im Chicken-Spiel auftreten, durch soziale Normen und Sanktionen.[6] Gesetze, Verträge und grundsätzliche Anweisungen sind solche Regeln, wenn vorgesehen ist, dass bei widrigem Verhalten Sanktionen in Kraft treten. Diese können Kooperationen ermöglichen und stabilisieren. Außerdem können Regeln helfen, Entscheidungssituationen besser zu strukturieren, wenn Verstöße gegen die Regeln mit Sanktionen verknüpft werden. In der Sprache der Sozialwissenschaftler heißen solche Regeln Institutionen. Institutionen geben Verhaltensweisen vor; neue Institutionen können Verhaltensweisen sogar verändern. Durch eine geeignete Ausgestaltung der Institutionen (mechanism design) können Verhaltensweisen so beeinflusst werden, dass die von allen Beteiligten vorgesehenen Ergebnisse wirklich erzielt werden. Institutionen können Vertrauen substituieren und koordinierend wirken.

    In Gesellschaften und in Organisationen muss durch solche Institutionen sichergestellt werden, wie grundsätzlich im Fall eines Koordinationsproblems zu verfahren ist. Ein Beispiel hierfür findet man in Form von Ampeln im Straßenverkehr, die zufallsgesteuert entweder zu einer (4, 2)- oder zu einer (2, 4)-Auszahlung führen, bei wiederholtem Überqueren einer Ampel-geregelten Kreuzung aber Gerechtigkeit herrscht und beide Beteiligten sicher überleben. Zu den in der Wirtschaftspraxis üblichen Institutionen zählen Pfänder, Kautionen, die Produkthaftung, Bonussysteme, das Patentrecht und Bußgeldkataloge. Sie wirken auf die Beteiligten als dauerhafte und berechenbare Anreizmechanismen, sich in der miteinander vereinbarten Weise zu verhalten.

    Personen und Organisationseinheiten handeln mit ihren individuellen Zielen unter gegebenen Bedingungen und erzeugen dabei, beabsichtigt oder nicht, kollektive (Makro-) Resultate. Diekmann stellt fest, dass diese Makroresultate die Folge von isolierten, häufig aber miteinander verbundenen individuellen Handlungen auf der Mikroebene sind (Aggregationsproblem bei strategischer Interdependenz). Er weist darauf hin, dass spieltheoretische Lösungskonzepte, wie das Nash-Gleichgewicht, individuelle Handlungen in kollektive Wirkungen transformieren.[7] Die Spieltheorie kann also Systemeigenschaften auf der Grundlage sozialer Interaktionen erklären.

    Für die Bestimmung eines Nash-Gleichgewichtes reicht übrigens die Kenntnis der Rangfolge der Präferenzen aus. Qualitative Nutzenwerte sind nicht erforderlich. Das macht die Ermittlung von Nash-Gleichgewichten in der Praxis einfacher.

     

    Pareto-optimales Gleichgewicht

    Das Pareto-Optimum ist dadurch definiert, dass keine andere Konstellation als das Pareto-Optimum auch nur einem Beteiligten eine höhere Auszahlung erschließt.

    Im obigen Beispiel zum Gefangenendilemma ist das Gleichgewicht mit den Auszahlungen (2, 2) zwar stabil, aber nicht effizient. Es ist deshalb nicht pareto-optimal. Dagegen ist die Konstellation mit den Auszahlungen (4, 4) effizient und somit pareto-optimal, aber, wie wir gesehen haben, leider instabil.

    In der Praxis tritt häufig eine Spannung zwischen einem ineffizienten Nash-Gleichgewicht und einem instabilen Pareto-Optimum auf.[8] In vielen Situationen gibt es allerdings bewährte Möglichkeiten, das Pareto-Optimum durchzusetzen. Innerbetrieblich und in Wertschöpfungsketten können beispielsweise durchsetzbare Absprachen getroffen werden, die ein verhältnismäßig sicheres Ausschöpfen von pareto-optimalen Gleichgewichten ermöglichen. In wettbewerblichen Konstellationen spricht allerdings das Kartellrecht gegen bindende Absprachen, gemeinsam das Pareto-Optimum zu wählen, während fehlendes Vertrauen dazu führt, dass sich ein ineffizientes Nach-Gleichgewicht einstellt. Auch bei Problemen der Allmende wird sich eher ein ineffizientes Nash-Gleichgewicht ergeben, weil niemand mehr Beiträge zum Gemeinwohl beisteuern möchte als er es von anderen erwartet.

     

    Dominierende Strategie

    Es kann vorkommen, dass einer der Beteiligten in einer Entscheidungssituation bei einer bestimmten Entscheidungsoption sicher eine höhere Auszahlung hat als andere, und zwar unabhängig von den Entscheidungen der anderen. In einem solchen Fall hat er mit dieser Option eine strikt dominierende Strategievariante gefunden. Ist die Auszahlung in jedem Fall mindestens gleich hoch wie die für einen beliebigen anderen Beteiligten, dann wird diese Strategievariante als (nur) dominierend, aber nicht als strikt dominierend bezeichnet.

    In der Praxis können Rahmenbedingungen so angelegt und durch Institutionen (Regeln) ausgestaltet werden, dass sich ein Beteiligter eine dominierende oder sogar eine strikt dominierende Strategie erschließt. Die Spieltheorie bietet das Handwerkzeug, um Situationen systematisch zu durchdringen und entsprechende Weichenstellungen vorzubereiten.

     

    Gemischte Strategie

    In der Wirtschaftsrealität kommen nicht immer reine Strategien zum Einsatz. Unter einer reinen Strategie verstehen wir eine Option, die von rationalen Entscheidern gewählt werden müssen, weil sie evident die beste Option für den Entscheider ist. Oft sind die Verhältnisse aber nicht so klar, insbesondere, wenn unter unvollkommener Information entschieden werden muss. In solchen Fällen ersetzt die Spieltheorie den Begriff „Unsicherheit“ durch Wahrscheinlichkeiten, mit denen rationale Entscheider die verfügbaren Optionen wählen. Eine Wahrscheinlichkeit von 0 bedeutet, dass eine Option mit Gewissheit nicht gewählt wird, während eine Wahrscheinlichkeit von 1 bedeutet, dass eine Option mit Sicherheit gewählt wird.

    Bei unvollkommenen Informationen wird sich das Spektrum der Wahrscheinlichkeiten zwischen 0 und 1 befinden, wobei sich die einzelnen Wahrscheinlichkeiten aller sich gegenseitig ausschließenden Optionen zu 1 aufaddieren (p (0 ? p ? 1 und ? p = 1).

    Das strategische Denken in Wahrscheinlichkeiten erschließt systematisch den Zugang zu Risiken und gibt Hinweise auf deren Eintrittswahrscheinlichkeiten. Entscheidungsträger können sich durch gemischte antizipierte Antwortstrategien angemessen auf die erkannten Risiken vorbereiten. Dadurch liefert die Spieltheorie einen wichtigen Beitrag zum Corporate-Foresight-Konzept, einer Vorgehensweise, die hilft, szenarienbasierte Strategien zu entwickeln. Grundsätzlich ist die Kenntnis der Unsicherheitskategorie einer Situation für eine sinnvolle Entscheidung wichtig, und zwar in Bezug auf die Wirkungen der jeweiligen Entscheidungsvarianten, wie es schon Heinz von Foerster vorschlug. In diesem Sinne empfiehlt es sich, zunächst zu unterscheiden, ob wir die Effekte unserer Entscheidungen sicher kennen, obwohl sie sich aus der Wechselwirkung mit Entscheidungen Dritter ergeben. Dieser Fall ist der komfortabelste, wenngleich für Spieltheoretiker auch der langweiligste. Ist dies nicht so, sollten wir unterscheiden, ob die Wahrscheinlichkeiten der möglichen eintretenden Effekte bekannt sind oder nicht. Sind die Wahrscheinlichkeiten bekannt, kann eine optimierte Entscheidungsempfehlung in Form einer gemischten Strategie gefunden werden. Wir haben es dann mit einer risikobehafteten Entscheidung zu tun. Sind die Wahrscheinlichkeiten aber nicht bekannt, haben wir es mit einer Entscheidung unter Unsicherheit zu tun. In diesem unkomfortablen Fall sollte versucht werden, vernünftige Annahmen über die Wirkungen der Entscheidungsoptionen zu treffen. Wenn auch dies nicht möglich ist, sollte so entschieden werden, dass sich durch die Entscheidung möglichst viele Handlungsmöglichkeiten erschließen.[9] In diesen Fällen ist nämlich keine rationale Entscheidung möglich. Dadurch, dass man sich den Handlungsspielraum möglichst weit offen hält, kann zumindest im nächsten Schritt mit höherer Varietät entschieden werden. Kurt Gödel erkannte bereits, dass logische Systeme, selbst wenn sie noch so vorsichtig konstruiert sind wie in der Principia Mathematica von Bertrand Russell und Alfred North Whitehead, gegen Unentscheidbarkeit nicht immun sind.[10]

     

    Entscheidungsprinzipien

    Die Spieltheorie bietet eine Auswahl an Entscheidungsprinzipien an. Die praktische Relevanz von Entscheidungsprinzipien wird unten anhand des Maximin-Prinzips, des Laplace-Prinzips, des Regret-Prinzips und des SEU-Prinzips exemplarisch dargelegt.

     

    Maximin-Prinzip nach John von Neumann (1928)

    Mit dem Maximin-Prinzip kann eine Entscheidung unter Worst-Case-Annahme optimiert werden.

    Man kann eine Maximin-Entscheidung erreichen, indem man für jede der möglichen eigenen Entscheidungsoptionen die Konstellation überlegt, die zur jeweils schlechtesten Auszahlung führt. Das sind die Worst-Cases. Im Anschluss entscheidet man sich unter diesen schlechtest möglichen Konstellationen für die Entscheidungsoption, bei der die jeweils schlechteste Auszahlung relativ am höchsten ist. Der Charme des Maximin-Prinzips liegt darin, dass die Auswahl der Maximin-Strategie anhand der Präferenzenfolge durchgeführt werden kann; absolute Werte sind nicht erforderlich. Das macht das Maximin-Prinzip in der Praxis gut handhabbar.

     

    Laplace-Prinzip

    Laplace schlug ein einfaches Entscheidungsprinzip für solche Fälle vor, in denen keine Eintrittswahrscheinlichkeiten möglicher Wirkungen verfügbar sind und auch Annahmen keinen Sinn machen. Er empfahl, in diesen Fällen alle möglichen Wirkungen zu erfassen[11] und sie mit gleichen Eintrittswahrscheinlichkeiten zu berücksichtigen. Die Entscheidung wird dann für die Option getroffen, bei deren Wahl die Wirkung unter diesen Bedingungen am günstigsten ausfallen würde. Das Laplace-Prinzip ist zwar einfach anzuwenden, doch die Anwendung ist mit großen Risiken behaftet, weil die Eintrittswahrscheinlichkeiten pauschal gleichgestellt werden, was tatsächlich in den meisten Fällen nicht der Fall sein wird.

     

    Regret-Prinzip

    Das Regret-Prinzip hinterfragt Entscheidungsoptionen auf den Verlust, den eine getroffene Entscheidung auslöst, falls sich die Dinge so entwickeln, dass eine andere Option die optimale gewesen wäre. In diesem Sinne wird man bei Anwendung des Regret-Prinzip für jede Entscheidungsoption den möglichen Verlust gegenüber dem Ergebnis bei jeder der anderen Optionen bewerten, der entstehen würde, wenn die Wahl einer dieser anderen Optionen zum besten Ergebnis geführt hätte. Die sich hieraus ergebenden relativen Verluste werden bewertet und die Entscheidung wird für die Option getroffen, bei der die relativen Verluste im Vergleich minimal ausfallen. Damit orientiert sich das Regret-Prinzip wie das Maximin-Prinzip an der Verlustvermeidung und nicht an der Gewinnmaximierung. Allerdings ist das Regret-Prinzip, anders als das Maximin-Prinzip, nicht auf Worst-Case-Annahmen basierend. Die Auszahlungen bei Entscheidung nach dem Regret-Prinzip werden deshalb voraussichtlich höher ausfallen als nach dem Maximin-Prinzip, aber die Entscheidung wird mit einem höheren Restrisiko behaftet sein, dass es doch anders kommt.

     

    Subjective-Expected-Utility (SEU)-Prinzip

    Das SEU-Prinzip eignet sich für Entscheidungen unter Risiko, also für solche Entscheidungssituationen, in denen Wahrscheinlichkeiten nicht explizit zur Verfügung stehen. In diesen Fällen nimmt man für jede eigene Entscheidungsoption subjektiv empfundene Nutzenwerte an, die man aus der eigenen strategischen und taktischen Position heraus für zutreffend hält. Die Entscheidung fällt auf die Option, die den höchsten subjektiven Nutzenwert zugewiesen bekommt. Zu den Nutzenwerten gelangt man durch den Vergleich der mit den empfundenen Eintrittswahrscheinlichkeiten multiplizierten Nutzenerwartungen. Als Maßeinheit für den subjektiv empfundenen Nutzen wird das „util“ angesetzt.[12]

    Das SEU-Prinzip kann dann sinnvoll sein, wenn wirklich keine objektiven, entscheidungsrelevanten Informationen verfügbar sind. In solchen Fällen können Annahmen über die subjektive Nutzeneinschätzung Dritter getroffen werden.

     

    Selbstbindung nach Thomas C. Schelling

    Um das beste Ergebnis für alle Beteiligten zu erzielen, ist es erstrebenswert, die Wahrscheinlichkeit kooperativen Verhaltens in Entscheidungssituationen zu steigern, die sich wechselseitig beeinflussen. In wiederholten Interaktionen kann gute Erfahrung das Vertrauen in das kooperative Verhalten fördern. Aber auch gute Erfahrungen mit bisherigen Transaktionen schließen nicht aus, dass ein Partner künftig defektiert. Eine bewährte Möglichkeit, die das Vertrauen in künftig kooperatives Verhalten verstärkt, ist die Selbstbindung. Beteiligte an sich wechselseitig beeinflussenden Entscheidungsprozessen können durch Selbstbindung Sicherheit signalisieren und dadurch Kooperationen ermöglichen bzw. fördern. Selbstbindung kann durch reputationsbildende Maßnahmen glaubwürdig kommuniziert werden.

    Beispielsweise kann ein Fonds-Manager signalisieren, niemals in die Rüstungsindustrie zu investieren oder nur in Unternehmen mit ökologisch und sozial nachhaltigem Geschäftsmodell. Ein Unternehmen kann aber auch signalisieren, in die Insolvenz zu gehen, falls ein abhängiger Kunde keinen Großauftrag zusichern sollte. Im ersten Fall kann die Selbstbindung zusätzliche Anleger locken und den Fonds stärken. Im zweiten Fall würde das Unternehmen eine Kooperation durch seine Drohung erzwingen.

    Selbstbindung kann sowohl in simultanen als auch in sequentiellen Entscheidungssituationen Kooperation fördern, sie kann aber auch, sofern sie als Bluff missverstanden wird, Katastrophen herbeiführen. Es ist bereits vorgekommen, dass angedrohte Militärschläge als Bluff aufgefasst wurden und in der Folge Kriege ausgelöst haben.

    In wiederholten Spielen stehen die Beteiligten vor der Herausforderung, sich an ihre abgegebene Selbstbindung zu halten. Ein Bruch der Selbstbindung kann zwar kurzfristig Vorteile verschaffen, wird aber langfristig, also bei weiteren Spielgängen, zu Nachteilen führen. Der Grund ist die Reziprozität der Wirkungen. Gebrochenes Vertrauen führt zu Reputationsverlust und zum Verlust von Kooperationsgewinnen für alle Beteiligte. Im Extremfall völligen Misstrauens müssen sich die Interaktionen der Partner auf strikt kontrollierbare Gleichzeitigkeit der korrespondierenden Handlungen beschränken.[13] Wo auch das Vertrauen in kleinere Zug-um-Zug-Interaktionen fehlt, können Treuhänder helfen.

     

    Fazit

    Dieser Beitrag zeigt, dass die Instrumente der Spieltheorie sowohl für das Verständnis als auch bei der Gestaltung von Interaktionen, deren Ergebnisse in wechselseitiger Abhängigkeit entstehen, eine wichtige Unterstützung sein können.

    Insbesondere bei der Gestaltung systemischer Wirkungsgefüge in Organisationen ist es hilfreich, sich im Kreis aller Beteiligten anhand spieltheoretischer Ansätze die Handlungsmöglichkeiten und ihre Effekte vor dem Hintergrund des „Big Picture“ zu vergegenwärtigen. So reift das Bewusstsein für Entscheidungen, die für alle Beteiligten das beste Ergebnis herbeiführen.

    Dr. Werner Boysen,

    Stand: 7. Juni 2011

    • zurück

    .................................

    Einflussreiche Spieltheoretiker

    George A. Akerlof, Michael Spence, Joseph E. Steglitz (Asymmetrische Information

    Robert J. Aumann (Wiederholte One-Shot-Games, korrelierendes Gleichgewicht in nicht-kooperativen Spielen)

    Albert M. Chammah (Gefangenendilemma), gemeinsam mit Anatol Rapoport

    John C. Harsanyi (strikt rationales Lösungsverfahren für Spiele mit unvollkommener Information)

    Leonard Hurwicz, Eric S. Maskin, Roger B. Myerson (Mechanism Design)

    Robert Kahnemann (Psychologisch-ökonomische Entscheidungsforschung)

    Vernon Lomax Smith (Freiheit für die Wirtschaft)

    Oskar Morgenstern (Nullsummenspiele, kooperative Spieltheorie)

    John F. Nash (Gleichgewichte für Spieltypen, insbesondere das Nash-Gleichgewicht)

    John von Neumann (Minimax-Theorem)

    Vilfredo Pareto (Effizienz in Entscheidungssituationen)

    Anatol Rapoport (Tit-for-tat-Strategie)

    Thomas C. Schelling: The Strategy of Conflict, Cambridge, Massachusetts, Harvard University Press, 1960: über die Rolle von Selbstbindung bei der Konfliktlösung (Stärkung der eigenen Position vs. Herbeiführen einer Katastrophe)

    Reinhard Selten (teilspielperfektes Gleichgewicht bei mehreren Gleichgewichten in Nicht-Nullsummenspielen, 1965)

     

    [1] Der Grundgedanke des Gefangenendilemmas geht auf Merrill Flood und Melvin Dresher zurück, zwei Mitarbeiter der Rand Corporation. Das Konzept wurde von Albert William Tucker 1950 aufgegriffen.

    [2] Barry, Brian M.; Hardin, Russell (Hrsg.): Rational Man and Irrational Society? Beverly Hills Sage, 1982.

    [3] Wiener, Norbert: Mensch und Menschmaschine – Kybernetik und Gesellschaft, Athenäum Verlag, Frankfurt und Bonn, 1966, S. 20.

    [4] Diekmann, Andreas: Spieltheorie, Rowohlt Verlag, Reinbek bei Hamburg, 2009, S. 12.

    [5] Nash, John F.: Equilibrium Points in N-Person Games, Proceedings of the National Academy of Sciences, v. 36, S. 48-49.

    [6] Der Einfluss von Normen und Sanktionen wurde von Voss für das Gefangenendilemma und von Fehr und Schmidt für Öffentliche Güter untersucht. S: Voss, Thomas: Strategische Rationalität und die Realisierung sozialer Normen, in: Müller, Hans-Peter; Schmid, Michael (Hrsg.): Norm, Herrschaft und Vertrauen, Westdeutscher Verlag, Opladen, 1998, S. 117-135; sowie Fehr, Ernst; Schmidt, Klaus M.: A Theory of Fairness, Competition and Cooperation, The Quarterly Journal of Economics, 1999, S. 817-868.

    [7] Diekmann, Andreas: Spieltheorie, Rowohlt Verlag, Reinbek bei Hamburg, 2009, S. 67 f.

    [8] Frank, Robert: Microeconomics and Behaviour, McGraw Hill, New York et al., 1991.

    [9] Von Foerster, Heinz: KybernEthik, Merve Verlag, Berlin, 1993, S. 78: „Sag ihnen, sie sollten immer so handeln, die Anzahl der Möglichkeiten zu vermehren […].“.

    [10] Gödel, Kurt: Über formal unentscheidbare Sätze der Principia Mathematica und Physik, in: Monatshefte für Mathematik und Physik, Vol. 38, 1931, S. 173-198. Die Principia Mathematica wurde von Betrand Russell und Alfred North Whitehead zwischen 1900 und 1910 verfasst. Sie ist, wie Heinz von Foerster anmerkt „eine Begriffsmaschinerie für fehlerfreie Deduction“ (Foerster, von Heinz: KybernEthik, Merve Verlag, Berlin, 1993, S. 71.

    [11] Laplace spricht von „Zuständen der Natur“.

    [12] Fisher, Len: Spieltheorie im Alltag, Spektrum Akademischer Verlag, Heidelberg, 2010, S. 34.

    [13] Diekmann, Andreas: Spieltheorie, Rowohlt Verlag, Reinbek bei Hamburg, 2009, S. 59