Wie Gruppen gute Entscheidungen treffen
22.04.2026
Mathematische Philosophie: Eine neue Studie zeigt, wann kollektive Urteile besser sind als individuelle. Das Ergebnis ist auch für den Einsatz von KI-Agenten relevant.
22.04.2026
Mathematische Philosophie: Eine neue Studie zeigt, wann kollektive Urteile besser sind als individuelle. Das Ergebnis ist auch für den Einsatz von KI-Agenten relevant.
© LMU
Ob ein Komitee Strategien wählt, ein Bienenschwarm seinen Nistplatz sucht oder mehrere KI-Agenten eine Lösung bestimmen – viele Entscheidungen werden nicht allein getroffen, sondern in der Gruppe entschieden. Doch welche Verfahren führen zu guten Ergebnissen, insbesondere bei komplexen Problemen mit vielen möglichen Antworten? Diesem Thema widmen sich der LMU-Philosoph Professor Christian List und der Ökonom Professor Franz Dietrich von der Paris School of Economics in einer Studie, die nun in der Fachzeitschrift Philosophical Transactions of the Royal Society B erschienen ist.
„Im Zentrum der Studie steht die Frage, unter welchen Bedingungen Gruppen zu verlässlichen kollektiven Urteilen gelangen“, erklärt Christian List, Inhaber des Lehrstuhls für Philosophie und Entscheidungstheorie an der LMU und Co-Direktor des Munich Center for Mathematical Philosophy. „Wir wollten herausfinden, welche Aggregationsverfahren dabei besonders geeignet sind, also wie sich Einzelurteile so bündeln lassen, dass daraus tragfähige kollektive Entscheidungen entstehen.“
Das betrifft nicht nur binäre Entscheidungen wie „schuldig“ oder „nicht schuldig“ in einem Kollegialgericht, sondern auch Schätzungen, die auf Basis von vielen möglichen Werten gefällt werden, etwa wirtschaftliche Kennzahlen, Klimavariablen, Wahrscheinlichkeiten oder Richtungsentscheidungen. Auch in Tiergruppen werden Entscheidungen gemeinsam getroffen, etwa bei der Wahl einer Flugrichtung oder eines Weideplatzes.
Ein klassisches Beispiel für kollektive Urteilsfindung durch Aggregation stammt aus dem Jahr 1907. „Auf einer Landwirtschaftsmesse wertete der englische Statistiker Francis Galton das Ergebnis eines Wettbewerbs aus, bei dem Besucherinnen und Besucher das Gewicht eines Ochsen schätzen sollten“, so List. Die knapp 800 eingereichten Werte variierten stark. „Doch der Median, also der Einzelwert, der in der Reihe aller Schätzungen genau in der Mitte liegt, kam dem Gewicht des Ochsen erstaunlich nahe.“ List erläutert, dass der Medianwert trotz der unterschiedlichen individuellen Schätzungen zuverlässig sein kann, solange diese voneinander unabhängig sind und mit einer hinreichenden Wahrscheinlichkeit den korrekten Wert nicht über- und nicht unterschätzen.
„Doch gemeinsame Entscheidungsprozesse bergen auch grundlegende Herausforderungen“, erklärt List. „Zum einen können selbst plausible Einzelmeinungen zu widersprüchlichen Gesamtergebnissen führen, wenn mehrere zusammenhängende Fragen gleichzeitig beurteilt werden. Eine Gruppe kann zum Beispiel mehrheitlich urteilen, dass A der Fall ist, dass B notwendigerweise aus A folgt, und dennoch dazu kommen, dass B nicht der Fall ist: also ein widersprüchliches Gesamtergebnis erreichen.“
Widersprüchliche Ergebnisse sollte ein Entscheidungsgremium natürlich idealerweise vermeiden. Ein Expertengremium etwa wäre unglaubwürdig und nicht hilfreich, wenn es kein kohärentes Gesamtergebnis liefert. Zudem lassen sich Verfahren durch strategische Angaben manipulieren, etwa wenn Einzelne ihre Angaben bewusst verzerren, um das Ergebnis in eine bestimmte Richtung zu lenken. Eine zentrale Frage ist zudem, unter welchen Bedingungen ein Verfahren dazu beitragen kann, die Wahrscheinlichkeit kohärenter und richtiger kollektiver Urteile zu erhöhen.
Solche Probleme überführten die Forschenden in ein formales, also logisch klar definiertes Modell, das festlegt, welche Fragen und Antworten möglich sind und welche Kombinationen davon logisch zusammenpassen. Auf dieser Grundlage leiteten sie allgemeine Aussagen über Stärken und Grenzen verschiedener Aggregationsverfahren ab. Anhand mathematischer Theoreme verglichen sie dann verschiedene Methoden der Aggregation: etwa die Bestimmung des Medians wie bei Galton, die Berechnung des Durchschnitts oder die Mehrheitsregel für binäre Fragen, die sich mit „ja“ oder „nein“ beantworten lassen. Bei Letzterer setzt sich in einer Gruppe die Option bei jeder Einzelfrage durch, die mehr als die Hälfte der Stimmen erhält.
Ein zentrales Ergebnis unserer Studie ist, dass gute kollektive Entscheidungen durchaus möglich sind, jedoch klarer Regeln und eines genauen Verständnisses ihrer Grenzen bedürfen.Christian List, Inhaber des Lehrstuhls für Philosophie und Entscheidungstheorie an der LMU und Co-Direktor des Munich Center for Mathematical Philosophy
„Ein zentrales Ergebnis unserer Studie ist, dass gute kollektive Entscheidungen durchaus möglich sind, jedoch klarer Regeln und eines genauen Verständnisses ihrer Grenzen bedürfen“, so List. Kollektive Intelligenz entstehe nicht automatisch dadurch, dass viele Individuen beteiligt seien. „Entscheidend ist vielmehr, nach welchen Regeln ihre Urteile zusammengeführt werden und wie die zu beurteilenden Fragen strukturiert sind.“
Das Medianverfahren schnitt vergleichsweise gut ab. „Es ist robuster gegenüber Ausreißern, von Teilnehmenden schwerer strategisch zu beeinflussen und unter bestimmten Annahmen gut darin, zutreffende Ergebnisse zu liefern“, so List. Allerdings ist auch der Median keine Universallösung, sondern überzeugt vor allem unter günstigen Ausgangsbedingungen. „Wenn die Befragten, wie etwa die Teilnehmenden auf der Landwirtschaftsmesse, über hinreichende Sachkenntnis verfügen und ihre Urteile nicht voneinander abhängig sind, steigt mit wachsender Gruppengröße die Wahrscheinlichkeit richtiger kollektiver Urteile beim Medianverfahren.“ Die Studie macht zugleich deutlich, dass diese günstigen Bedingungen in der Praxis oft nur eingeschränkt erfüllt sind. „In vielen Fällen stützen sich Individuen auf ähnliche Informationen, beeinflussen sich gegenseitig oder reagieren auf dieselben äußeren Faktoren.“
Zugleich zeigen die Ergebnisse, dass sich bei komplex verknüpften Problemen wichtige Anforderungen an Aggregationsverfahren oft nicht vollständig miteinander vereinbaren lassen, etwa widerspruchsfreie Ergebnisse, Wahrheitsorientierung und Schutz vor strategischer Beeinflussung. Die Autoren diskutieren in der Studie daher Wege, mit diesen Spannungen umzugehen, etwa durch Einschränkung der zulässigen Eingaben in ihrem Modell oder durch Verfahren, bei denen zunächst die Urteile zu zentralen Fragen gebündelt und weitere Werte daraus berechnet werden.
Ihre Ergebnisse, auch im Rahmen ihres größeren Forschungsprojekts zur Urteilsaggregation, aus dem die neu veröffentlichte Studie hervorgegangen ist, seien für viele Bereiche relevant, erklärt List, von wissenschaftlichen Expertengremien über Wirtschafts- und Klimaprognosen bis hin zu juristischen und politischen Entscheidungsverfahren. Denn sie helfen dabei, für unterschiedliche Kontexte Verfahren zu wählen, die zu möglichst verlässlichen kollektiven Entscheidungen führen. „Darüber hinaus sind sie für Systeme Künstlicher Intelligenz von Bedeutung, in denen mehrere Agenten Informationen oder Datenquellen zusammenführen.“
Christian List, Franz Dietrich: “Collective Intelligence through Aggregation”. In: Philosophical Transactions of the Royal Society B (doi.org/10.1098/rstb.2024.0454)