Akupunktur, Teil 3 – Bayes’sches Theorem und A priori-Wahrscheinlichkeiten: der Unterschied zwischen evidenzbasierter Medizin und wissenschaftsbasierter Medizin

Die evidenzbasierte Medizin (EbM) bezeichnet eine Medizin, in der medizinische Therapien nur dann angewendet werden, wenn davor in klinischen Studien gezeigt wurde, dass sie auch wirksam sind. Der Begriff Evidenz ist hier jedoch nicht als “Offensichtlichkeit” zu verstehen, wie man ihn im Deutschen auch kennt, sondern als “Beleg” bzw. “Beweis” (vom Englischen evidence). Die erste relevante klinische Studie (die diesen Namen verdient hat) wurde 1816 vom schottischen Armeechirurgen Alexander Hamilton durchgeführt. Sie enthielt nämlich schon einige wichtige Elemente moderner klinischer Studien, u.a. den Einsatz einer Kontrollgruppe. Hamilton hat untersucht, ob ein Aderlass bei erkrankten Soldaten eine Wirkung zeigt. Der Aderlass wurde zu dieser Zeit, und auch schon lange davor, von den meisten Medizinern bei unterschiedlichsten Erkrankungen für eine nützliche Intervention gehalten. In seiner Studie hat er eingewiesene Soldaten abwechselnd drei Gruppen zugeteilt. Alle drei Gruppen wurden von unterschiedlichen Ärzten behandelt (eine von Hamilton selber), wobei nur einer davon seine Patienten auch zur Ader ließ. Die Ergebnisse waren eindeutig: in den beiden Kontrollgruppen (die ohne Aderlass behandelt wurden) starben jeweils zwei bzw. vier Patienten, in der Aderlassgruppe jedoch 35 Patienten, was einer zehnfachen (!) Erhöhung der Mortalität entspricht. Noch wichtiger als diese Erkenntnis, nämlich dass Aderlässe nicht helfen, sondern im Gegenteil vielen Patienten das Leben kosten, ist die Erkenntnis dass trotz dieses Umstandes der Aderlass von den meistens Experten als eine nützliche Therapie gesehen wurde. Diese Studie macht eindrücklich klar, wieso Medizin sich auf systematische Untersuchungen stützen muss, und persönliche Erfahrungen (Anekdoten) von Ärzten zur Beurteilung des Nutzens von Therapien weitgehend nutzlos sind: wenn über Jahrhunderte reihenweise Ärzte von einer Therapie überzeugt sein können, die gar nicht wirklich hilft, sondern im großen Maßstab aktiv Patienten umbringt, dann ist es kein Hinweis auf die Wirksamkeit einer Therapie wie der Akupunktur (oder anderer Pseudomedizin), dass sie von vielen Menschen (Ärzten und Patienten) als wirksam erachtet wird.

A priori und A posteriori

Die evidenzbasierte Medizin erkennt also an, dass Therapien in klinischen Studien evaluiert werden muss. Diese Erkenntnis hat die Medizin revolutioniert. Sie ist, zusammen mit technologischen und wissenschaftlichen Fortschritten, dafür verantwortlich, dass moderne Medizin wirklich hilft, im Gegensatz zur Zeit des Aderlasses, als ein Besuch beim Arzt mehr geschadet als genutzt hat. Die EbM ist also zwar eine deutliche Verbesserung gegenüber dem Verlass auf Anekdoten und persönliche Erfahrung, hat aber auch noch folgendes Problem: nicht jede Intervention braucht die gleiche Menge bzw. Güte klinischer Evidenz, um als wirksam zu gelten, denn nicht alle Interventionen sind gleich plausibel. In der Sprache des Bayes’schen Theorems wird diese Plausibilität als A priori-Wahrscheinlichkeit bezeichnet. Wohingegen die mathematische Formulierung des Bayes’schen Theorems selbst für eingefleischte Statistiker eine harte Nuss ist, ist das zugrundeliegende Prinzip sehr simpel und streng genommen nichts Neues. Wir wenden es immer an, wenn wir (auf rationale Weise) darüber nachdenken, ob ein Sachverhalt wahr oder falsch ist. Ein Beispiel soll dazu dienen, diesen wichtigen Punkt zu illustrieren, denn er unterscheidet die evidenzbasierte von der wissenschaftsbasierten Medizin (SbM, science-based medicine).

Angenommen, ich treffe meine Mitbewohnerin in der Küche. Wir quatschen ein wenig, und sie erzählt mir, dass sie heute in der Fußgängerzone war. Dort hat sie einen Promi getroffen, nämlich Thomas Gottschalk. Sie hat kurz mit ihm gesprochen und ihm die Hand geschüttelt. In so einem doch recht trivialen Fall würde ich nicht auf den Gedanken kommen, ihre Geschichte anzuzweifeln. In der Sprache von Bayes ist die A priori-Wahrscheinlichkeit, Thomas Gottschalk in der Fußgängerzone Ulms zu treffen zwar nicht wirklich groß (Er wohnt nicht in Ulm, sondern in Baden-Baden), aber wirklich außergewöhnlich klein ist sie auch nicht. Verrechne ich jetzt diese mittelgroße Grundwahrscheinlichkeit mit der Aussage meiner Mitbewohnerin (die als Anekdote eigentlich nur den untersten Platz in der Hierarchie glaubwürdiger Evidenz einnimmt), um so die A posteriori-Wahrscheinlichkeit ihrer Behauptung zu bestimmen, dann würde ich sie so hoch einschätzen, dass ich die Behauptung eher akzeptieren als ablehnen würde. Zu gut Deutsch, ich glaube ihr.

Wenn meine Mitbewohnerin mir jedoch am nächsten Tag erzählt, sie hätte Angela Merkel in der Fußgängerzone getroffen, mit ihr einen Kaffee getrunken und dabei über Physik geplaudert, würde mir diese Beteuerung – bei aller Liebe – nicht ausreichen, um daran auch wirklich glauben zu können. Wenn sie mir dann jedoch noch ein Handyvideo zeigt, auf dem sie mit Merkel im Starbucks zu sehen ist, dann würde ich es anders sehen. Zwar kann man so ein Video heutzutage natürlich auch fälschen (Stichwort Deepfake), aber der Aufwand dafür wäre dann doch sehr groß, nur um mir einen (unwitzigen) Streich zu spielen. Bei einer niedrigen A priori-Wahrscheinlichkeit braucht es also einen deutlich überzeugenderen Beweis, in diesem Fall ein Video statt einer Aussage, um mich an die Behauptung glauben zu lassen.

Wenn sie mir dann aber erzählt, in der Fußgängerzone von Aliens entführt worden zu sein, die in ihrem UFO ein paar Experimente mit ihr gemacht haben und sie dann wieder abgesetzt haben, dann würde mich kein Video der Welt davon überzeugen können, dass das wirklich stattgefunden haben soll. Dazu braucht es dann schon Alien-DNA und außerirdische Technologie, die sie vom Raumschiff geklaut hat, und die von Experten analysiert und für authentisch befunden wurden. Zusammengefasst wird der Punkt, den ich mit diesem Beispiel machen möchte in einem Zitat von Carl Sagan: “Extraordinary claims require extraordinary evidence” (Außergewöhnliche Behauptungen benötigen außergewöhnliche Evidenz).

Was hat das nun mit unserem Thema zu tun? Je nachdem, wie plausibel Akupunktur ist (d.h. wie groß die A priori-Wahrscheinlichkeit ist), müssen wir dementsprechende Ansprüche an die Qualität der Evidenz der klinischen Studien zu diesem Thema stellen. Wie steht es nun also um die A priori-Wahrscheinlichkeit der Akupunktur?

Wie plausibel ist Akupunktur?

Qi ist ein lose und unklar definiertes Konzept. Belege oder auch nur Anhaltspunkte, die seine Existenz andeuten würden, gibt es nicht. Es ist eine präwissenschaftliche und esoterische Idee, die nichts mit einem naturwissenschaftlichen Verständnis des Kosmos allgemein und des menschlichen Körpers im Speziellen zu tun hat. Daher wundert es auch nicht, dass man mikroskopisch oder makroskopisch noch nie irgendeine Form von Bahn gefunden hat, anhand derer das Qi durch den Körper fließen könnte. Und das, obwohl sich reihenweise Diagramme finden, auf denen genau eingezeichnet ist, wie sie verlaufen sollen. Über den Zickzackkurs einiger Meridiane, den keine biologische Leitungsbahn (wie ein Blutgefäß oder ein Nerv) im Körper je einnehmen würde, muss man sich also nicht wundern. Unter Akupunkteuren ist nicht mal ganz geklärt, wie viele Meridiane es denn geben soll. Die meisten gehen von zwölf Hauptmeridianen aus, einige andere postulieren vierzehn. Die wahre Zahl ist jedoch deutlich niedriger: Null, denn Meridiane gibt es schlicht und ergreifend nicht.

Ähnlich verhält es sich mit den Akupunkturpunkten. Ein systematisches Review, das 2018 im Journal of Acupuncture and Meridian Studies publiziert wurde (sicher keine unvoreingenommene Quelle), hat 14 Studien zusammengefasst, die sich mit der Lokalisierung von Akupunkturpunkten durch professionelle Akupunkteure beschäftigt hat. In diesem Review wurde gezeigt, dass selbst die Profis, die schon jahrelange Akupunkturerfahrung haben, ein und denselben Akupunkturpunkt bei denselben Patienten an unterschiedlichen Stellen lokalisieren. Die Autoren kommen (erfrischend selbstkritisch) zu dem Schluss: “The lack of accuracy and precision in qualified and experienced acupuncturists is a cause for concern.” (“Die fehlende Genauigkeit und Präzision von qualifizierten und erfahrenen Akupunkteuren ist ein Anlass zur Sorge.” Vermutlich die größte Untertreibung des ganzen Journals). Die Erklärung für diesen Befund ist simpel: Akupunkturpunkte sind fiktive Konzepte, die es in der Realität nicht gibt.

An dieser Stelle möchte ich hinzufügen, dass, selbst wenn die Studie gezeigt hätten, dass die Lokalisation von Akupunkten sehr genau wäre, deren Existenz immer noch nicht bewiesen wäre (man könnte sich auch nur auf “Wegbeschreibungen” geeinigt haben, wie ich ausgehend von Landmarken am Körper einen definierten, funktionell jedoch irrelevanten Punkt auf der Haut finden kann. Die genaue Lokalisation von Akupunkten wäre, in der Sprache der Mathematiker, eine notwendige, aber keine hinreichende Bedingung für deren postulierte Wirkung bei der Akupunktur).

Wenn also nur eines dieser drei Konzepte (Qi, Meridiane, Akupunkte) nicht existiert, fällt das theoretische Konstrukt der Akupunktur zusammen. Ich habe erklärt, dass alle drei Konzepte ohne Evidenz sind. Für die Akupunktur bedeutet das, dass die A priori-Wahrscheinlichkeit, dass ein Akupunkturpunkt, der nicht direkt über der Pathologie liegt (z.B. ein Punkt am Handgelenk bei Heuschnupfen), diese irgendwie positiv beeinflussen kann, verschwindend gering ist. Einen biologischen Mechanismus für einen solchen Fall kann man sich nur schwer herleiten. Auch für einen Akupunkturpunkt am Rücken, der bei Rückenschmerzen helfen soll, ist die A priori-Wahrscheinlichkeit gering. Wenn es einen Effekt gäbe, dann müsste er eine biochemische Ursache haben, und nicht durch die Beeinflussung des Qi bedingt sein. Dieser biochemische Effekt würde dann aber gleich sein, ganz egal ob ich den Akupunkturpunkt genau erwische oder ob ich einen Zentimeter weiter rechts oder links einsteche. Man spricht in diesem Zusammenhang auch von unspezifischen Effekten: die Behauptung der Akupunktur ist, dass nur bestimmte Punkte eine spezifische (heilende) Wirkung haben, alle anderen Lokalisationen hingegen nicht. Wenn der genaue Punkt des Nadelstichs jedoch irrelevant für eine gemessene Veränderung ist, dann ist die Wirkung von Akupunktur eine unspezifische, und man kann mit Fug und Recht behaupten, dass Akupunktur nicht wirkt, d.h. nur einen Placeboeffekt generiert. So ist “nicht wirken” nämlich definiert. Dazu später mehr.

Zuletzt noch eine kurze Anmerkung zu einigen biochemischen Hypothesen, welchen den Effekt der Akupunktur belegen und erklären sollen. Insbesondere wird hier die Freisetzung von endogenen Opioiden oder Adenosin als analgetischer Botenstoff genannt. Dabei muss folgendes bedacht werden: wird hier wirklich der Unterschied zwischen einer Nadel im Akupunkturpunkt und einer Nadel einen Zentimeter davon entfernt untersucht? Mit anderen Worten, wird der entsprechende Stoff wirklich nur durch eine Nadel an ganz bestimmten Stellen freigesetzt? Und zweitens, was ist mit all den anderen Indikationen außer Schmerz? Ansonsten reden wir hier nur über unspezifische Wirkungen davon, dass man eine Nadel in den Körper sticht. Mit Akupunktur hat das dann nicht viel zu tun.

Conclusio

Wir stellen also fest, dass es doch sehr überzeugende klinische Studien braucht, um einen an die Akupunktur glauben zu lassen. Jedoch darf man nicht den Fehler zu machen, die klinische Evidenz gar nicht zu betrachten, nur weil eine potentielle Therapie unplausibel ist. Komplett unmöglich ist eine Wirkung der Akupunktur nämlich nicht. Oftmals können wir von einem biologischen Verständnis des Körpers nur schwer vorhersagen, ob eine Therapie funktioniert oder nicht. Nicht zuletzt gibt es regelmäßige “Durchbrüche” bei der Therapie von Krebserkrankungen, die aber eben nur in der Zellkultur oder im Tiermodell wirken, den Test am Menschen in einer klinischen Studie dann jedoch nicht mehr bestehen. Ganz wichtig: die A priori-Wahrscheinlichkeit sollte so verstanden werden, dass wir die Qualität der klinischen Daten, die wir als nötig für einen Nachweis einer Therapie ansehen, an sie anpassen. Aber letztlich ausschlaggebend sind eben diese klinischen Studien (es gibt einige Ausnahmen von dieser Regel, die ich anderweitig besprechen werde. Sie dient aber als gute Heuristik). Und was eine gute von einer schlechten Studie unterscheidet, das schauen wir uns in den nächsten beiden Teilen an.

A priori und A posteriori

Wie plausibel ist Akupunktur?

Conclusio

Kommentar hinterlassen Antworten abbrechen