Akupunktur, Teil 5 – Vorbehalte über RCTs bei Akupunktur

Akupunktur ist in der klinischen Forschung eine spezielle Situation. Zwei Faktoren sind hierfür ursächlich: ein erster Faktor betrifft generell alle randomisierten Doppelblindstudien (RCTs) einer interventionellen Therapie (im Gegensatz zu einer medikamentösen Therapie), und der zweite Faktor betrifft speziell die Akupunktur und ihren politischen und kulturellen Hintergrund.

Placebokontrolle bei RCTs interventioneller Therapien

Eine RCT einer Intervention wie Physiotherapie oder eben Akupunktur, im Gegensatz zu einer RCT eines Medikaments, kann nur schwierig doppelt verblindet werden. Das liegt daran, dass der Arzt (oder wer auch immer die Intervention vornimmt) natürlich wissen muss, ob er die richtige (“Verum”) oder die Placebo-Therapie anwenden muss. Dadurch kann auch der Patient “entblindet” werden: findet er heraus, dass er sich in der Placebogruppe befindet, dann lässt sich auch kein Placeboeffekt mehr messen, was in der Verumgruppe eben nicht passiert. Ein gemessener Unterschied zwischen beiden Gruppe könnte dann nicht mehr ausschließlich durch die Therapie erklärt werden, sondern könnte auch durch den Placeboeffekt bedingt werden.

An dieser Stelle mag man sich fragen, ob das wirklich so ein Problem ist. Kann der Behandelnde den Studienteilnehmer wirklich so stark beeinflussen? Wenn man im Studienprotokoll festlegt, dass er seinem Probanden einfach nicht verrät, in welcher Gruppe er sich befindet, reicht das nicht aus? Dass dieser Faktor sehr wohl wichtig ist, ist in der evidenzbasierten Medizin eindeutig. Aber ein historisches Beispiel soll die Macht, die unterbewusste Suggestion haben kann, verdeutlichen. Um 1900 tourte Wilhelm von Osten mit seinem Pferd, dem klugen Hans, durch das Land. Der kluge Hans war eine Sensation, denn er konnte (vermeintlich) rechnen und zählen! Von Osten stellte ihm eine Rechenaufgabe, und Hans antwortete ihm, indem er mit dem Kopf nickte oder den Hufen auftrat. Erstaunlich oft war die Antwort korrekt. Besaß das Pferd demnach übersinnliche Kräfte, oder eine außergewöhnliche Intelligenz, die es sonst bei keinem Pferd gibt? Oder war es schlichter Betrug? Interessanterweise antwortete Hans auch korrekt, wenn ihm die Frage nicht von von Osten selbst gestellt wurde, sondern von einem Fremden. Betrug schien daher ausgeschlossen. Jedoch war es auch nicht so, dass Hans wirklich rechnen konnte. Zwei einfache Experimente zeigten die wahre Lösung des Rätsels: Zunächst einmal wurde festgestellt, dass Hans die Antwort nicht wusste, wenn der Fragesteller nicht in seinem Blickfeld war (z.B. hinter einem Tuch versteckt war). Und auch wenn der Fragesteller selbst die Antwort nicht kannte, konnte Hans die Frage nicht korrekt beantworten. Der Schluss war daher, dass das Pferd nicht etwa die Aufgabe löste, sondern den Fragesteller genau betrachtete. Kam es mit seinen Hufauftritten nahe an die Lösung, die dem Fragesteller bekannt war, konnte es dies an dessen Gesichtsausdruck und Körperhaltung ablesen, und mit dem Auftreten stoppen. Immer noch eine großartige Leistung des Tieres, aber eben nicht das, was von Osten sich erhofft hatte. Er blieb übrigens bis zu seinem Tod von den “übersinnlichen” Kräften seines Pferdes überzeugt, trotz klarem Beweis des Gegenteils, was jedoch keineswegs ein seltenes Phänomen ist – im Gegenteil scheint es eher die Norm zu sein, dass Menschen auf die Widerlegung eines ihnen wichtigen Gedankens damit reagieren, nur noch fester daran zu glauben. Das kann man z.B. jedes Mal beobachten, wenn sich eine Sekte nach der Prophezeiung des Weltuntergangs nicht etwa auflöst, sondern ihrem Propheten noch überzeugter glaubt.

Für klinische Studien bedeutet das, dass eine gute Placebokontrolle nur dann gewährleistet werden kann, wenn sowohl Patient als auch Arzt nicht wissen, welcher Patient sich in welcher Gruppe befindet. Aber wie sieht denn ein Placebo in der Akupunktur überhaupt aus?

Für die Akupunktur werden prinzipiell drei Arten von Placebos verwendet. Die erste Option besteht darin, die Nadeln einfach nur auf die Haut zu drücken, ohne sie zu durchstechen. Dazu werden spezielle Nadeln verwendet, die sich bei einem Widerstand wie ein Teleskop ineinander schieben, so wie ein Requisitenschwert aus dem Theater. Bevor diese speziellen Nadeln entwickelt wurden (sie werden erst seit 10-20 Jahren eingesetzt) war die zweite Option, die Nadel nur oberflächlich einzustechen, d.h. nicht bis zum eigentlichen Akupunkturpunkt. Die dritte Möglichkeit besteht darin, die Nadel nicht in einen Akupunkturpunkt zu stechen, sondern an eine andere Stelle, an der nach TCM-Lehre keine Meridiane oder Akupunkturpunkte liegen, und an der eine Nadel daher keinen Effekt erzeugen sollte. Prinzipiell unterscheiden sich diese Methoden ein wenig: mit den letzten beiden Verfahren (2 und 3), bei denen die Haut penetriert wird, wird wirklich getestet, ob eine Nadel an einem bestimmten Akupunkturpunkt eine spezifische Wirkung hat. Wird eine Teleskopnadel verwendet, die eben nicht die Haut penetriert, könnte auch ein unspezifischer Effekt der Akupunktur (d.h. ein Effekt, der nur darauf beruht, dass die Haut und das darunterliegende Gewebe verletzt wird) dazu führen, dass eine klinische Studie positiv ist. Das ist erstmal eigentlich ein Nachteil der Kontrolle, denn ein unspezifischer Effekt bedeutet eben genau nicht, dass eine Methode wirkt. Im Gegenteil. Ein weiterer Nachteil besteht darin, dass die Nadel nur schwerer manipuliert werden können, um ein De Qi auszulösen. Wett gemacht werden diese beiden Mankos jedoch durch den großen Vorteil, dass bei dieser Methode auch der Akupunkteur zumindest teilweise verblindet werden kann. So kommt man am ehesten an den Goldstandard der doppelt verblindeten, randomisierten Studie heran. Sie gelten daher aktuell als die besten (wenn auch nicht perfekten) Placebokontrollen.

Besonders gute Studien zeichnen sich auch dadurch aus, dass sie die Teilnehmer nach der Therapie befragen, ob sie denn glauben in der Verum- oder der Placebogruppe gewesen zu sein. So kann man überprüfen, ob die Verblindung der Patienten, und somit die Placebokontrolle, adäquat war.

Bias aus China

Untersucht man die Studien zur Akupunktur die in China durchgeführt und publiziert wurden, und vergleicht sie mit Studien aus anderen Ländern, so macht man eine interessante Beobachtung. Eine Untersuchung aus dem Jahr 1998 stellte fest, dass von 36 betrachteten Studien aus China alle 36 auch ein positives Ergebnis lieferten. Man könnte daraus jetzt schließen, dass Akupunktur wohl enorm effektiv ist, und sich die hohe Rate an positiven Studien darauf zurückführen lässt. Nicht in jedem Land ist diese Quote jedoch so hoch:

Land	Anzahl Studien	positiv (Anzahl)	positiv (%)
USA	47	25	53
China	36	36	100
Schweden	27	16	59
Vereinigtes Königreich	20	12	60
Dänemark	16	8	50
Deutschland	16	10	63
Russland	11	10	93

Daten aus: Vickers et al. 1998 Do Certain Countries Produce Only Positive Results – A Systematic Review of Controlled Trials. Controlled Clinical Trials. https://doi.org/10.1016/S0197-2456(97)00150-5

In den USA und Europa dümpelt der Anteil eher bei 50-70 % herum. Auch eine Untersuchung von Tang et al., die 1999 publiziert wurde, kam zu einem ähnlichen Ergebnis, jedoch für die TCM allgemein. 2014 wurde eine weitere Analyse im Journal of Alternative and Complementary Medicine veröffentlicht, in denen die Autoren herausfinden, dass von 840 untersuchten chinesischen RCTs zum Thema Akupunktur 838 positive Ergebnisse berichteten. Was ist hier also los?

Eine so (augenscheinlich) glasklare Datenlage zu einer medizinischen Intervention ist, untertrieben gesagt, eine Seltenheit. Wenn man bedenkt, dass alleine durch das Signifikanzniveau von 5 %, das bei klinischen Studien standardmäßig gewählt wird (s. Teil 4), etwa 5 % der Studien negativ sein sollten, selbst wenn die untersuchte Behandlung eindeutig wirksam ist, ist ein Wert von 99,8 % höchst suspekt. Wenn wir uns daran erinnern, dass gerade im Feld der Alternativmedizin auch viele methodisch schlechte und unterpowerte¹ Studien durchgeführt werden, würde man sogar deutlich mehr als 5 % falsch-negative Studien erwarten. Wenn also alle Studien zu einer Therapieform das gleiche Ergebnis liefern, dann läuten beim Biostatistiker die Alarmglocken. Und wenn sich dann aber wie in unserem Fall auch noch ein regionaler Unterschied darstellt, dann verlangt das natürlich nach einer Erklärung.

Auch wenn es schwer ist, das abschließend zu beweisen, dann liegt die Erklärung für diese Beobachtung vermutlich in der chinesischen Kultur und Politik. Die TCM ist in China nämlich kein reines Objekt wissenschaftlicher Untersuchungen, sondern eine Quelle von nationalem Stolz und Identität, die von der kommunistischen Partei Chinas (und, wie eingangs erwähnt, von Mao Zedong selber) auch aktiv als solche gefördert wird (bzw. wurde). Zur Eröffnung der Forschungsakademie für TCM 1955 hat Lu Zhijun in einer Rede folgendes gesagt (auf Englisch zitiert nach Kim Taylor, Chinese Medicine in Early Communist China, 1945-1963: A Medicine of Revolution; deutsche Übersetzung von mir):

“Every tiny result in the research into it [Chinese medicine] adds to the glory of our nation’s medical legacy. It increases [our] contribution to our nation’s people and to the whole of mankind. At the same time, it will further prove the mistakenness of those who look down upon and [want to] obliterate our nation’s medicine. [It will also] incite more people to come and correctly understand and take on the enterprise of our nation’s medicine.”

“Jedes kleine Ergebnis der [TCM-]Forschung erhöht den Ruhm des medizinischen Erbes unserer Nation. Es erhöht [unseren] Beitrag an das Volk unserer Nation und der gesamten Menschheit. Gleichzeitig wird es den Irrtum derjenigen, die auf unsere Medizin herabschauen und sie vernichten wollen, noch weiter beweisen. [Es wird auch] mehr Menschen dazu bringen, unsere Medizin korrekt zu verstehen und sie zu betreiben.”

Kurze Anmerkung. Ein verlässliches Zeichen, dass man es mit Pseudowissenschaft zu tun hat: die Wirksamkeit wird einfach angenommen, und Forschung wird nur durchgeführt, um den formalen Beweis zu erbringen, den die Gläubigen eigentlich gar nicht brauchen, da sie die Wahrheit selber schon kennen. Echte Wissenschaft ist stets ergebnisoffen und versucht, die eigenen Hypothesen zu widerlegen. Nur eine Hypothese, die oftmals versucht wurde zu widerlegen, aber diesem Test immer stand hielt, wird auch zur Theorie (und damit zur besten Beschreibung der Natur, die die Wissenschaft kennt). Hypothesen nur belegen zu wollen ist unwissenschaftlich.

Gegen TCM zu sein wird – damals wie heute – als unpatriotisch aufgefasst. Sie wird staatlich gefördert, so dass sie 2006, gemessen am Umsatz, etwa ein Viertel des chinesischen Gesundheitssystems ausmacht (Tendenz vermutlich steigend; aktuellere Zahlen habe ich nicht gefunden). Wer sich öffentlich gegen die TCM ausspricht muss u.a. mit einer Gefängnisstrafe rechnen. In der Konsequenz ist es in China quasi unmöglich, eine negative Studie über Akupunktur zu veröffentlichen, ohne dadurch auch starke Rückschläge der eigenen Karriere hinzunehmen. Es findet sich also ein maximales Publication Bias in China. Wie im vorherigen Abschnitt beschrieben, ist das ein großes Problem für Metaanalysen.

Publication Bias ist also eine Möglichkeit, diese Beobachtung zu erklären. Und tatsächlich hat ein Review von Chen et al. von 2017 gezeigt, dass nur knapp 9 % der klinischen Studien zur TCM (ca. die Hälfte davon gingen über Akupunktur), die auf clinicaltrials.gov registriert waren auch publiziert wurden.

Eine weitaus beunruhigendere Möglichkeit ist es hingegen, dass viele der Studien zur TCM schlicht gefälscht sind. Eine Untersuchung der chinesischen State Food and Drug Administration (SFDA), die 2016 publiziert wurde, hat etwa 1600 klinische Studien untersucht und kam zu dem Schluss, dass ca. 80 % der Daten gefälscht wurden. Was für uns eine erschreckende Zahl ist, scheint für die meisten Insider in China nicht weiter verwunderlich:

“Clinical data fabrication was an open secret even before the inspection,” the paper quoted an unnamed hospital chief as saying.

“Die Erfindung klinischer Daten war auch schon vor der Untersuchung ein offenes Geheimnis” zitierte das Paper einen unbenannten Chefarzt.

2017 gab es einen weiteren Vorfall von wissenschaftlichem Betrug, in dessen Verlauf über 100 Paper zurückgezogen wurden. Paper-Fabriken erfinden ganze Artikel und publizieren sie unter dem Namen des Käufers. Cao Xuetao, der sicherlich prominenteste Forscher Chinas, mit einer fast gottgleichen Biografie (u.a. der jüngste Professor und General Chinas) und derzeit u.a. der Vorsitzende für Forschungsintegrität und -ethik für ganz China, hat selber reihenweise gefälschte Daten publiziert. Wenn also einem Forscher, in dessen Paper sich massenweise Betrug nachweisen lässt, die Verantwortung für die Einhaltung von Forschungsethik und Good Scientific Practice eines ganzen Landes übertragen wird, dann hat dieses Land ein systematisches Problem mit ebendiesen. Kleine Randbemerkung: im Alter von 26 hat Cao ein Paper veröffentlicht, in dem er zeigte, dass er mittels durch einen Qigong-Meister emittiertem Qi Krebs heilen konnte. Sagen wir also, es gab schon frühe Anzeichen für diese Enthüllung.

Kann die TCM als individualisierte Medizin überhaupt mittels RCTs untersucht werden?

Wenn man über die klinische Evidenz der TCM im Allgemeinen oder der Akupunktur im Speziellen redet, dann wird man früher oder später mit folgendem Gegenargument konfrontiert werden: die Diagnose und Therapie im Rahmen der TCM werden an das Individuum angepasst vorgenommen, und können daher nicht durch eine klinische Studie überprüft werden. Einzig und allein ausschlaggebend sei die Erfahrung von TCM-Anwender und Patient. Was sich zunächst einmal gut anhört (wer findet individualisierte Medizin denn nicht gut), entpuppt sich beim kurzen Nachdenken als Scheinargument. Erstmal: was soll denn individualisierte Medizin sein? Im Bereich der wissenschaftlichen Medizin meint man damit aktuell meistens, dass das Genom des Patienten sequenziert wird um z.B. bestimmte Stoffwechselvarianten zu erkennen, die bei der Verabreichung bestimmter Medikamente wichtig sind, oder die Sequenzierung eines Tumors, um gezielt Therapien einzusetzen, die nur bei Tumoren mit bestimmten Mutationen wirken. Wirklich “individualisierter” ist das nicht, es ist einzig und allein eine genauere Diagnose. Letztlich gilt aber immer – auch heute schon, in der ganz normalen, wissenschaftsbasierten Alltagsmedizin – dass im Zentrum der medizinischen Diagnose und Therapie der einzelne Patient steht. Als Individuum. “Individualisierter” als das Individuum geht es nicht. Durch neue Verfahren wie das Next Generation Sequencing, mit dem man (verhältnismäßig) kostengünstig das Genom des Patienten sequenzieren kann, erhält man schlicht mehr Informationen über den Patienten, die die Ärztin dann natürlich in ihre Therapieempfehlung einfließen lässt.

Bottom line: Dass die “westliche” Medizin, im Gegensatz zur Pseudomedizin, den Patient gar nicht als ganzen Mensch (“holistisch”) betrachtet, ist ein weit verbreiteter Irrtum, und ein Strohmann. Da man diese Medizin aber trotzdem ganz gewöhnlich mittels RCTs überprüfen kann, bedeutet, dass man auch alle pseudomedizinischen Methoden wie die Akupunktur oder andere TCM-Modalitäten so auf Wirksamkeit überprüfen kann. Beispielsweise wurden in allen vier GERAC-Studien (s. Teil 6) in der Verum-Gruppe auch individuelle Akupunkte (neben Standardpunkten) durch den Therapeuten verwendet. Es ist kein Problem, auch die individualisierteste Methode im Rahmen einer RCT zu überprüfen.

An dieser Stelle möchte ich noch erwähnen, dass ich es keineswegs “holistisch” und “individualisiert” finde, jedes medizinische Problem auf die immer gleiche Ursache zurückzuführen, oder mit immer der gleichen Methode zu behandeln, wie es charakteristisch für Pseudomedizin ist. Egal was das Problem ist, der Homöopath verschreibt immer Globuli. Die Chiropraktikerin sieht stets eine Subluxation der Wirbelsäule als Ursache. In der TCM ist es immer so, dass das Chi nicht richtig fließt. Der Arzt überlegt sich hingegen, was die Ursache eines Problems ist (eine Infektion? Ein Tumor? Stress? Trauma? Ursache unbekannt (“idiopathisch”)?), und wie man es am besten angeht (medikamentös? Watch and wait? Physiotherapie? Lifestyle-Modifikationen? OP? Psychotherapie?). Die Realität ist der allgemeinen Wahrnehmung diametral entgegengesetzt: wohingegen Pseudomedizin Patienten häufig über einen Kamm schert, behandelt die wissenschaftsbasierte Medizin Patienten schon sehr lange “holistisch”, ein Begriff, der jedoch immer nur mit der Pseudomedizin in Verbindung gebracht wird.

Abschließend kann man sagen, dass man in der klinischen Literatur zur Akupunktur zwei Biases erwartet: eines durch eine ungenügende Verblindung, und eines durch Studien aus China, die aus kulturellen Gründen ausschließlich positiv ausfallen dürfen. Praktisch bedeutet das, dass man für das erste Bias in einer Studie die erfolgreiche Verblindung der Patienten nach der Studie erfragen und somit überprüfen sollte. Für das zweite Bias bleibt einem aktuell keine wirkliche Wahl, als Studien aus China von der Betrachtung auszunehmen.

¹ “unterpowert” ist hierbei ein definierter Begriff aus der Statistik. Bei der Planung einer Studie kann man – unter bestimmten Annahmen, wie z.B. der Größe des erwarteten Effekts – berechnen, wie viele Patienten (n) man in die Studie einschließen muss, um mit einer bestimmten Wahrscheinlichkeit (i.d.R. wird 80 % gewählt) eine Wirksamkeit statistisch nachweisen zu können. Je kleiner n, desto größer die Wahrscheinlichkeit für falsch negative (wenn die untersuchte Behandlung in Wahrheit funktioniert) bzw. falsch positive Ergebnisse (wenn die untersuchte Behandlung in Wahrheit unwirksam ist). Deswegen ist n ein so wichtiger Parameter, um die Güte einer RCT zu beurteilen.

Quellen:

Placebokontrolle bei RCTs interventioneller Therapien

Bias aus China

Kann die TCM als individualisierte Medizin überhaupt mittels RCTs untersucht werden?

Kommentar hinterlassen Antworten abbrechen