Dette indlæg er skrevet af: Theis Lange, professor i Biostatistik, Københavns Universitet, Rikke Damkjær Maimburg, jordemoder og lektor, Aarhus Universitetshospital & Aarhus Universitet, Anne Lyngholm Sørensen, statistiker og ph.d.-studerende, Københavns Universitet, Jacob Alexander Lykke, overlæge, dr. med., lektor, Rigshospitalet, Københavns Universitet, og Ole Olsen, statistiker og seniorforsker, Københavns Universitet.

Det er mere end nogensinde blevet tydeligt, at der i sundhedsvæsenet er brug for prioriteringer. Prioriteringer, der bygger på solid forskning for at få ‘mest mulig sundhed for pengene’ og inddragelse af patienterne i behandlingerne, men også prioriteringer, der skaber meningsfulde og rimelige arbejdsbetingelser for de fagprofessionelle.

Uanset om man interesserer sig for fødsler eller for andre områder i sundhedsvæsenet, har vi nogle generelle pointer, som er vigtige

En oplagt løsning er kun at tilbyde behandlinger, som har dokumenteret gavnlig effekt. Alligevel indføres der alt for ofte nye ressourcekrævende behandlinger, hvor evidensgrundlaget er manglende eller fejltolket.

Helt aktuel er debatten om igangsættelse af fødslen hos gravide kvinder med ukompliceret graviditet. Det centrale spørgsmål er her, om der vil være en sundhedsmæssig gevinst ved rutinemæssigt at igangsætte alle fødsler ved 41+0 uger. Kan man undgå nogle dødsfald? Hvor store lemper, risici og omkostninger vil der være forbundet med indgrebet?

Svaret skal findes i veludførte undersøgelser baseret på klinisk relevante praksisser, hvor de indsamlede data analyseres og fortolkes med statistisk solide metoder.

I denne artikel beskæftiger vi os primært med den sidste problemstilling, altså den statistiske soliditet og tolkning.

Uanset om man interesserer sig for fødsler eller for andre områder i sundhedsvæsenet, har vi nogle generelle pointer, som er vigtige, hvis vi skal arbejde os hen mod et stadigt mere bæredygtigt og velfungerende sundhedsvæsen.

Den aktuelle case

Graviditetsterminen ligger ved 40+0 uger, og terminsperioden er traditionelt defineret mellem 37+0 til 42+0 uger. Omkring 25 pct. af de gravide kvinder har ikke født ved 41+0 uger.

Det er på dette tidspunkt, at det nu foreslås, at det bør overvejes, at gravide kvinder får fødslen sat i gang.

I Danmark dør mellem 6 og 13 børn årligt fra graviditetsuge 41+0 og frem ud af totalt ca. 60.000 graviditeter. Nogle af disse børn vil kunne reddes med en tidligere igangsættelse, mens andre børn vil lide overlast i et igangsættelsesforløb, og en langt større andel af kvinderne vil opleve bivirkninger, hvis yderligere 9.000 gravide skal have deres fødsel igangsat.

Hvis man ønsker sikker evidens for, at f.eks. et indgreb som igangsættelse af fødslen i disse graviditeter ved 41+0 uger mindsker dødeligheden, skal man designe et klinisk velgennemtænkt lodtrækningsforsøg. Studiet bør udføres i Skandinavien for at være relevant, hvor den perinatale dødelighed er en af de laveste i verden.

Da det jo således er yderst sjældne events, man undersøger, betyder det, at forsøget skal inkludere hundredtusindevis af gravide kvinder for at opnå tilstrækkelig power til opdage disse små forskelle.

Det er næppe realistisk at rekruttere så mange, og ingen har da ej heller forsøgt at gennemføre et sådant forsøg.

Indirekte evidens

I stedet kunne man forestille sig, at man skaffede sig en form for indirekte evidens. Altså at man ikke måler den eventuelle succes som en reduktion i dødelighed, men i stedet laver en samlet opgørelse af en hel række uønskede komplikationer – herunder f.eks. kramper, hjerneblødning eller hjernepåvirkning – i et såkaldt composite outcome mål.

Forklaringen er den velkendte, at selvom noget er sjældent, så vil det altid ske, hvis man bliver ved med at prøve

Forsøget ville så kunne betragtes som succesfuldt, hvis der forekommer signifikant færre af disse komplikationer hos den gruppe, der modtager interventionen.

Man ville så ganske vist ikke have direkte evidens for et fald i dødeligheden. Men man ville kunne betragte fundet som et fingerpeg i retning af et fald i dødeligheden.

Der ville dermed være solid statistisk evidens for, at interventionen ville have en effekt – bare på noget andet end dødeligheden.

Hvorvidt en kliniker mener, at denne indirekte evidens kan oversættes til et forventet fald i

dødeligheden, kan efterfølgende forsøges belyst ved at analysere nationale tal for dødelighed, men helt sikker kan konklusionen aldrig blive.

Den svenske case

I Sverige har man med SWEPIS-undersøgelsen forsøgt sig med et sådant forsøg, hvor de egnede kvinder blev randomiseret til igangsættelse af fødslen ved 41+0 uger, eller som vanligt ved 42+0 uger. Undersøgelsen foregik på 14 hospitaler i Sverige i perioden 2016-2018.

For at være egnet til at deltage i undersøgelsen skulle man være rask, og der skulle jævnfør deres protokol endvidere foreligge en normal ultralydsundersøgelse ved netop 41+0 uger. For at kunne påvise et statistisk sikkert fald i det udviklede composite outcome mål skulle man randomisere 10.038 kvinder.

Imidlertid stoppede man forsøget efter kun 2.762 kvinder, fordi man på dét tidspunkt havde observeret 0 døde børn i interventionsgruppen og 6 døde børn i den afventende gruppe.

Der var ingen døde børn i Stockholms-gruppen, som udgjorde 41 pct. af deltagerne i studiet, og som var det eneste sted, hvor man havde fulgt protokollen og opfyldt inklusionskriteriet om en ultralydsscanning i uge 41+0.

Undersøgelsens resultat blev bredt fortolket, som om forsøget havde vist, at interventionen sænkede dødeligheden statistisk signifikant.

Genbesøg nødvendigt

Men kan det nu også være rigtigt?

For at svare på det skal man først genbesøge, hvad ‘statistisk signifikant’ betyder.

Vi vil derfor opfordre til, at Sundhedsstyrelsen, men også andre væsentlige aktører som f.eks. de faglige selskaber, i højere grad sikrer, at nye anbefalinger udarbejdes på et solidt evidensgrundlag

Når man siger to, at grupper er statistisk signifikant forskellige, så betyder det, at hvis der i virkeligheden slet ingen forskel er mellem grupperne, så vil der være under 5 pct. sandsynlighed for, at vi ser den forskel mellem de to grupper: Denne sandsynlighed kaldes p-værdien.

Hvis vi f.eks. vil se, om to mønter har samme sandsynlighed for at vise plat, så kan vi flippe hver mønt 100 gange og tælle, hvor mange plat der kommer med hver. Matematikken viser så, at der vil være statistisk signifikant forskel, hvis der er 16 eller større forskel i antallet af plat, fordi p-værdien da ville være under 5 pct.

Det gælder dog kun, hvis man kun kigger på tallene én gang. Hvis man i stedet undersøger, om der er forskel efter hver gang, man har flippet de to mønter, så vil man ikke kunne konkludere, at der var forskel, bare fordi p-værdien kom under 5 pct.

Forklaringen er den velkendte, at selvom noget er sjældent, så vil det altid ske, hvis man bliver ved med at prøve.

Manglende svensk evidens

Og så er vi ved problemets kerne. I SWEPIS havde man valgt at analysere data løbende under dataindsamlingen. Det er ikke i sig selv forkert. Og man valgte så at stoppe forsøget, efter at en p-værdi på under 5 pct. blev observeret.

Men det er her fejlen sker. Grundet de mange kig og analyser på data, er der mindst 11 pct. sandsynlighed for ingen forskel. Den sande p-værdi er altså ikke under 5 pct.

Sundhedsstyrelsen har altså fundet det acceptabelt at benytte studier, der ikke er repræsentative for danske forhold

Der er senere blevet lavet en meta-analyse, som inkluderer to ekstra studier, hvor det dog erkendes, at SWEPIS er biased mod en større effekt, da det blev stoppet tidligt, og at meta-analysen ikke kan bruges til at redegøre for effekten af interventionen på composite outcome.

Det ændrer dog ikke på, at der i SWEPSIS-undersøgelsen ikke er en forskel på composite outcome, og at der således ikke er den evidens, man har fremlagt for et fald i dødelighed.

Med andre ord må vi nøjes med at overveje, hvordan vi bruger evidensen, herunder også når der laves kliniske anbefalinger.

Men vi må også overveje, hvordan vi skaffer den bedste evidens for, hvilken behandling der er bedst i en dansk kontekst, herunder ved sjældne udfald, og ikke mindst fortolke den evidens, vi har, korrekt.

Kvaliteten af faglig anbefalinger

I det netop udsendte høringsmateriale fra Sundhedsstyrelsen danner den svenske SWEPIS-undersøgelse sammen med bl.a. studier fra lande med et væsentligt lavere folkesundhedsniveau og en anden igangsættelsespraksis end den danske samt et mere end 50 år gammelt studie baggrund for anbefalingen om igangsættelse af fødsler i graviditetsuge 41+0.

Sundhedsstyrelsen har altså fundet det acceptabelt at benytte studier, der ikke er repræsentative for danske forhold, samt studier der har svære metodiske udfordringer, og høringsmaterialet viser med al tydelighed, at tolkningen af evidensen er udfordret.

Vælger man at igangsætte gravide kvinder fra 41+0, vil man i et forvejen presset sundhedsvæsen intervenere på yderligere 9.000 raske gravide kvinder med tilhørende afledte effekter af interventionen: Effekten, man ønsker at opnå, vil formodentlig være begrænset eller helt udeblive.

Anbefalingerne afspejler også et ‘Too little, too late – Too much, too soon-approach’, en sundhedspolitisk prioritering, som ofte medvirker til at skabe ulighed i sundhed.

Vi vil derfor opfordre til, at Sundhedsstyrelsen, men også andre væsentlige aktører som f.eks. de faglige selskaber, i højere grad sikrer, at nye anbefalinger udarbejdes på et solidt evidensgrundlag og gerne med deltagelse af en bredere gruppe af fagprofessionelle herunder f.eks. statistikere, så det sikres, at evidensen, der inddrages, tolkes og benyttes korrekt i fremtidige anbefalinger.

Det er afgørende for at sikre et fagligt og bæredygtigt sundhedsvæsen.

Kommentarer

Beslutningsstøtte uden solidt evidensgrundlag.
Med en opfordring til Københavns Professionshøjskole

Tak til debatgruppen for en pædagogisk gennemgang af evidens i almindelighed og evidensen bag Sundhedsstyrelsens forslag til ’Anbefalinger vedrørende igangsættelse af fødsler’, som i øjeblikket er i høring. Der er ingen tvivl om at der foreligger et reelt dilemma, og efter TV2 udsendelsen den 25. november om ’Børn til tiden’ er behovet for information til de gravide steget mærkbart.
Derfor øver jeg mig – som alle jordemødre og fødselslæger for tiden – i så pædagogisk som muligt at forklare gravide hvad der ligger bag den anbefaling – og hvorfor der i øjeblikket foreligger et tilbud om igangsættelse i graviditetsuge 41+3-4. Det er ganske svært at anskueliggøre oplysningen om at eksisterende studier måske/måske ikke giver bevis for et sammenhæng mellem graviditetslængde og overdødelighed; men der forskes jo også i brugerinddragelse i vanskelige beslutninger, og vi klinikere anbefales at udvikle certificerede beslutningsstøtteværktøjer med statistik opstillet i overskuelige ’dottogrammer’.
Stor var min glæde derfor, da jeg i min søgen fandt at Københavns Professionshøjskole så sent som 24. august 2021 havde udgivet en pjece med ’et beslutningsværktøj for kvinder, hvis graviditet er i den sidste del af terminsperioden’1. Og at den ovenikøbet er meget grundig med pædagogiske dottogrammer, evidensgraduering af 24 udvalgte studier og plads til personlige notater og overvejelser.
Men glæden blev til dyb undren, da jeg intet sted på de 22 sider fandt oplyst at der eksisterer studier som nævnt i debatindlægget. Enhver oplysning om at et foster kan dø intrauterint var fraværende. Og hvis det slet ikke nævnes for den gravide, at der kan tænkes at være en let forøget risiko for intrauterin fosterdød i tiden efter 41+0, eksisterer der jo ingen som helst grund til at den gravide sidder foran mig, ingen grund til TV-udsendelser og ingen grund til at Jordemoderforeningen, Dansk Jordemoderfagligt Selskab, Dansk Pædiatrisk Selskab, Dansk Selskab for Obstetrik og Gynækologi og Forældre og Fødsel har spildt deres tid på i fællesskab at lave forslag til en ny national anbefaling.
Jeg er helt enig i debatgruppens opfordring til at Sundhedsstyrelsen og andre væsentlige aktører (herunder statistikere) sikrer at nye anbefalinger udarbejdes på et solidt evidensgrundlag. Men jeg vil gerne udvide opfordringen til at disse aktører i fællesskab sikrer at der udarbejdes beslutningsstøtteværktøjer baseret på eksisterende viden. Københavns Professionshøjskole bør være en del af dette fællesskab og bør anstændigvis trække det mangelfulde værktøj tilbage og efter høringen lave et nyt baseret på studierne bag den kommende nationale anbefaling. Alt andet vil være et svigt af de gravide, der står med dilemmaet i den sidste del af terminsperioden.
Lars Høj
Overlæge, Gynækologisk/obstetrisk afdeling, Ålborg Universitetshospital, Thisted

1. http://www.ucviden.dk/da/ 24.august 2021. Publikationer: Rydahl,E., Juhl, M. & Clausen, J.A. Skal du beslutte om din fødsel skal sættes i gang? Et beslutningsværktøj for kvinder, hvis graviditet er i den sidste del af terminsperioden.