Det kniber med kvaliteten af forskningens kvalitetstjek

9. februar 2018 kl. 05:037
Det kniber med kvaliteten af forskningens kvalitetstjek
Illustration: MI Grafik / Lasse Gorm Jensen.
Gummistempel eller kvalitetsstempel? Et af fundamenterne for den videnskabelige proces, peer reviews, fungerer ikke som tænkt og ønsket. Men findes der et bedre system? Spørgsmålet deler forskerne.
Artiklen er ældre end 30 dage

Den vigtigste kilde til spredning af resultater i forskningsverdenen er videnskabelige artikler. Og den vigtigste metode til sikring af, at kvaliteten er i orden, er peer reviews – at en forskningsartikel forhånds­bedømmes af ligemænd eller ‘peers’, inden den accepteres af et tidsskrift til offentliggørelse.

Peer review, eller fagfællebedømmelse, er forskernes måde at holde selvjustits på.

Systemet er en af grundpillerne i forskningssystemet, og når det fungerer som tiltænkt, er det med til at forbedre kvaliteten af den videnskabelige produktion. Alt for ofte giver peer reviews dog en falsk følelse af sikkerhed og slipper alt for mange artikler med fejl igennem.

Det er umuligt at finde forskere, der hævder, at systemet fungerer perfekt. Et mindretal mener ligefrem, at systemet er brudt helt sammen.

Artiklen fortsætter efter annoncen

Artiklen fortsætter under grafikken

Illustration: MI Grafik / Lasse Gorm Jensen.

Hvilke konsekvenser, det skal have, er der ikke enighed om, men der er to hovedanskuelser omkring peer review-systemets fremtid:

Den ene medgiver, at systemet ikke er perfekt, men betragter det alligevel som det bedste, der findes. Alt andet vil åbne for totalt kaos og anarki.

Artiklen fortsætter efter annoncen

Retten har talt

Selv om der eksperimenteres med forskellige former for åbne reviews, er reviewere i de fleste tilfælde anonyme over for såvel en artikels forfattere som offentligheden.

Det var også tilfældet med en artikel fra 2013 fra fire forskere fra Ohio State University i The Journal of Strength and Conditioning Research, der analyserede skader efter brug af et styrke- og træningsprogram udviklet af selskabet Cross­Fit i Washington D.C.

Artiklen behagede ikke CrossFit, som hævdede, at den statistiske analyse var fejlagtig, og firmaet sagsøgte udgiveren af tidsskriftet, National Strength and Conditioning Association (NCAA), som er en konkurrent på fitnessmarkedet. NCAA har omvendt sagsøgt CrossFit for æreskrænkelse.

Artiklen er trukket tilbage, men i det juridiske slagsmål har CrossFit i januar i følge Science fået medhold ved retten i San Diego om at få kendskab til artiklens reviewere, som CrossFit mener, har været medvirkende til at fremhæve forskningsartiklen.

Ved andre forsøg på at få kendskab til reviewere – ofte inden for medicinsk forskning – har redaktører afvist med begrundelsen, at det vil få færre til at være reviewere, og retssystemet har hidtil afvist anmodningen. Når anonymiteten er ophævet i denne sag, kan det hænge sammen med, at NCAA i sagen om æreskrænkelser er sagsøger, og at CrossFit er sagsøgte.

Ifølge den anden kan og skal systemet ændres til noget bedre. Og her kan man vælge to veje frem – enten at eksperimentere, modificere og lappe på det bestående system eller at foretage en radikal ændring.

Når peer reviews er kommet under stigende pres, skyldes det en lang række forhold.

Det er blevet vanskeligere at finde gode reviewere til at udføre det ulønnede arbejde, som kommercielle og meget profitable tidsskrifter ofte høster gevinsten af.

Der er et stigende pres på forskere om at skrive artikler, idet de i deres videnskabelige karriere stort set udelukkende måles og vejes på deres publikationer.

Øget konkurrence til de seriøse tidsskrifter er opstået fra såkaldte ‘rovdyrstidskrifter’, som ukritisk bringer alt mod betaling og så at sige lader forskere købe sig til en længere publikationsliste.

Den teknologiske udvikling har udløst ændringer i publicerings­metoder. Forskere kan nu frit lægge artikler frem på såkaldte preprint-servere og dermed helt undgå de dyre tidsskrifter, som universitetsbiblioteker i flere og flere lande ikke har råd eller lyst til at abonnere på. Denne metode giver mulighed for hurtigere og lettere spredning af forskningsresultater.

Ingen anerkendelse

»Et af problemerne med dårlige peer reviews er, at der ikke findes en formel uddannelse,« siger David Moher fra University of Ottawa, der systematisk har analyseret peer review-processen gennem flere år.

Tre eksempler på huller i forskningens kvalitetskontrol

Illustration: MI Grafik.

Falske reviews
Forlaget Springer trak på vegne af tidsskriftet Tumor Biology sidste år ikke mindre end 107 videnskabelige artikler tilbage, som havde været udsat for falske peer reviews.
Artiklernes forfattere havde haft mulighed for at anbefale uafhængige eksperter, der kunne bedømme artiklerne, men opgav falske e-mail-adresser, så manuskripterne i stedet blev sendt til sammensvorne eller forfatterne selv, som derefter gav en meget positiv bedømmelse.
Springer har nu opgivet at stå som udgiver af Tumor Biology.

Illustration: MI Grafik.

Ukvalificerede reviewere
»Vi har alle oplevet at læse en videnskabelig artikel og undres: Hvordan slap dette nogensinde gennem peer ­review?« siger Leonid Schneider, tysk molekylær cellebiolog og videnskabs­journalist. Han fortæller om den amerikanske partikelfysiker Daniel Whiteson, der blev bedt om at peer reviewe artikler til tidsskriftet Diabetes Research and Clinical Practice.
Han gjorde vredt redaktøren opmærksom på, at de ikke burde sende manuskripter til ukvalificerede peer reviewere – som ham selv i dette tilfælde – hvis de ville have en høj standard.
I den efterfølgende korrespondance med
redaktøren blev Daniel Whiteson truet med sagsanlæg for sine angreb.

Illustration: MI Grafik.

Afvist kritik
Projektchef René Fléron på DTU Space skrev til et videnskabeligt tidsskrift og gjorde opmærksom på en elendig artikel, de havde publiceret.
Han fik at vide, at kommentarerne ville gå videre til forfatteren, men han skulle vide, at artiklen havde gennemgået deres review-proces med succes.
Professor Ole Sigmund fra DTU Mekanik anbefalede som reviewer, at en artikel blev forkastet, da den var fejlagtig. Den blev offentliggjort alligevel.

Han finder det tankevækkende, at stort set alt i tilværelsen, hvor man påtager sig et ansvar for andre, kræver tilladelse eller autorisation, men at det ikke er tilfældet for peer review – og forældreskab, tilføjer andre.

Artiklen fortsætter efter annoncen

»Det burde i det mindste indgå i ph.d.-uddannelsen at lære at udføre et peer review,« mener David Moher.

Endnu et stort problem er i øvrigt, at det ikke er forbundet med hverken belønning eller anerkendelse at være reviewer:

»Det skal ændres,« mener David Moher, og den italienske partikel­fysiker Tommaso Dorigo er enig.

Han forklarer, at peer review-­systemet lider under, at det er svært for redaktører at finde gode reviewere – han er selv redaktør af Reviews in Physics – og at reviewere ikke modtager nogen form for anerkendelse for deres arbejde.

»Man kunne begynde med at offentliggøre reviewernes navne, hvis de selv er indforstået hermed, og lade antallet af reviews tælle med i den akademiske produktivitet,« lyder det fra Tommaso Dorigo.

Projektchef René Fléron på DTU Space bakker op:

»Det er i dag ikke en god idé at bruge alt for lang tid på et review, det kommer man ikke selv længere af.«

Mere systematiske overvejelser om peer review-systemets fremtid var en del af konferencen SpotOn i London i 2016, hvor man drøftede, hvordan peer review kunne se ud i 2030.

Rapporten fra konferencen er meget bred i sine anbefalinger og betragtninger, men uddannelse af peer reviewere og anerkendelse er også her medtaget som nøgleelementer. Desuden anbefales det at prøve med andre former for peer reviews, der kan øge gennemsigtigheden.

Et tidsskrift som Nature Communications gør allerede brug af dette, idet reviewere her har mulighed for at give tilladelse til, at deres bedømmelsesrapporter lægges frem online.

Traditionelt er reviewer anonym over for forfatter og læserne. Der er dog efterhånden en del eksempler på, at reviewer er kendt af forfatteren og læserne. Omvendt er andre tidsskrifter gået den anden vej og anonymiserer også forfatterne over for reviewerne i et forsøg på at undgå forudindtagethed.

Der er opbrud flere steder, og det tydeliggør, at der ikke findes nogen standardform for peer review. Det respekterer dels, at der er forskellige traditioner og behov inden for forskellige discipliner, men gør det også vanskeligt for andre at bedømme kvaliteten af et peer review. Og hvad er kvalitetstjekket værd, hvis kvaliteten af det ikke kendes?

Farvel til formelle reviews

Mere radikale synspunkter finder man hos den anerkendte britiske matematiker Timothy Gowers.

I en nylig kommentar i The Times Literary Supplement hiver han Andrew Wakefields studie af en sammenhæng mellem MFR-vaccine og autisme frem som et skrækeksempel på peer review-processens fallit.

Artiklen blev offentliggjort i 1998 i lægeverdenens mest prestigefyldte tidsskrift, The Lancet. Påstandene blev hurtigt tilbagevist af andre, men selv om 10 af artiklens 12 forfattere i 2004 tog afstand fra konklusionerne, var det først i 2010, at artiklen formelt blev trukket tilbage. Så meget for peer review-processens sagnomspundne kvalitetsstempel.

Herover sætter Timothy Gowers det største matematiske gennembrud inden for matematik siden 2000: Grigorij Perelmans bevis for den såkaldte Poincaréformodning.

Tendens eller undtagelser?

Omkring to millioner videnskabelige artikler publiceres hvert år. Forskere bruger samlet set skønsmæssigt mellem 13 og 20 milliarder timer årligt på at foretage ulønnede peer reviews. Her er otte forskeres bud på problemets omfang.

»Peer reviews tjener som en stopklods. Det er en stor hjælp at vide, at to-tre kolleger har brugt tid på at vurdere, om noget er godt nok. Generelt synes jeg dog, at kvaliteten af de peer reviews, jeg selv modtager, er blevet meget mere svingende, også selv om vi publicerer i ‘bedre’ journals.«
Professor Peter Bøggild,
DTU Nanotech

»Peer review er vel reelt den eneste kvalitetssikring, vi har af videnskabelige publikationer. I tider med et enormt pres på faktuel viden er det vigtigt at holde fast i, hvad der er fup og fakta. Jeg bliver ind imellem forundret over, hvad forfattere synes er o.k. og klar til review.«
Projektchef René Fléron,
DTU Space

»Den gode reviewer er ikke en modstander, men en medspiller, som ønsker det bedste både for den konkrete artikel og for videnskaben generelt. Men nogle reviews er lavet af forskere, som kun kender området overfladisk. Problemet er desuden, at processen er utrolig langsommelig.«
Forskningsingeniør Jakob Rosenkrantz de Lasson,
Ticra A/S

»Peer review er lidt som demokrati – det er ikke ideelt, men den bedste kendte styreform. Det betyder, at man kan læse en artikel med en vis grad af tillid til, at indholdet er korrekt. Der slipper dog alligevel meget skidt igennem.«
Professor Ulrik I. Uggerhøj,
Institut for Fysik og Astronomi,
Aarhus Universitet

»Det kan være en utrolig brugbar proces, når det er ærlighed og konstruktiv kritik. Det er vigtigt med minimum to reviewers og helst tre eller flere. Det er overraskende, hvor uenige man kan være som reviewere inden for samme lille forskningsfelt.«
Ph.d. Aviaja Lyberth Hauptmann,
Ilisimatusarfik (Grønlands Universitet)

»Inden for visse discipliner fejler det formelle peer review-system monumentalt.«
Timothy Gowers,
University of Cambridge

»Vi har ikke fundet den bedste måde at opnå tiltro hos læserne på, give bevillingsgivere værdi for pengene eller sikre, at offentligheden kan have tillid til videnskabelige resultater.«
David Moher,
University of Ottawa

»Hvad peer review søger at opnå, er en stor udfordring, men ingen er kommet frem med et system, der er bedre.«
Redaktør Suzanne Jarvis,
Veterinary Records

Perelman indsendte aldrig en artikel om beviset til et videnskabeligt tidsskrift, men uploadede i stedet en serie på tre artikler til preprintserveren arxiv.org i 2002 og 2003, hvorefter en lang række forskere kastede sig over dem.

Da tilpas mange af de førende matematikere var overbevist om rigtigheden af artiklerne, blev den excentriske Perelman både tilbudt matematikkens fineste hæder, Fields-medaljen, og en million dollars i findeløn for sit bevis af Poicaréformodningen af Clay Mathematics Institute. Han afslog i øvrigt begge.

Pointen er, at selv om Perelmans artikler ikke blev udsat for en formel peer review-proces, så blev de så sandelig peer reviewet – men uformelt.

Og denne proces er langt mere effektiv end noget andet inden for matematik og eksempelvis teoretisk fysik, mener Timothy Gowers.

Gowers er en generel fortaler for open access- og online-publikationer og modstander af hele tankegangen om, at offentligt finansieret forskning, peer reviewet ulønnet af offentlige forskere, bliver holdt tilbage bag dyre betalingsmure, så kun få kan læse dem.

For år tilbage var han bannerfører i en boykot af de kostbare tidsskrifter fra forlaget Elsevier, som var med til at ruinere mange universitetsbiblioteker.

Han pointerer, at det langtfra er indlysende, at alt andet end det formelle peer review-system ville være ringere, selv om systemet ikke er perfekt – således som forsvarere af systemet hævder.

Et alternativt system vil med garanti heller ikke være perfekt, men at insistere på perfektion – givet fejlene i det nuværende system – vil i Timothy Gowers øjne kun medvirke til at opretholde status quo.

Groft sagt kan Timothy Gowers kun se én rigtig fordel ved det nuværende formelle peer review-system: Det sikrer alle forskere, der indsender en videnskabelig artikel til et seriøst tidsskrift, en eller anden form for feedback og mindst én læser.

Det er værd at huske på, for hovedparten af den videnskabelige litteratur sætter sig absolut ingen spor, uanset om den er sand eller falsk.

Da Nature i 2014 undersøgte alle videnskabelige artikler, der nogensinde er publiceret, var resultatet, at næsten halvdelen – mere præcist 44 procent – aldrig var blevet citeret i andre forskningsartikler. De var dermed groft sagt helt uden betydning for den videnskabelige proces. Men et peer review havde de bestået.

7 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
7
13. februar 2018 kl. 15:35

Tror ikke man kan generalisere udfra disse tal til dansk forskning, ihvertfæld næppe til biologi.</p>
<p>Kikkede lidt på mine egne 136 artikler</p>
<p>Der er 6 i 2017-2018 der ikke er citeret men de har jo ikke rigtigt haft chancen endnu til at blive det. Ellers er der 11 yderligere der aldrig er blevet citeret. Tror at de tal medregner diverse asiatiske artikler i mere eller mindre ligegyldige predatory open access tidsskrifter. Når jeg skimmer kolleger igennem så er vi også under 10% uciteret

Helt enig, og det er selvfølgelig en vigtig pointe - at gennemsnittet er 44%, men at fordelingen af citerede og aldrig-citerede artikler er meget inhomogen på tværs af lande, tidsskrifter mv.

Jeg synes alligevel, at tallet er ret signifikant, for det betyder, at der findes rigtig meget forskning - eller måske rettere "forskning" - som ikke bruges til noget, og som dermed bare fylder op og udgør støj. Søger man i de store forskningsdatabaser, skal skidt skilles fra kanel, og selvom Google og andre er gode til den slags, bliver det selvfølgelig sværere, jo lavere signal-til-støj-forholdet er.

Så selvom man ikke nødvendigvis personligt bør føle sig ramt over det høje tal, 44%, mener jeg alligevel, at det er en kedelig tendens. En tendens, der rigtignok (formentlig) i vid udstrækning er drevet af predatory open access tidsskrifter, der ikke interesserer sig for videnskabelig saglighed og integritet, men for at udgive mest muligt, uanset kvaliteten af det udgivne.

6
12. februar 2018 kl. 16:29

næsten halvdelen – mere præcist 44 procent

Tror ikke man kan generalisere udfra disse tal til dansk forskning, ihvertfæld næppe til biologi.

Kikkede lidt på mine egne 136 artikler

Der er 6 i 2017-2018 der ikke er citeret men de har jo ikke rigtigt haft chancen endnu til at blive det. Ellers er der 11 yderligere der aldrig er blevet citeret. Tror at de tal medregner diverse asiatiske artikler i mere eller mindre ligegyldige predatory open access tidsskrifter. Når jeg skimmer kolleger igennem så er vi også under 10% uciteret

5
11. februar 2018 kl. 00:32

Umiddelbart vil jeg tro, at antallet af ikke-citerede publikationer siden er steget. Det farlige er, at resultater i disse kan være i strid med øvrig forskning, men at læseren, som kan være en politiker, ”går som udgangspunkt fra at forfattere […] har gjort deres arbejde”.

Fra administrationens og politikernes side er der enormt pres på, at der skal publiceres et antal videnskabelige artikler årligt. For at bevise deres produktivitet vil forskere derfor publicere halvfærdige resultater over flere artikler - også velvidende om, at ingen får gavn af publikationerne. Her får de ofte hjælp fra redaktørerne, som kan være så økonomisk drevne, at de ignorer reviewernes afvisninger.

Offentliggørelse af reviewer’s navne er et interessant forslag. Det ville øge kvaliteten da venskaber ville blive synliggjort. Reviewtiden ville dog blive noget længere, da man nogle i forskningsområder har få eksperter som arbejder på området.

Det største problem er at de fleste publikationer ikke kan reproduceres (https://www.nature.com/news/1-500-scientists-lift-the-lid-on-reproducibility-1.19970). På trods af at alt data efterhånden er digitaliseret, og næsten alt kan anonymiseres uden at miste indhold, så fravælger forskere at publicere i tidsskrifter hvor data skal indsendes. De tre årsager er (1) økonomi (dyrere at indsende), (2) frygt for afvisning da data nu kan undersøges grundigt, og (3) frygt for at miste sin unikke position i forskningsfeltet ved at dele data med konkurrenterne.

Kvalitetssikring er noget man selv må stå for, og jo flere artikler man læser des nemmere bliver det heldigvis. Det afgørende spørgsmål er hvem er forfatteren er og hvad motivationen bag artikelskrivningen var. Dernæst ser man på om det er metode eller hypotese som er i fokus. Sproget og selvkritik røber hvorvidt man desperat har prøvet at publicere eller man er sig sikker i sin sag.

4
9. februar 2018 kl. 16:27

Ak ja, "Da Nature i 2014 undersøgte alle videnskabelige artikler, der nogensinde er publiceret, var resultatet, at næsten halvdelen – mere præcist 44 procent – aldrig var blevet citeret i andre forskningsartikler. De var dermed groft sagt helt uden betydning for den videnskabelige proces. Men et peer review havde de bestået."

Er det ikke er irrelevant statistik?

Vi ligger under for kvantitet fordi det er så nemt at tælle, uanset uddannelse . Vi har eksempler på artikler, der ikke er blevet citeret, men som viser sig at have en stor nytteværdi for andre en dem, der eksilerer i at skrive artikler og citere hinanden.

Måske skulle alle artikler skrives i LaTex, så vil antallet af artikler automatisk falde.

3
9. februar 2018 kl. 12:10

Det vil selvfølgelig kræve at de enkelte forskere skal lære at benytte en flad text-editor, såsom LaTeX, og en GUI til håndtering a Git

Jeg tror man skal leve i et beskyttet nørdtårn for at tro at dette vil ske i verden med biologer, humanister og økonomer.

Peer review er ikke særligt godt, men det kniber med at finde noget bedre som kan fungere. Nu ser vi kun skandalerne, men glemmer de millioner af artikler hvor det rent faktisk fungerede. Men i takt med at suspekte open access tidsskrifter eksploderer og dermed antallet af ringe artikler er det nødvendigt at kikke på om man kan gøre det bedre. Når halvdelen af artikler ikke citeres er en god måde at kikke i Google scholar hvor mange citationer artiklen har fået. Bibliometri er heller ikke den gyldne gral,men er et godt supplement

2
9. februar 2018 kl. 08:52

Forskning handler om at gøre opdagelser og dele disse med andre, for udbrede ideen, at få rettelser på fejl, at få feedback, men mindst ligeså meget feed-forward i form af nye ideer og samarbejder derom. Når vi kigger på peer-reviewed systemet er det derfor væsentligt at vurdere hvorvidt det understøtter disse grundliggende processer.

For at en sådan process skal fungere skal processen være åben, hurtig, iterativ og dokumenteret. Det sidste punkt lever det klassiske peer-review op til, det tredje er yderst tvivlsomt og de to første punkter løfter processen overhovedet ikke.

En af måderne hvorpå der arbejdes i software udvikling når større grupper søger at løse en fælles gåde er i decentrale ledgers hvor versioner og bidrag dokumenteres. Der findes mange systemer til dette, men mest kendt er Git.

Den enkelte udvikler kan arbejde på et bidrag og dele sit bidrag i form at et commit til resten af gruppen. Denne process kan foregå internt i en forskningsgruppe eller en R&D afdeling hvis man håber at opnå patent eller helt åbent om man vil. Andre kan derefter gå ind og læse, kommentere og rette i dokumentet, og dele denne udgave som et commit. Historien gemmes i en en træstruktur der udvikler sig, og såfremt at den oprindelige forfatter mener at det originale var bedst, skabes der en ny gren på træet. Nogengange konvergerer disse igen som tegn på at uoverensstemmelsen ikke længere eksisterer og andre vil divergerende og der opstår forskellige filosofiske retninger. På denne måde kan videskabelsen blive dynamisk, transparent og kreditering for bidrag automatisk.

I udviklingen af Linux var/er der tusindvis af mennesker der arbejder på det samme, så håndtering af skala er efterprøvet, kvalitetskontrollen er ligeledes i top, feks. indikeret ved antallet af severe der benytter Linux.

Det vil selvfølgelig kræve at de enkelte forskere skal lære at benytte en flad text-editor, såsom LaTeX, og en GUI til håndtering a Git. Men det er en efteruddannelse der kan klares på et par dage. Men det vil også muliggøre at vi kan benytte andre formater, end det stedse mere rigide format som tidsskrifterne benytter sig af. Mange komplekse emner egner sig ikke til at blive beskrevet på 6000 ord.

Ligeledes vil det kræve at forskerne tør at gå i denne retning og at universiteterne blot ansætter på H-indexes længere...

1
9. februar 2018 kl. 07:13

De fleste bliver uddannet i lineære kalkulation algoritmer, så autistiske savante kan klare sig glimrende, så det kun er indlæring og god hukommelse der kræves for en uddannelse, og NUL rationale, ergo vi skal til at undervise folk i rationale, især programmører der laver "Storm P Løsninger".