close

Få de daglige nyheder fra Version2 og Ingeniøren. Læs mere om nyhedsbrevene her.

close
Ved at tilmelde dig accepterer du vores Brugerbetingelser, og at Mediehuset Ingeniøren og IDA-gruppen lejlighedsvis kan kontakte dig om arrangementer, analyser, nyheder, tilbud mm via telefon, SMS og email. I nyhedsbreve og mails fra Mediehuset Ingeniøren kan findes markedsføring fra samarbejdspartnere.
phloggen

Hvem kan finde mønstre, hvor ingen mønstre er?

Vores hjerne har brugt mange årtusinder på at specialisere sig i at genkende ansigter og derfor genkender vi ansigter alle mulige steder hvor der ikke er nogen. Skyer. Toastbrød. Klipper på Mars. osv. osv.

Det er det vores hjerne er gode til, at finde mønstre og nogen mønstre er den nærmest overfølsom over for: Ansigter og perioder.

Allerede fra de første skriftlige overleveringer finder folk perioder for de mest underlige ting, nogle gange korrekt, andre gange ... ikke så meget.

Fourier satte fingeren direkte på problemet: Enhver funktion kan approximeres hvis man bare har sinusfunktioner nok.

En håndfuld danske forskere har skrevet en artikel om perioder i extremregn i Danmark og det sydlige Sverige og det medførte naturligvis en press-release fra DTU og en pligtskyldig artikel her på ing.dk.

Lad mig slå fast med det samme at de fire forskere har glemt mere om ekstremregn end jeg nogensinde kommer til at vide om det.

Men når det kommer til statistik og specielt detektering af periodiske signaler tror jeg vi står nogenlunde på omgangshøjde og her kommer mit statistiske bull-shit-o-meter trekvart op ad skalaen, når jeg læser at der er fundet perioder på "25-40 år" i et 137 år langt datasæt.

Rent statistisk er det en utrolig svær opgave at køre rent i hus og hvis det lykkedes er det kun fordi der er en meget klar komponent med en veldefineret frekvens.

..hvilket man ikke ligefrem kan kalde et interval på 18-29% af datasættets længde.

Problemet er, som alt for ofte, at man meget nemt kommer til at "over-fitte" sin model og lader den forklare langt mere end den faktisk kan.

Der findes en masse statistiske værktøjer man til at se om man er i farezonen, men efter at have læst artiklen kan jeg ikke umiddelbart se at nogen af dem har været brugt.

Jeg er derfor absolut ikke overbevist af artiklen.

Det er der mange grunde til, men den primære er at resultatet ikke giver nogen fysisk mening.

Der er 40km i fugleflugtslinie fra København til Lund, men det ene sted svinger ekstremregn med en periode på 30.7 år, det andet med 36.7 år. På bornholm er det 24.5 år og på Samsø er det 69.5 år.

For at citere en af mine chefideologer: man ser ikke den slags svingninger, hvis der ikke er nogen der lave den slags svingninger.

Hvor kommer disse vildt forskellige frekvenser fra ? Hvilken fysisk mekanisme gør den dramatiske forskel på de 40km fra Lund og København ?

Det kan i realiteten kun være noget der sker lokalt i København, Lund eller på Samsø eller Bornholm, hvilket vil sige menneskeskabte aktiviteter.

Men hvilke menneskeskabte aktiviteter har perioden 69.5 år på samsø og 36.7 år i København ?

Den sekundære årsag er at hvis man kigger ordentligt på data og den model artiklen bruger passer de overhovedet ikke sammen når det kommer til stykket.

En god uformel metode at danne sig et indtryk, er at plotte sin model sammen med sine data. Det har de heller ikke gjort i artiklen, men jeg har prøvet at lave lidt copy&paste her:

Illustration: Privatfoto

Plottet for København er det mest overbevisende, bortset fra at kurven efter ca. 1995 bør få enhver forsikringsmand til at overveje at skifte job.

Når man laver modeller for endelige datasæt er enderne altid et problem, men det betyder ikke at man kan ignorere dem og i bedste fald kan man sige at modellen passer for københavn frem til 1970, men derefter passer den simpelthen ikke.

Kigger man på de tre sinusperioder hvor den passer, skal man være rigtig dårlig til historie for ikke at bemærke at 1895, 1925 og 1965 alle var tidspunkter hvor der var ret meget gang i økonomien i hovedstaden og den mistanke bliver bestemt ikke svagere af at vi virkelig kørte med klatten efter år 2000.

Plottet for Lund skal man have mere end almindelig uskarpe briller for at synes passer, det er et rigtig flot eksempel på "overfitting". Bemærk specielt at selvom frekvensen ser nogen lunde relevant ud, så er der ingen sammenhæng imellem modellens og datas amplitude, sidstnævnte domineres af toppen af de glade tresser med et hul på hver side, mens resten af kurven nærmest er flad.

Bornholm er ikke meget bedre, igen ser frekvensen måske relevant ud, men der er meget lidt sammenhæng imellem amplituden af data og model.

Og de andre kurver jeg har regnet efter er ikke bedre.

Jeg er sikker på at der kan isoleres faktorer og skrives modeller for ekstremregn i Danmark og Skåne, men jeg vil ikke engang kreditere den i artiklen anvendte "a + b * x + c * sin((x - x0)/d)" med at være et godt første forsøg.

Det skal forskerne bag artiklen ikke klandres for, ideen er nemlig slet ikke deres: den kommer fra Belgien.

Jeg skal ikke gøre mig klog på om den holder vand med belgisk nedbør, jeg har ikke set deres data.

Men som statistisk håndarbejde er artiklen noget bras, på den desværre alt for velkendte formel:

  1. Tag nogle data.
  2. Lav-pasfiltrer dem
  3. Fit en arbitrært valgt matematiske funktion i dekaden over filterets cut-off frekvens.
  4. Undlad at analysere residualet for evidens om over-fitting.

Og deres konklusion indeholder ikke skyggen af kritisk stillingtagen til procedurens validitet eller kvalitet til formålet.

Artiklen bliver derefter udsat for DTU's presse-afdeling der ikke fatter en hat af hvad den handler om, men finder på en god overskrift og en journalist fra ing.dk tager udgangspunkt i press-releaset og prøver at få nogle gode sound-bites fra forskerne.

Det der pisser mig så meget af ved denne statistiske fiasko er at den er lavet under et forskningsprogram der skal skaffe os viden om hvordan vi skal tilpasse os klimaforandringerne.

Det sidste vi har brug for er kloakingeniører der tror at "danskerne givetvis vil opleve færre og mindre regnskyl de kommende år" som journalisten åbenbart er kommet frem til (forskerne nævner det ikke) og at vi derfor kan vente 20 tyve år med at opgradere kloakerne til mere nedbør.

Specielt ikke, når den fem af seks stationer udviser en robust og statistisk signifikant stigning som har meget store økonomiske konsekvenser.

Men hvad afhænger ekstremregn så af, den svinger jo tydeligvis ?

Det er velunderbygget af forskning at nedbør påvirkes af den lokalgeografiske støvproduktion. Specielt franskmændene har været gode til at dokumentere hvorledes regn i Paris følger arbejdsugen og industriferierne. Formodningen er at støvkornene virker som kim for regndråberne.

Mange af kurverne i artiklen har (fælles!) artifakter der lugter langt væk af økonomiske boom-perioder og hvis jeg skulle prøve noget, ville jeg finde tal for bygge- og anlægsaktivitet og andre støvende aktiviteter for de relevante lokalgeografier og lur mig om det ikke giver mindst lige så god korrelation som med en arbitrært valgt sinusfunktion.

Ideen er hermed givet videre.

phk

Poul-HenningKamp
er selvstændig open source-softwareudvikler. Han skriver blandt andet om politik, hysteri, spin, monopoler, frihedskampe gør-det-selv-teknologi og humor.

"Enhver funktion kan approximeres hvis man bare har sinusfunktioner nok."

Fourier begrænsede sig nu klogt nok til at udtale sig om periodiske funktioner - tænk ellers på hvordan det ville gå med f(x) = x.

  • 0
  • 0

Normalt igver jeg ikke en hat for sofaingeniørers nedsabling af andres arbejde. I dette tilfælde tager jeg dog hatten af for en saglig og velunderbygget kritik, der nok burde fremkalde røde ører et eller andet sted.

  • 9
  • 1

Fourier begrænsede sig nu klogt nok til at udtale sig om periodiske funktioner [...]

Begrænsningen var nu mest at det var dem han kunne bevise påstanden for, givet tidens matematiske værktøjer.

Alt rodet med ikke-periodiske funktioner blev først relevant da man fik maskiner til at tage sig af regnearbejdet i midten af forrige århundrede og præcisionen blev først med DSP'ens opfindelse omkring 1980 stor nok til at man behøvede at tage window-funktioner alvorligt.

  • 4
  • 2

Mange af kurverne i artiklen har (fælles!) artifakter der lugter langt væk af økonomiske boom-perioder og hvis jeg skulle prøve noget, ville jeg finde tal for bygge- og anlægsaktivitet og andre støvende aktiviteter for de relevante lokalgeografier og lur mig om det ikke giver mindst lige så god korrelation som med en arbitrært valgt sinusfunktion.

En meget plausibel forklaring paa en variation. Bør undersøges nærmere.

Sinusfunktionen er vel ikke arbitrært (vilkaarlig) valgt men den der giver det bedste fit.

  • 0
  • 1

Umberto Eco om at finde mønstre, hvor ingen er:

He threw open the shutters dramatically and pointed. At the corner of the narrow street
and the broad avenue, stood a little wooden kiosk, where, presumably, lottery tickets
were sold.
"Gentlemen," he said, "I invite you to go and measure that kiosk. You will see that the
length of the counter is one hundred and forty-nine centimeters-in other words, one
hundred-billionth of the distance between the earth and the sun. The height at the rear,
one hundred and seventy-six centimeters, divided by the width of the window, fifty-six centimeters, is 3.14. The height at the front is nineteen decimeters, equal, in other words,
to the number of years of the Greek lunar cycle. The sum of the heights of the two front
corners and the two rear corners is one hundred and ninety times two plus one hundred
and seventy-six times two, which equals seven hundred and thirty-two, the date of the
victory at Poitiers. The thickness of the counter is 3.10 centimeters, and the width of the
cornice of the window is 8.8 centimeters. Replacing the numbers before the decimals by
the corresponding letters of the alphabet, we obtain C for ten and H for eight, or C10H8,
which is the formula for naphthalene."

  • 3
  • 0

Hej PHK,

Lad mig først sige, at jeg generelt er enig - jeg har også set (og lavet, hvis jeg skal være ærlig) meget over-fitting, og ladet mig fortælle, at folk har henvendt sig til NemID, for at spørge hvorfor der er mønstre i koderne på deres nøglekort (I hope not).

  1. Lav-pasfiltrer dem
  2. Fit en arbitrært valgt matematiske funktion i dekaden over filterets cut-off frekvens.

Altså fitting af det frekvensindhold, som filtret afskærer - Eller mente du højpasfiltrer, eller under?

Rent statistisk er det en utrolig svær opgave at køre rent i hus og hvis det lykkedes er det kun fordi der er en meget klar komponent med en veldefineret frekvens.

Ja, således er matematikken.

..hvilket man ikke ligefrem kan kalde et interval på 18-29% af datasættets længde.

Det er til gengæld ikke et krav. Hvis signal støj forholdet er højt nok, kan du med stor sikkerhed afgøre om et signal med længden T indeholder frekvensen 1/T, som jo også er den laveste frekvens Fourier transformation giver.
Bortset fra det, forstår ikke den overordnede pointe: Du anfægter fittingen i artiklen, men angiver selv at signalerne tydeligvis svinger. Hvad er det præcist artiklen påstår, som du er unenig i, og fremgår det overhovedet hvordan de når frem til, at ekstremregnen max vil stige 70% yderligere, når b koefficienten på alle de plots du viser, er positiv?

Venligst
Flemming Nyboe

  • 5
  • 0

Jeg ved ikke om den er arbitrært valgt, men de vildt forskellige frekvenser og faser de finder tyder på at sinus er en arbitrær model i forhold til den underliggende fysiske realitet.

Du påstår først at udsvingene skyldes økonomisk boom, og så påstår du at udsvingene ikke hænger sammen i fase - mener du dermed, at KBH og Jylland er økonomisk uafhængige?

Jeg vil forøvrigt gerne høre hvad du så mener der sker for ekstremregnen de næste 10 år. Umiddelbart fra deres datasæt hælder jeg stadig til en form for sinus-bølge med stigende gnms. Om den så skyldes støv, penge eller ukendte vejr-cykluser er sådan set underordnet.

  • 1
  • 1

Altså fitting af det frekvensindhold, som filtret afskærer - Eller mente du højpasfiltrer, eller under?

Jeg mente "under".

Du anfægter fittingen i artiklen, men angiver selv at signalerne tydeligvis svinger.

Jeg anfægter at "a + bx + c * sin(d(x))" er en relevant funktion at bruge.

Specifikt opponerer jeg imod "c * sin(d(x))" ledet fordi

1) Der er ingen fysisk basis for at antage at det giver mening.

og

2) fordi resultatet tydeligt viser at det ikke giver mening.

Det er særligt punkt 2 der pisser mig af, det er simpelthen elendigt statistisk håndværk ikke at undersøge residualet (= data - model) for at se om modellen faktisk hjælper på at forklare data.

  • 1
  • 0

Det er særligt punkt 2 der pisser mig af, det er simpelthen elendigt statistisk håndværk ikke at undersøge residualet (= data - model) for at se om modellen faktisk hjælper på at forklare data.

Har du adgang til phd afhandlingen, eller gætter du blot på baggrunden for data ud fra nogle abstracts? Og hvor kommer "a + bx + c * sin(d(x))" fra?

Den bliver utvivlsomt værre, men at overlejre en sinusfunktion over en ret linie giver ikke nogen forbedret forudsigelse over bare at bruge den rette linie, se specielt Kbh kurven ovenfor.

Umiddelbart ser det da ud til at passe rimeligt, men din overlejrede sinus-funktion er dårligt fitted. Og så den underlige antagelse om at perioderne er af samme længde stamme vist kun fra dig.

Der er ingen fysisk basis for at antage at det giver mening.

Irrelevant, hvis der var en fysisk basis havde man skrevet en artikel om dét. Dette handler netop om hvad der ikke er indeholdt i modellerne.

fordi resultatet tydeligt viser at det ikke giver mening.

Du indrømmer da selv at der tydeligvis er udsving, og jeg vil endda gå så vidt at sige, at det ligner noget periodisk.

  • 1
  • 2

Har du adgang til phd afhandlingen, eller gætter du blot på baggrunden for data ud fra nogle abstracts? Og hvor kommer "a + bx + c * sin(d(x))" fra?

Jeg har læst den artikel som ing.dk som DTU's PR afdeling kolporterede og som ing.dk skrev en reportage om.

(Den er ikke offentligt tilgængeligt, men jeg fik den meget venligt tilsendt af en af forfatterne.)

I den artikel skriver de at de fitter "a + bx + c * sin(d(x))" og der er ikke skyggen af kritisk sans overfor om det giver nogen mening.

  • 3
  • 1

Du indrømmer da selv at der tydeligvis er udsving, og jeg vil endda gå så vidt at sige, at det ligner noget periodisk.

Der er en meget stor forskel på "ligner noget periodisk" og "er noget periodisk", specielt hvis du giver dig til at lave forudsigelser på basis af modellen.

Men det er slet ikke et spørgsmål om det ligner det ene eller det andet, der er en masse fine statistiske værktøjer der kan fortælle om en given model har forklarings-styrke eller ej og ingen af dem er blevet brugt.

At de finder alle mulige forskellige frekvenser og faser indenfor et meget lille geografisk område burde have fået dem til at overveje om deres model egentlig duede til noget.

  • 6
  • 2

Jeg har læst den artikel som ing.dk som DTU's PR afdeling kolporterede og som ing.dk skrev en reportage om.

Nu har jeg selv haft en artikel igennem en lignende omgang (endte endda på ing.dk), og selvom en PR afdeling er god til at få det interessante frem, så er der stadig viden som går 'lost in translation'. Du er nødt til at hive fat i den originale kilde for at få sandheden, især når du vil udtale dig så skråsikkert om hvad Ida har gjort og ikke har gjort. Kritik af egne resultater samt verifikation vil forøvrigt sjældent komme videre end selve afhandlingen, og måske vise sig kort opsummeret i en journal.

  • 1
  • 2

Hmm... der er ikke noget galt i at lave disse matematiske øvelser for at lede efter ting, der er værd at undersøge, men det forekommer mig at klimaforskning er særlig udsat for folk, der bare laver en frekvensanalyse for at påvise cykliske fænomener med meget lange perioder, som de ikke ved hvad skyldes og ikke har nogen fysisk forklaring på. - "curve fitting" øvelser.

Navne som Khabibullo Abdusamatov og Nicola Scafetta dukker op på nethinden.

Dermed ikke sagt noget om det konkrete arbejde... jeg har ikke læst det. Og det er ganske givet muligt at et eller andet relateret til den Nord-Atlantiske oscillation sætter spor i lokalt dansk vejr. ... men kan vi bruge det til noget i forbindelse med klima-problemet? Næppe...

  • 2
  • 1

Jeg har læste den bagvedliggende artikel.

Det er ikke kilden. Artiklen er skrevet af en pr afdeling. Da aau skrev en lignende artikel af vores afgangsprojekt var der heller ikke skyggen af verifikation - for det er ikke interessant, og det er normalt at hvis en journalist vil have mere info hiver de fat i kilen, som bl.a. var mig. I dette tilfælde er det Ida, hendes vejleder og den phd afhandling hun brygger på som er kilden.

Jeg siger ikke du er helt galt på den, men din kritik er tynd og bygger på antagelser du slet ikke kender. Øvelserne er alligevel gode nok, der er bare overfortolket på dine resultater, nøjagtig som du beskylder Ida for. Dit blog indlæg illustrerer hvad der KAN være galt, ikke hvad du ved der er galt.

  • 1
  • 3

Det er helt standard at en phd studerende undersøger data, opdager en trend, ...

Ja - som jeg også skrev: "der er ikke noget galt i at lave disse matematiske øvelser for at lede efter ting, der er værd at undersøge,"

Men der går efterhånden ikke 2 sekunder fra sådan noget er publiceret til nogen hævder at den udvikling man tilskriver menneskeskabt global opvarmning i virkeligheden bare er cyklisk (indsæt passende lang periode).
- uanset hvad studiet egentligt var beregnet til at undersøge.

  • 3
  • 1

Men der går efterhånden ikke 2 sekunder fra sådan noget er publiceret til nogen hævder at den udvikling man tilskriver menneskeskabt global opvarmning i virkeligheden bare er cyklisk (indsæt passende lang periode).

Sandt, det betyder dog ikke vi kan begå samme fejl som klimaskeptikerne og afvise reel forskning uden grundig kritik. Nogen er nødt til at være voksen i det her spil, og det bør da netop være os ingeniører.

Forøvrigt siger de selv, at trenden er stigende - hvilket faktisk er et vigtigt resultat, selvom der kan være tvivl om udsvingene.

  • 2
  • 1

Hmm... måske. Men det kræver vel egentlig lidt mere indgående kendskab til lokale meteorologiske fænomener.

Hov hov Peter!

Du foreslog "Og det er ganske givet muligt at et eller andet relateret til den Nord-Atlantiske oscillation sætter spor i lokalt dansk vejr".

Påstår du at den Nord-Atlantiske oscillation har forskellig frekvens på Samsø, i København og i Lund ?

Nej vel ?

Når de finder to forskellige frekvenser i Kbh og Lund, må det nødvendigvis være lokale oscillationer der er tale om.

Hvis der altså er oscillationer til at begynde med.

Hvis man ikke kan komme med en plausibel forklaring på hvilket lokalt fænomen der har forskellig frekvens i Lund og København og som via fysiske mekanismer kan påvirke ekstremregnen, er der ret meget der peger på at der ikke er noget belæg for en sinus funktion til at begynde med.

  • 7
  • 0

Påstår du at den Nord-Atlantiske oscillation har forskellig frekvens på Samsø, i København og i Lund ?

Nej. Men jo tættere man kommer på andre fænomener (som f.eks. det Sibiriske højtryk) som følger andre mønstre jo mere vil jeg gætte på at der kan opstå interferens.

Når man sådan bor på landet vænner man sig til at holde øje med vejret - og selvom man ikke deraf bliver klog på det, så opdager man ihvertfald, at det er komplekst. Jeg er 100% klar over at det er lommefilosofi når jeg siger at det måske ikke er så simpelt som blot at erklære at frekvens og fase skal være den samme over hele landet, men der skal altså lidt mere til at overbevise mig om at det nødvendigvis er forkert.

Jeg har ofte - på ren anekdotisk plan - observeret fra mit kontorplads, hvordan vejret kan være fuldstændig anderledes på den anden side af Øresund i forhold til København. Jeg har også tit set hvordan de voldsomme regnvejr, der kan skabes over central-europa kan glide nordover og på magisk vis undgå at ramme os i Jylland - men til gengæld drive ud over Østersøen.

Men du har ret i at man selvfølgelig bør komme på en fysisk forklaring på hvorfor Lund skulle have anderledes forhold end København.
Jeg siger bare at jeg ville være forsigtig med uden videre at konkludere at en sådan ikke findes.

  • 5
  • 0

Normalt vil jeg ikke bruge tid på at svare på denne type indlæg. De mails jeg har modtaget fra PHK viser, at han kan lide at være polemisk og bedrevidende, at han har meget bedre tid end jeg til at skrive indlæg og at konstruktiv dialog ikke er mulig. Både CV, mails og blog viser endvidere, at han ikke har meget forstand på det han udtaler sig om ( i hvert fald i dette indlæg). Men da PHK beklikker en af mine studerendes arbejde må jeg heller komme med et indlæg. For god ordens skyld: Nogle af elementerne som han påpeger er OK og de er allerede diskuteret i artiklen. Det væsentligste kommer nedenfor; resten må stå for hans regning.

Titlen på arbejdet er ”Long-term variations of ...” og for at kunne finde langsomme variationer anvender man et lavpasfilter. Vi påviser i artiklen at den lange svingning er signifikant både med og uden dette filter, og anvender filteret for at slippe af med nogle hurtige variationer som ikke interesserer os. Ja, det er en lang svingning i forhold til måleperioden, men når den findes på alle 6 måleserier er der måske en fysisk forklaring. Vi har desværre ikke kunnet finde denne forklaring ved korrelation til kendte meteorologiske variable hvilket i sig selv gør resultatet interessant (omend vi gerne havde set et andet resultat!). Vi har derfor måttet nøjes med at beskrive svingningerne med en ”dum” model, dvs. uden forklarende meteorologiske variable. Vi interesserer os i artiklen for hældningen (b) og amplituden (c), fordi disse har betydning for dimensionering af infrastruktur og vi gerne vil filtrere svingningen ud, der stadig er kort i forhold til levetider på f.eks. kloakker og veje men væsentlige i forhold til f.eks. politiske beslutninger (hvilket vi dog ikke skriver i artiklen). Det største problem med svingningerne er, at der er en stor faseforskydning mellem de seks stationer, hvilket vi diskuterer indgående, ligesom vi tager kraftige forbehold for at benytte modellen til andet end bestemmelse af (b, hældning) og (c, amplitude). Jeg kan i øvrigt ikke forstå, at PHK efter en grundig gennemlæsning af artiklen foreslår at korrelere til økonomiske boom-perioder. Skal jeg forstå det sådan at en høj-konjunktur i Danmark giver hyppig forekomst af ekstremregn i København og samtidig lav forekomst af ekstremregn på Bornholm?

PHK efterlyser data uden lavpasfilter. Den figur ligger offentligt tilgængeligt her som figur 4 (http://ida.dk/sites/prod.ida.dk/files/svk_... ) og viser også vores personlige motivation for at lave og afrapportere undersøgelsen. Mere overordnet er artiklen et ”eksplorativt studie” der afrapporterer en bearbejdning af data der har betydning for forskellige fagområder. De væsentligste ”modtagere” er klimamodel-forskere, der intenst prøver at forstå og modellere svingninger med perioder på 10-30 år samt ingeniører og hydrologer, der arbejder med risiko for f.eks. oversvømmelser. Og så er der lige en blogger, der ikke er tilfreds. Det lever jeg med og har absolut ikke røde ører.

Selve artiklen ligger her: http://link.springer.com/article/10.1007/s... Man må desværre betale for at se artiklen, men nu kan eventuelle interesserede da selv få syn for sagn.

Fortsat god debat.

  • 7
  • 3

Ja, det er en lang svingning i forhold til måleperioden, men når den findes på alle 6 måleserier er der måske en fysisk forklaring. Vi har desværre ikke kunnet finde denne forklaring ved korrelation til kendte meteorologiske variable hvilket i sig selv gør resultatet interessant

Det er her kæden hopper af for jeres statistiske arbejde.

I har ikke fundet "en lang svingning".

I har fundet en forskellig dominant frekvens og fase for hver enkelt station.

Det tyder netop på at der ikke er "en lang svingning."

(At et ikke existerende signal korrellerer dårligt imod "kendte meteorlogiske variabler" giver sig selv.)

Riskoen for "overfit" når man leder efter periodiske signaler i endelige tidsserier har været alment kendt i over en menneskealder.

Artiklen indeholder ikke skyggen af ærbødighed eller skepsis på dette punkt og der er ikke skyggen af en matematisk/statistisk vurdering af om modellen faktisk har plausibel forklaringskraft eller ej.

Metoden synes at være "Find fem variable det giver det numerisk mindste residual" hvilket så godt som garanterer at man laver overfit.

Med andre ord: Elendigt statistisk håndværk.

Sikkert gjort i bedste mening, men stadig elendigt statistisk håndværk.

Jeg kan i øvrigt ikke forstå, at PHK efter en grundig gennemlæsning af artiklen foreslår at korrelere til økonomiske boom-perioder.

Det må bero på en brist i din baggrundsviden, idet man siden 1950erne har været klar over at lokal støv- og aerosolproduktion påvirker nedbørsmønstre. Der er lavet en hel del studier af denne effekt.

Generelt har økonomiske boom-perioder været karakteriseret ved stor anlægsaktivitet med tilhørende støvdannelse, ligesom forbruget af fossile brændsler i noget omfang følger økonomiske konjukturer.

Men er det forklaringen på noget af variationen i ekstremnedbør ?

Godt spørgsmål.

Nogen, gerne nogen med mere statistisk håndelag end jer, burde regne på det.

Poul-Henning

  • 5
  • 5