Dette indlæg er alene udtryk for skribentens egen holdning.

Visualisering af data - Så simpelt, og dog så kompliceret!

10. juni 2012 kl. 23:0212
Artiklen er ældre end 30 dage

Alle er før eller siden stødt på at skulle visualisere data af mere eller mindre kompliceret natur. I sin simpleste form drejer det sig om at plotte en funktion af én variabel, f.eks. f(x) = sin(x) som funktion af x, og hvis der, som i dette tilfælde, er tale om en simpel funktion, er opgaven ligetil. Er der derimod tale om en mere kompliceret funktion, som f.eks. også har en parametrisk afhængighed af nogle indgående størrelser, f.eks. f(x;a,b,c) = a*exp(-(x-b)^2/c^2), kan visualiseringen være lidt mere krævende - man skal f.eks. overveje, hvilke værdier parametrene kan have, og afhængig af deres (absolutte og relative) størrelser og fortegn kan dataene se vidt forskellige ud. Dette er naturligvis mere kompliceret end blot at visualisere f(x) = sin(x), men dog stadig ukompliceret, idet man har et lukket, analytisk udtryk for dataene. Endelig kan der være tale om data, som man ikke kan udtrykke som f(x) = ..., f.eks. fordi dataene repræsenteres ved et integral, som ikke kan løses analytisk, men skal løses numerisk, eller fordi dataene af andre årsager kun kan udregnes numerisk.

Specielt i det sidste tilfælde, hvor dataene ikke kommer fra et lukket funktionsudtryk, men resulterer fra en mere kompliceret procedure, er god og klar visualisering vigtig; Man har ikke et funktionsudtryk, man kan støtte forståelsen til, hvorfor præsentationen af data er ekstra vigtig. Når man læser i lærebøger og videnskabelige artikler, ser man mange eksempler på, hvordan fremstillingen af data kan gøres. Personligt finder jeg meget inspiration deri, specielt i artikler, hvor man på relativt kort tid og plads skal motivere sit arbejde, fremvise resultater og drage overbevisende konklusioner. Der findes usandsynligt mange videnskabelige artikler, og man kan som læser være tilbøjelig til hurtigt at gå videre til den næste potentielt interessante og oplysende artikel i rækken, hvis ikke tingene er fremstillet klart og tydeligt i den forhåndenværende. Derfor er en overskuelig fremstilling af ens data/resultater så meget desto vigtigere. Eksempler på kreativiteten inkluderer forskellige typer af grafer (fulde, stiplede, prikkede, stiplede-prikkede m.fl.), forskellige tykkelser af grafer, forskellige farver af grafer, indsæt af ét plot i et andet plot, f.eks. for at korrelere én størrelses afhængighed med en anden størrelses, eller indsæt af anden illustration i et plot for at klargøre, hvad der vises i plottet.

Artiklen fortsætter efter annoncen

Senest har jeg selv haft behov for at visualisere det elektriske felt omkring to nanostørrelse sølvkugler, omsluttet af siliciumdioxid. Feltet består af tre komponenter, som hver afhænger af tre rumlige koordinater - for en fastholdt frekvens. Så der ville være behov for mere end tre dimensioner til at indeholde alle informationerne i ét plot! Nedenfor er der to bud på, hvordan det kan visualiseres; I begge plot vises absolutværdien af vektorfeltet, i det første plot på tre symmetriplaner i strukturen, hvor de to kugler er opridset i halvgennemsigtig, og i det andet plot på overfladen af de to kugler. Plots og data der er vist i dem er dannet i MatLab.

Illustration: Privatfoto.

Hvor kreative er I til at visualisere data? Hvilke programmer bruger I til det? Og støder I ofte på ting, som er uklare, fordi plots eller visualiseringer er dårligt fremstillet?

12 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
12
12. juni 2012 kl. 22:07

Efter min mening er der meget elever og studerende kan lære indenfor formidling, herunder det at tale til en forsamling, disponere et budskab og ikke mindst visualiseringteknikker. 2 eller 3 kurser af dette på 10 semestre, burde ikke kunne true nogens faglighed.

Skift det gerne ud med det allestedsnærværende og fuldstændig ubrugelige entreprenørskabsfag, som videnskabsministeriet har trukket ned over ørerne på alt for mange (bachelor)uddannelser.

11
12. juni 2012 kl. 16:50

- og nej, visualisering skal ikke være et fag i skolen, det er noget du selv kan lære, sværere er det ikke og der skal være fokus på fagligheden og ikke ting du selv kan lære på nettet f.eks.

Efter min mening er der meget elever og studerende kan lære indenfor formidling, herunder det at tale til en forsamling, disponere et budskab og ikke mindst visualiseringteknikker. 2 eller 3 kurser af dette på 10 semestre, burde ikke kunne true nogens faglighed.

10
12. juni 2012 kl. 14:38

og hvis du syntes at andre laver dårlige plots så kan du jo bare selv lave dem bedre.</p>
<p>Matlab er fint til det du skal og dækker fuldt ud dit behov og mere til, det er derfor at du har lært matlab - og nej, visualisering skal ikke være et fag i skolen, det er noget du selv kan lære, sværere er det ikke og der skal være fokus på fagligheden og ikke ting du selv kan lære på nettet f.eks.</p>
<p>

Hvordan skulle jeg kunne lave deres plot bedre? Naturligvis kan jeg selv gøre en indsats for, at mine egne plots er læselige og forståelige, men jeg kan jo dårligt påtage mig at sørge for, at alle andre gør det samme. Til gengæld kan jeg tematisere det og påpege, at det er vigtigt, f.eks. Her.

Jeg et enig i, at det ikke er svært - hvorfor det undrer mig så meget desto mere, at man så ofte ser grimme og uklare plots. Kan du forklare, hvorfor det er tilfældets når det nu er så nemt?

9
12. juni 2012 kl. 11:53

og hvis du syntes at andre laver dårlige plots så kan du jo bare selv lave dem bedre.

Matlab er fint til det du skal og dækker fuldt ud dit behov og mere til, det er derfor at du har lært matlab - og nej, visualisering skal ikke være et fag i skolen, det er noget du selv kan lære, sværere er det ikke og der skal være fokus på fagligheden og ikke ting du selv kan lære på nettet f.eks.

8
12. juni 2012 kl. 00:02

Tak for rådet - jeg kendte ikke den specifikke kommando til at gøre det, men havde overvejet muligheden for noget i den stil. Dog er intentensitetsfordelingen af feltet, som udgangspunkt, mest interessant, hvorfor et skalært plot sf størrelsen af feltet er udmærket.

6
11. juni 2012 kl. 16:02

Jeg bruger GLE, som efter min mening er så ubøvlet at bruge, at det fortjener en anbefaling med på vejen. Så er det oven i købet også godt dokumenteret.

2D og 3D plot af f.eks. CSV-data, mulighed for computer modern fonten, algebraiske udtryk. Bitmap insets. Det laver endda hæderlige rute- og kredsløbsdiagrammer. Output formater: PDF, EPS, PS, SVG, EMF, PNG, JPEG.

Kig selv:https://glx.sourceforge.net/

5
11. juni 2012 kl. 15:48

Tak for indlæg og kommentarer.

Til Anders N: Jeg er enig, der burde være mere obligatorisk undervisning om datavisualisering. I princippet burde alle (inden for natur- og teknisk videnskab) lære dette og mestre det igennem at bruge det i praksis. Men jeg har personligt set en del eksempler på, at folk ikke kan/vil fremstille pæne og illustrative plots.

Til Bjarke: Enig, de viste plots giver ingen kvantitativ information. Så hvis de blev vist i en kontekst, hvor de skulle det, ville et være et godt eksempel på dårlig brug af grafisk fremstilling af data:-) Til gengæld viser plotsene nogle kvalitative aspekter - som man potentielt kan bruge til til at lave kvantitative analyser.

4
11. juni 2012 kl. 11:20

Jeg slutter mig til dem, der også gerne vil have data og forklaring på hvad der er plottet. Jeg har et par gange set figurer trykt i artikler eller på websider, hvor en eller flere figurer var spejlvendt uden at at det var fanget i korrekturen! Fx startede den her https://mathworld.wolfram.com/CornuSpiral.html med at sno den forkerte vej (interessant, fordi det er den kurve man bruger i vejsving, hvis man vil billisten det godt). Så diverse plots og grafiske illustrationer er altid et godt sted at lede efter fejl. Både i andres frembringelser og i ens egne :-)

https://xkcd.com/688/

3
11. juni 2012 kl. 10:40

Bruger matplotlib til 2D, og hvis jeg en sjælden gang vil bruge 3D så MayaVi.

Jeg er dog helt enig med Anders N. Christensen i at man skal vælge sit plot med omhu. Selv om Jakob Rosenkrantz de Lasson plots er pæne og giver en god intuitiv forståelse af systemet, er det meget svært at få noget kvantitativt ud af dem. Det kan være svært at vurdere en værdi præcist ud fra en farve, og perspektivet gør at det er meget svært at vide hvor et element befinder sig (prøv f.eks. at fastslå på præcis hvilken (x,y,z) koordinat højre kugles centrum ligger).

1
11. juni 2012 kl. 02:18

Dels er der plottyper, der nærmer sig det forbrydderiske, som fx edderkoppediagrammet der kan manipuleres meget kraftigt til at vise det man gerne vil. Dels er der plottyper, der bare ikke egner sig til gengivelse af visuelle data, da mennesker ikke kan aflæse dem ordentligt, som fx cirkel-/tærtediagrammer.

Selv søjlediagrammer bliver ofte misbrugt. I mange, måske endda de fleste tilfælde, vil en velordnet tabel give et lettere læst og mere eksakt billede af data med mindre forbrug af blæk og plads.

Jeg kan kun anbefale bogen The Visual Display of Quantitative Information, https://www.edwardtufte.com/tufte/books_vdqiBogen giver en meget smuk og grundig indføring i emnet og burde være obligatorisk på alle videregående uddannelser, hvor titlen er relevant.