Data mining i litteraturhistorien

Der er flere ting - især i kunstens verdens - der ikke umiddelbart kan måles og vejes, men gårsdagens artikel om "kunst møder videnskab" fik mig til at tænke på denne historie:

Den amerikanske litteraturhistoriker Matthew Jockers har for nylig vist, hvordan statistiske redskaber kan anvendes til at analysere klassiske litterære værker. Jockers har lavet data mining på omkring 3.600 bøger fra perioden 1780 til 1900 for at finde mønstre og sammenhænge baseret på bl.a. frekvenser af bestemte ord, tegnsætning, etc.

Jockers har f.eks. haft held til at udarbejde en objektiv metode, der med stor sandsynlighed kan afsløre, om en given teksts forfatter er mand eller kvinde, ligesom han har kunnet påvise, hvorfor en bestemt gruppe forfatteres popularitet mindskedes i takt med, at deres skrivestil ændrede sig fra urban til mere landlig.

Kvantiserbar videnskab anvendt på litteratur. Ganske smart.

Metoden har givet kritik fra flere kolleger; måske fordi de ikke kan se, at det nye værktøj kan bidrage med noget, måske fordi de bare er gamle og konservative.

Læs hele historien og se de flotte grafiske repræsentationer her.

Klaus Seiersens billede
Klaus Seiersen
er ph.d. i fysik og uddannelsesansvarlig hospitalsfysiker på Kræftafdelingen ved Aarhus Universitetshospital. Han skriver om naturvidenskabens forunderlige verden.

Kommentarer (0)