Data mining i litteraturhistorien
Der er flere ting - især i kunstens verdens - der ikke umiddelbart kan måles og vejes, men gårsdagens artikel om "kunst møder videnskab" fik mig til at tænke på denne historie:
Den amerikanske litteraturhistoriker Matthew Jockers har for nylig vist, hvordan statistiske redskaber kan anvendes til at analysere klassiske litterære værker. Jockers har lavet data mining på omkring 3.600 bøger fra perioden 1780 til 1900 for at finde mønstre og sammenhænge baseret på bl.a. frekvenser af bestemte ord, tegnsætning, etc.
Jockers har f.eks. haft held til at udarbejde en objektiv metode, der med stor sandsynlighed kan afsløre, om en given teksts forfatter er mand eller kvinde, ligesom han har kunnet påvise, hvorfor en bestemt gruppe forfatteres popularitet mindskedes i takt med, at deres skrivestil ændrede sig fra urban til mere landlig.
Kvantiserbar videnskab anvendt på litteratur. Ganske smart.
Metoden har givet kritik fra flere kolleger; måske fordi de ikke kan se, at det nye værktøj kan bidrage med noget, måske fordi de bare er gamle og konservative.
Læs hele historien og se de flotte grafiske repræsentationer her.
Flere indlæg fra denne blog
- Og vinderen blev: Feedly 12. jun 2013
- Print din egen pizza 22. maj 2013
- Dambusters: Ingeniører i krig 15. maj 2013
- Hvad er "tid"? - her er svaret 27. apr 2013
- Når astronauter græder 13. apr 2013


Kommentarer (0)