Dette indlæg er alene udtryk for skribentens egen holdning.

Tendenser i blogging: En kvantitativ analyse

15. januar 2013 kl. 22:162
Artiklen er ældre end 30 dage

Der er i skrivende stund skrevet godt 3,7 millioner blogindlæg på internettet i dag, og udbredelsen og indflydelsen af blogs er stigende, bl.a. med indvirkning på samfundet og den måde information formidles og bruges. Men hvad skriver alle bloggerne om? Og hvilke tendenser er der inden for emner og temaer på blogs?

Forleden dag faldt jeg over en artikel med titlen "Empirical analysis of collective human behavior for extraordinary events in the blogosphere", som er udgivet i tidsskriftet Physical Review E. Jeg blev en smule overrasket over en artikel med denne titel i et tidsskrift, som typisk udgiver nye forskningsresultater og -arbejder inden for fysik, men var samtidig interesseret i at læse nærmere.

Forfatterne har undersøgt 1,8 milliarder (japanske) blogindlæg, og i lighed med andre sociale fænomener kan raten af nøgleord i blogindlæg beskrives som potensfunktioner af tiden. Dvs. raten af et givent nøgleord - f.eks. aprilsnar - afhænger som f(t) = |t-t_0|^(-alpha), hvor alpha er en positiv konstant, og hvor t_0 er tidspunktet, hvor nøgleordet er hyppigst forekommende, af tiden. Typisk findes 0.1 < alpha 2.5.

Forfatterne nævner dog, at asymmetri kan forekomme, dvs. at raten af nøgleordet kan stige og falde med forskellig hastighed før og efter begivenheden.

Artiklen fortsætter efter annoncen

Potensafhængigheden bliver i artiklen dels verificeret empirisk på baggrund af de indsamlede data og dels forklaret i lighed med en tidligere udviklet model om, hvordan folk agerer før en deadline (Udgivet i Nature Physics!).

Forfatterne argumenterer også for, at modellen skulle passe for blogindlæg generelt og ikke kun for japanske blogindlæg. Bl.a. sammenligner de med resultater for udvalgte engelsksprogede blogs samt med lignende analyser fra indlæg på Twitter, hvor samme type af potensafhængigheder observeres.

Så der er, ikke overraskende, en bagvedliggende tendens i alle de blogindlæg, vi skriver og læser.

2 kommentarer.  Hop til debatten
Debatten
Log ind eller opret en bruger for at deltage i debatten.
settingsDebatindstillinger
2
15. januar 2013 kl. 23:24

Jeg synes du glemte pointen - i hvert fald som den fremgik af abstract:
[quote]Our empirical results can be used for predicting the number of blogs in advance and for estimating the period to return to the normal fluctuation level.

[/quote]

Den del af artiklen, jeg fokuserer på i mit indlæg, fylder 4-5 linjer i abstract; Den del, du fokuserer på, fylder én linje. Hvis vi antager, at vægten af individuelle pointer i artiklen skalerer med antallet af ord, de beskrives med i abstract, glemte jeg med andre ord ikke pointen:-)

Min beskrivelse af artiklen er naturligvis ikke udtømmende. Jeg faldt dog, som beskrevet i indlægget, over den formaliserede behandling af emner og nøgleord for blogindlæg og syntes, at den kvantitative tilgang hertil var interessant.

1
15. januar 2013 kl. 23:02

Jeg synes du glemte pointen - i hvert fald som den fremgik af abstract:

Our empirical results can be used for predicting the number of blogs in advance and for estimating the period to return to the normal fluctuation level.

Jeg har ikke læst selve artiklen, men måske var der andre interessante ting i den, man kunne fundere over, ud over en formel for hyppigheden af brugen af specifikke ord i blogs fordelt over tid.