Tendenser i blogging: En kvantitativ analyse
Der er i skrivende stund skrevet godt 3,7 millioner blogindlæg på internettet i dag, og udbredelsen og indflydelsen af blogs er stigende, bl.a. med indvirkning på samfundet og den måde information formidles og bruges. Men hvad skriver alle bloggerne om? Og hvilke tendenser er der inden for emner og temaer på blogs?
Forleden dag faldt jeg over en artikel med titlen "Empirical analysis of collective human behavior for extraordinary events in the blogosphere", som er udgivet i tidsskriftet Physical Review E. Jeg blev en smule overrasket over en artikel med denne titel i et tidsskrift, som typisk udgiver nye forskningsresultater og -arbejder inden for fysik, men var samtidig interesseret i at læse nærmere.
Forfatterne har undersøgt 1,8 milliarder (japanske) blogindlæg, og i lighed med andre sociale fænomener kan raten af nøgleord i blogindlæg beskrives som potensfunktioner af tiden. Dvs. raten af et givent nøgleord - f.eks. aprilsnar - afhænger som f(t) = |t-t_0|^(-alpha), hvor alpha er en positiv konstant, og hvor t_0 er tidspunktet, hvor nøgleordet er hyppigst forekommende, af tiden. Typisk findes 0.1 < alpha 2.5.
Forfatterne nævner dog, at asymmetri kan forekomme, dvs. at raten af nøgleordet kan stige og falde med forskellig hastighed før og efter begivenheden.
Potensafhængigheden bliver i artiklen dels verificeret empirisk på baggrund af de indsamlede data og dels forklaret i lighed med en tidligere udviklet model om, hvordan folk agerer før en deadline (Udgivet i Nature Physics!).
Forfatterne argumenterer også for, at modellen skulle passe for blogindlæg generelt og ikke kun for japanske blogindlæg. Bl.a. sammenligner de med resultater for udvalgte engelsksprogede blogs samt med lignende analyser fra indlæg på Twitter, hvor samme type af potensafhængigheder observeres.
Så der er, ikke overraskende, en bagvedliggende tendens i alle de blogindlæg, vi skriver og læser.
