Digitalisering viser de store sammenhænge i humaniora

Ny teknologi såsom digitalisering, avancerede søgemetoder og visualisering er i gang med at ændre den humanistiske forskning - på ingen tid kan vi se de store sammenhænge i ellers uoverskuelige datamængder

Ny teknologi skaber overblik over store datamængder i den humanistiske forskning
Ny teknologi skaber overblik over store datamængder i den humanistiske forskning. Foto: Skovdal & Skovdal Denmark.

Amerikanske matematikere forsker i danske nissehistorier. Det er udtryk for en ny tendens, hvor teknologiske værktøjer bruges til at destillere ny viden fra det store kar af humanistisk forskningsmateriale.

»Det drejer sig om at se skoven i stedet for træerne,« siger Timothy R. Tangherlini, der er professor i folkloristik på det amerikanske universitet UCLA.

Dermed trækker den amerikanske professor på en talemåde fra flere af de folkelige traditioner, som han er ekspert i blandt andet danske folkeminder.

Ved hjælp af digitale metoder forsøger han at finde nye mønstre i et dansk arkiv, som rummer en overflod af historier om onde herremænd, nisser og spøgelser.

Arkivet består af fortællinger, som skolelæreren Evald Tang Kristensen indsamlede fra 1865 til 1923 i det nordlige Jylland.

Det omfatter 250.000 historier fra omkring 4.000 personer - ordsprog, sange, sagn, spøgelseshistorier og fortællinger om hverdagslivet på landet.

Ny metode ser på sammenhænge
I stedet for at lave grundige analyser af de enkelte fortællinger træerne forsøger Timothy R. Tangherlini sig med en videnskabelig metode, der ser på de store sammenhænge skoven. For eksempel mønstre der viser sammenhænge mellem fortællingernes temaer og den enkelte fortællers livsvilkår.

LÆS OGSÅ: Forskere vil redde os fra data-oversvømmelse

I den sammenhæng er han inspireret af litteraturforskeren Franco Moretti, der i 2000 introducerede begrebet 'distant reading' (fjernlæsning, red.) som en ny form for humanistisk forskning.

Franco Morettis metode var et opgør med den traditionelle tekstanalyses fokus på nærlæsning. Begrebet indebar også, at man ved hjælp af informationsteknologi fik adgang til værktøjer, der gav nye muligheder - blandt andet optællinger af bestemte ord i tusindvis af værker.

Digital humaniora kæder information sammen
Timothy R. Tangherlini har sammen med bibliotekarer, programmører og matematikere forsøgt at kaste nyt lys over Evald Tang Kristensens danske arkiv ved hjælp af digitalisering, avancerede søgemetoder og visualisering.

I artiklen 'Computational Folkloristics', som han har skrevet sammen med matematikprofessor James Abello og postdoc ved et forskningsbibliotek Peter Broadwell, fremhæver han muligheden for at få et nyt overblik over materialet og kæde oplysninger om de enkelte fortælleres egne livshistorier og daglige færden mere systematisk sammen med de historier, de fortæller.

Timothy Tangherlinis arbejde er et eksempel på et nyt forskningsfelt, der vinder frem i disse år: digital humaniora. Forskere samarbejder tværfagligt om at benytte ny teknologi til at få øje på sammenhænge i store mængder data. Sammenhænge som det ellers kan være svært at identificere ved traditionelle metoder.

LÆS OGSÅ: Kløften mellem naturvidenskab og humaniora bliver dybere

»Ved hjælp af digital humaniora kan man opnå viden om sammenhænge, man ikke tidligere har set, og man kan be- eller afkræfte nogle af de hypoteser, man tidligere har arbejdet med, fordi der er tale om nogle enorme mængder tekst, som ville være uoverkommelige at analysere for en enkelt forsker,« siger Helle Porsdam, der er professor ved Saxo-instituttet på Københavns Universitet

Teknologi kan lave stemningsanalyser
En anden måde at undersøge store mængder data ved hjælp af ny teknologi består af såkaldt 'stemningsmåling'.

Når vi åbner en avis eller klikker ind på en internetbasseret nyhedsside, får vi informationer om aktuelle hændelser og deres årsag.

Men vi får også noget andet: Vi bliver præsenteret for artiklens 'stemning'. Det handler om ordvalget i artiklen. Er der positive ord som 'optimisme', 'konstruktiv' og 'lettelse', eller bliver der brugt ord som 'had', 'uro' og 'betænkelig', der fører stemningen i en mere negativ retning?

LÆS OGSÅ: Sådan redder vi humaniora

Hvis stemningen i mange artikler om det samme emne peger i samme retning, sker der en afgørende påvirkning af vores adfærd, mener Dr. Kalev Leetaru, Fellow ved University of Illinois, der har arbejdet intenst med store datamængder.

Den mest simple form for stemningsanalyse består i at måle, hvor ofte bestemte stemningsskabende ord optræder i en tekst om det emne, man vil undersøge.

Hver gang et stemningsskabende ord optræder i en artikel, tildeles ordet en værdi. Hvert af ordene omsættes til et negativt eller positivt tal: Jo mere negativt ordet er, jo lavere bliver tallet.

Til sidst tælles tekstens ordværdier sammen og vupti: Så er tekstens samlede stemning reduceret til et enkelt tal.

Kalev Leetura mener eksempelvis, at den metode kunne være brugt til at forudsige magtskiftet i Egypten.

Mere fra Videnskab.dk:
Hvad vil humanister respekteres for?

'Al videnskab er subjektiv'

Det er digitaliseringens skyld - forenklinger, overdrivelser og syndebukke