Onze zoektocht naar een werkbare dataset

Dit is een blog van Maartje Harmelink, onderzoeker bij het lectoraat Crossmediale Communicatie in het Publieke Domein van de maartjeHU-faculteit Communicatie & Journalistiek. Maartje werkt ook als docent/onderzoeker bij de Hanzehogeschool in Groningen (lectoraat Communication and Sustainable Society).

Bij The Next Level doen we onderzoek naar de rol van sociale media bij crisismanagement en veiligheid. Daarbij maken we gebruik van een benadering die “het gesprek” bestudeert (discoursanalyse). Om gesprekken op sociale media te kunnen onderzoeken, is natuurlijk online data nodig, data van Facebook en/of Twitter bijvoorbeeld. Online data verzamelen klinkt misschien niet zo ingewikkeld, maar niets bleek minder waar. De zoektocht naar de perfecte dataset verliep niet bepaald op rolletjes. Keer op keer is flink wat werk verzet om toch tot een werkbare dataset te komen. Een leerzaam, maar, toegegeven, ook een beetje frustrerend proces. In deze blog beschrijf ik een aantal factoren die de weg naar de perfecte dataset zo moeilijk maakten.

Om online data te verzamelen, hebben we gebruik gemaakt van een aantal social media monitoring tools (Radian6, Coosto en OBI4wan). Met social media monitoring tools kun je, aan de hand van een zoekopdracht, informatie over een bepaald onderwerp verzamelen. Over een crisissituatie bijvoorbeeld. Elke tool heeft voor discoursanalytisch onderzoek echter zo zijn nadelen, die een werkbare dataset in de weg staan.

Radian6 bijvoorbeeld, breekt berichten in de rapportage na drie of vier regels af. Als je Facebook-berichten wilt bestuderen, is dit natuurlijk verre van ideaal. Aan halve berichten hebben we niet veel. En OBI4wan en Coosto? Hun rapportages zijn gelukkig wel compleet, maar geven, net als Radian6 overigens, geen inzicht in het gesprek dat plaatsvindt. In het plaatje hieronder, dat data uit OBI4wan laat zien, zie je dit ook terug. Je ziet reacties, maar je kunt niet zien op welk bericht precies wordt gereageerd:

15-12-08 Blog afbeelding1 Groot

Terwijl juist dat ‘gesprek’ voor een discoursanalyse heel belangrijk is. Reacties maken bijvoorbeeld duidelijk wat in interactioneel opzicht van belang is, doordat ze laten zien hoe een uiting wordt behandeld door andere gespreksdeelnemers.

Een ander nadeel is dat sommige pagina’s niet beschikbaar zijn wegens privacy-instellingen. Die berichten staan wel in de rapportages, maar als je door wilt klikken, zijn sommige pagina’s niet (meer) beschikbaar. Die pagina’s zijn soms wel nodig om de context van het gesprek helder te krijgen.

Kortom, niet echt ideaal allemaal. Maar hoe kan het dan wel? Uiteindelijk hebben we toch OBI4wan gebruikt om data te verzamelen. Een data-analist van de HU heeft er vervolgens handmatig een werkbaar document van gemaakt, dat ook de interactie heel mooi laat zien. Dit zie je ook terug in het plaatje hieronder:

15-12-08 Blog afbeelding2 Groot
Wel zou het natuurlijk hartstikke handig zijn als bijvoorbeeld OBI4wan die interactie zélf weer zou kunnen geven. Wij hebben daarom de stoute schoenen aangetrokken en deze wens bij hen kenbaar gemaakt. OBI4wan bekijkt nu hoe hieraan gehoor kan worden gegeven. Hopelijk levert dit iets op. Het zou onze zoektocht naar data in ieder geval ietsje eenvoudiger maken.

Wordt vervolgd…

Meer weten over social media monitoring tools? Lees dan hier een uitgebreide rapportage, waarin onder andere beschreven staat in hoeverre wij ze geschikt achten voor het verzamelen van online data. Ook hebben we de tools met elkaar vergeleken. De resultaten daarvan vind je ook in de rapportage.

Hou verder de pagina Resultaten in de gaten.

Leave a Reply

You must be logged in to post a comment.