Factcheck: kan Facebook je emoties lezen?

Leestijd: +/- 5 minuten.

De zeven universele emoties volgens Paul Ekman (Icerko Lýdia, CC-by 3.0)

In de Volkskrant van 27 juni verscheen een alarmerend bericht: Facebook zou ‘emotietargeting’ inzetten. Door je gedrag te volgen op het platform zou Facebook jouw emoties kunnen doorgronden. Om vervolgens genadeloos toe te slaan als je je ‘gestrest’, ‘verslagen’, ‘bang’ of ‘nerveus’ voelt. Liefdesverdriet? Hop, een Magnum in je tijdlijn. Boos? Dit nieuwste deathmetal-album al beluisterd?

Het artikel bespreekt vooral de gevolgen voor privacy en de wenselijkheid van emotietargeting. Een belangrijke vraag komt echter niet aan de orde: hoe betrouwbaar is die ‘emotiedetectie’ nou eigenlijk?

Hoe zit het?
De oorsprong van het verhaal ligt in een gelekt rapport dat Facebook heeft geschreven voor een grote Australische bank. De Volkskrant-verslaggever doet het een beetje voorkomen alsof zij het rapport met stijgende verbazing heeft gelezen: ‘in de 23 pagina’s die volgen zet het sociale netwerk de mogelijkheden van emotietargeting nauwkeurig uiteen’. Het rapport is echter nooit gepubliceerd, maar enkel beschreven door de krant The Australian (het artikel zit achter een betaalmuur, maar via Google hier te vinden). Er wordt letterlijk niets gezegd over de methode die Facebook heeft toegepast.

Laten we wel wezen: Facebook heeft er belang bij te overdrijven. Als bedrijven geloven dat Facebook emoties kan lezen, gaat de kassa rinkelen. Helaas is er geen openbaar document dat de methode van Facebook beschrijft. In deze blog beschrijf ik daarom mijn beste inschatting van de effectiviteit.


Een visualisatie van mediaverhalen over big data (Paul Downey, CC-by 2.0)

Opgeklopt
Laten we beginnen met de constatering dat verhalen in de media over big data en voorspellingen van gedrag en emotie vaak nogal opgeklopt zijn. Zo was er veel ophef over een experiment dat Facebook onder bijna 700.000 gebruikers heeft uitgevoerd (hier het wetenschappelijk artikel van Kramer, Guilllory en Hancock, 2014). In dat experiment kregen sommige gebruikers meer negatieve berichten te zien, en anderen juist meer positieve berichten. Daarna werd gemeten hoe deze gebruikers zich daarna voelden, door het aantal emotioneel geladen woorden in hun status updates te tellen. ‘Manipulatie!’ schreeuwden de krantenkoppen. Misschien een beetje overdreven als je bedenkt dat gebruikers slechts 0,1% meer of minder positieve woorden gingen gebruiken. Oftewel, een effect op emotie vergelijkbaar met het vinden van een dubbeltje op straat.

Je kan goede morele bezwaren hebben tegen dit soort experimenten. Maar het is een feit dat A/B-testen continu plaatsvinden, op alle grote websites. Facebook deed dus niets anders dan wat heel veel bedrijven voortdurend doen, soms met veel twijfelachtigere motieven. Het voornaamste verschil was dat Facebook de resultaten publiceerde. Een mogelijk gevolg van deze affaire is dat Facebook kopschuw is geworden, en nu nog minder openbaar maakt. We weten dus niet precies wat Facebook allemaal kan bepalen op basis van jouw data.

Wat weten we wel?
Op basis van openbaar onderzoek van Kosinski, Stillwell en Graepel (zie ook mijn eerdere blog) weten we dat je met Facebook-likes een groot aantal kenmerken redelijk goed kan vaststellen, zoals relatiestatus, seksuele geaardheid en alcoholgebruik. Echter, dit zijn vrij stabiele kenmerken. Emoties komen en gaan; daar zit veel meer variatie in, en dus veel meer onvoorspelbaarheid.

Aan de andere kant: Facebook heeft de beschikking over veel meer gegevens dan de data waar wetenschappers toegang toe hebben (via de API, een module waarmee ontwikkelaars toegang krijgen tot bepaalde Facebookdata). We mogen er wel vanuit gaan dat de geheime analyses van Facebook aanzienlijk beter zijn dan wat er openbaar te vinden is.

Laten we niettemin kijken of we een ondergrens kunnen bepalen: hoe goed kan je emotie voorspellen op basis van op social media geplaatste tekst?

Meten is weten?
We nemen de tekst van status updates weer als basis. Om te beginnen is er dan al een probleem met het meetinstrument. Dat je negatieve woorden gebruikt, wil natuurlijk niet per se zeggen dat je stemming ook slecht is. ‘Eindelijk dat gehate tentamen gehaald, wat een klotevak was dat!’ is een uiting van vreugde, geen blijk van boosheid. Maar ook als het sentiment van de zin werkelijk negatief is, wil dat nog niet zeggen dat je helemaal in de kreukels ligt. Dat hou je op social media sowieso liever verborgen.

Je berichten zeggen wel iets over je emotionele gesteldheid. Het meest relevante onderzoek dat ik kon vinden was van Schwartz en anderen (2016). Zij slaagden er in om met geavanceerde methoden 11% van de verschillen (voor de liefhebber: de R2) in ‘life satisfaction’ te voorspellen op basis van de tekst in een Facebook-tijdlijn. Een knappe prestatie, maar verre van foutloos. En je tevredenheid met je leven is redelijk stabiel, in tegenstelling tot je emotionele stemming. Dus waarschijnlijk zal het voorspellen van emotie nog moeilijker zijn.

Het onderzoek leverde trouwens wel grappige resultaten op, zoals deze word clouds van clusters van woorden die samenhingen met tevredenheid:


Clusters van woorden die samenhangen met hoge (blauw) en lage (rood) tevredenheid van leven. Figuur overgenomen uit
Schwartz et al. (2016).

Nogmaals: de resultaten van Schwartz en collega’s zijn een onderschatting van wat Facebook zou kunnen doen. Facebook kan ook meenemen wat voor foto’s je plaatst, of je op werk bent of op vakantie, op welke artikelen je klikt, met wie je interacteert, enzovoort. Maar realtime emotie voorspellen op basis van Facebookdata lijkt op het eerste oog zeker niet eenvoudig.

 Conclusie
Zeker weten kan ik het niet, maar mijn gok is dat Facebook nog niet erg sterk is in het lezen van emoties. Hoewel Facebook veel meer data kan gebruiken dan openbaar beschikbaar is, zien we dat een relatief stabiel kenmerk als ‘tevredenheid’ al moeilijk te voorspellen is.

Het is een waarheid die onvoldoende wordt erkend: mensen zijn ingewikkelde wezens. Als je met je model 10-20% van de verschillen in complex gedrag of mentale toestand kan verklaren, mag je in je handen knijpen.

Dat wil niet zeggen dat die informatie niet waardevol kan zijn voor bedrijven. Of dat er geen ethische dilemma’s zijn bij de toepassing van big data. Die zijn er, en dat thema gaat steeds belangrijker worden. Maar het idee dat Facebook tot in de krochten van jouw ziel kan afdalen, lijkt me voorlopig wat overdreven.

 

Deze blog is geschreven door Jonas Moons, docent bij de opleiding Communicatie en bij het PubLab betrokken als methodoloog. 

Lees ook eerdere blogs die Jonas schreef vanuit het PubLab