In samenwerking met AI specialisten van de HAN universiteiten zijn discursieve strategieën vertaald naar categorisatie algoritmes. Deze algoritmes houden rekening met:
Analyse van zinsbouw
- Het algoritme kan bijvoorbeeld de overtreffende trap (‘mooist’, ‘leukst’) herkennen aan de zinsbouw.
- Analyse van orthografische kenmerken.
- Het algoritme analyseert ook orthografische kenmerken zoals het gebruik van hoofdletters, emoticons en punctuatie. Hierdoor kan het bijvoorbeeld herkennen waar de nadruk op gelegd wordt, zoals wanneer er gezegd wordt ‘DIT KAN NIET!!!’
Entiteitherkenning
- Het algoritme gebruikt gedetecteerde entiteiten om te bepalen of er naar personen of groepen verwezen wordt.
- De aanwezigheid van personen of groepen in een uiting duiden op bepaalde discursieve strategieën, zoals collectiviteit benadrukken.
Sentiment en emotiedetectie
- Het algoritme maakt ook gebruik van gedetecteerde sentiment of emotie in een uiting of deel van een uiting, om te bepalen of een uiting bijvoorbeeld positief of negatief geladen is.
Woordenlijst
- In de analyse aangemerkte woorden zijn verwerkt tot woordenlijsten en vervolgens uitgebreid door met taalmodellen woorden toe te voegen die veel lijken op de originele woorden.
De combinatie van deze methodes tot categorisatie heeft geresulteerd in een transparant algoritme dat uitvergrotend taalgebruik, emotionele evaluaties, proactief taalgebruik, negatief label aan een organisatie toekennen en feitelijke taalgebruik kan detecteren in losse berichten.