Premium

Studenten grasduinen in big data. En dit komt eruit

Studenten van Oklahoma State University lieten op SAS Global Forum zien hoe zij chocolade maken van data.

Tekst: Art Verschuur

Tijdschrift voor Marketing liep in mei rond op het jaarlijkse SAS Global Forum in Las Vegas, georganiseerd door het Amerikaanse data-analyticsbedrijf SAS. Een congres waar 5000 bezoekers op af komen. Voor het eerst mochten op tijdens dit congres op kleine symposia studenten eigen big data-onderzoek presenteren, wat zij dankzij diverse SAS-softwareprogramma’s hadden kunnen uitvoeren. Voor de studenten gewilde tools, omdat je er in een beveiligde omgeving goed mee kunt grasduinen in big data. Variërend van donorschappen, energiegebruik en fatale verkeersongevallen tot de één miljoen interne e-mails van de failliete energiereus Enron, vrijgegeven door de Amerikaanse justitie. Aan creativiteit vervolgens geen gebrek bij de internationale studenten.

Inventief omgaan met data

Voor marketeers sprongen de bijdragen van studenten van Oklahoma State University het meest in het oog. Zij waren meegenomen door marketingprofessor Goutam Chakraborty, gespecialiseerd in quantative marketing. Chakraborty leert zijn studenten inventief om te gaan met datamining, databasemarketing en customer relationship management.

Elk jaar zamelt Chakraborty geld in om 20 tot 30 studenten uit Oklahoma mee te nemen naar het Global Forum. ‘Dit geeft mijn studenten de kans hun onderzoeksresultaten publiek te maken en te bediscussiëren met mensen uit de praktijk.’ Het gevaar dat hij zijn studenten kwijtraakt aan grote bedrijven of andere universiteiten, neemt hij op de koop toe.

Marketen met Yelp

Big data van sociale media gebruiken om je marketingstrategie te bepalen. Dat is de kern van het softwareprogramma dat Anirban Chakraborty ontwikkelde. Chakraborty is tweedejaars student business analytics aan Oklahoma State University en op het SAS Global Forum presenteerde hij zijn bevindingen. Hij onderzocht hoe je met big data van sociale media kunt bepalen in welke wijk van een stad je succesrijk een bedrijf kunt starten. Chakraborty geeft een blik op hoe we in de toekomst kunnen marketen. Met hulp van Yelp.

Chakraborty: ‘Yelp biedt marketeers een overvloed aan data over klanten van dienstverlenende bedrijven. Op Yelp schrijven mensen reviews en doen aanbevelingen aan andere Yelpers over restaurants, uitgaan, hotels, tandartsen, scholen. Mijn idee was om de sentimenten en ervaringen van Yelp-gebruikers toe te passen in een marketingtool, bruikbaar op alle plaatsen waar Yelp actief is.’

Visualiseren

Allereerst verzamelde Chakraborty alle gegevens van de Kamers van Koophandel van dertien Amerikaanse steden. Zo ontstond bijvoorbeeld voor Las Vegas een lijst met adressen van 14.000 bedrijven, die hij allemaal rangschikte op type bedrijf. Zo ontstonden twintig categorieën bedrijven, zoals restaurants, hotels, cafés, winkels, kunstgaleries. Van elk individueel bedrijf bepaalde hij vervolgens de precieze geografische locatie en zette ze in overzichtelijk charts en heatmaps via datavisualisatie.

‘Daarna keek ik naar de big data die Yelp biedt en koppelde die aan mijn heatmaps. Via datamining verzamelde ik van Yelp steeds de vier hoogste ratings van Yelp-gebruikers, voor elke categorie bedrijf en in alle wijken van een stad. Tegelijkertijd doorzocht mijn programma op Yelp op sentiment in de reviews naar de trendy en meest besproken bedrijven in een bepaalde wijk. Zo ontstaat een totaalbeeld van hoe een specifiek bedrijf wordt ervaren door klanten, maar kan ik ook visualiseren wat de trendy wijken zijn in een stad.’

Wel of niet in een hippe wijk

Chakraborty is ervan overtuigd dat je met zijn Yelp-programma goed kunt bepalen of je ergens een commerciële business kunt beginnen of niet. ‘Je kent de ratings van klanten voor specifieke bedrijven, je weet of er meer van jouw soort bedrijven zijn en je kent de gemiddelde leeftijd van de potentiële klanten. Dan is het nog slechts een managementbeslissing om te bepalen of je juist wel of niet in een hippe wijk wilt zitten, met veel concurrentie maar ook veel aanloop. Of juist in een naburige wijk, met iets lagere ratings maar weinig concurrentie.’

Smileys en klantsentiment: textmining emoticons

‘Jij biedt hem toch niet ook een baan aan, hè?! I wanna offer him a job.’ Wantrouwend kijkt de Amerikaan me aan. Maar klaart direct weer op als blijkt dat hij slechts te maken heeft met een journalist van het Nederlandse Tijdschrift voor Marketing.

Tussen ons staat een bedremmelde Sharat Dwibhasi, derdejaars student management information systems aan Oklahoma State University. Dwibhasi had niet verwacht dat we hem meteen op de nek zouden springen. Hij is net klaar met zijn presentatie op het SAS Global Forum over hoe je smileys en andere emoticons die door klanten worden gebruikt, kunt integreren met textmining voor sentimentanalyse.

Grote vlucht

Het gebruik van emoticons op vooral sociale media neemt de laatste jaren een grote vlucht. Dat is lastig voor iedereen die via textmining (merk)sentiment wil meten. Pure tekst van (potentiële) klanten doorlopen en beoordelen op positief of negatief woordgebruik is tegenwoordig makkelijk. Maar emoticons worden in dit soort programma’s bijna nooit meegewogen. Terwijl ze wel iets zeggen over het sentiment van de klant over merk- of productbeleving. Emoticons worden immers door ons brein herkend en verwerkt als non-verbale, emotionele communicatie.

Foutmarges lager

Dwibhasi sprong in dit gat. Hij ontwikkelde een macro die tijdens het textminen zoekt naar emoticons en deze omzet in positieve, negatieve of neutrale woorden. Vervolgens weegt het textmining-programma ook dit stukje klantsentiment. Geniaal, want de tweet I am a fan heeft echt een andere betekenis dan I am a fan L. En I am a fan J kan weer duiden op juist dubbele blijdschap. Dwibhasi heeft ontdekt dat met zijn aanpak de foutmarges in sentimentanalyse met ruim 20 procent kunnen worden verlaagd.

‘Voor mijn onderzoek heb ik bijna een miljoen tweets van drie grote merken gedownload, van klanten van Nike, Adidas en Reebok’, vertelt hij. ‘Daarna heb ik met een klein team alle bestaande emoticons gewaardeerd op positieve, negatieve of neutrale betekenis. Echt puur handwerk nog: twee mensen beoordeelden steeds een emoticon en vertaalde deze in passende woorden. Dit is een subjectieve aanpak en niet wetenschappelijk, maar toch leverde het een sterke basis op om emoticons mee te kunnen wegen in het klantsentiment.’

Cynisch gebruik van emoticons

Groot dilemma is Dwibhasi’s onderzoek was natuurlijk het sarcastisch of cynisch gebruik van emoticons. I am a fan :-). De student uit Oklahoma worstelde daarmee, maar koos uiteindelijk voor een pragmatische oplossing. ‘Voor het meten van sarcasme bestaan geen automatische taalprogramma’s. En je kunt moeilijk een miljoen tweets handmatig beoordelen op sarcasme. Dit is ook onnodig. Want het is eigenlijk heel eenvoudig: een positieve tekst gecombineerd met een negatieve emoticon mag nóóit een positieve uitkomst hebben. En ook een negatieve tekst met een positieve emoticon moet altijd negatief worden beoordeeld.’

&;I can offer you a job&;
Dilemma opgelost. De Amerikaan heeft de hele tijd het gesprek rustig en met interesse gevolgd. Maar zodra we klaar zijn, trekt hij zijn kaartje en duwt het dwingend in de handen van Dwibhasi. ‘Ik ben van een Californische universiteit. We doen in opdracht van Facebook veel aan sentimentonderzoek. I can offer you a job… Think about it... Call me, anytime!’ Zo gaat dat in Silicon Valley en tussen Amerikaanse universiteiten. :-)

Dit artikel staat in

premium

Word lid van Adformatie

Om dit artikel te kunnen lezen, moet je lid zijn van Adformatie. 15.000 vakgenoten gingen jou al voor! Meld je ook aan met een persoonlijk of teamabonnement.

Ja, ik wil een persoonlijk abonnement Ja, ik wil een teamabonnement
Advertentie