Zo haal je data science uit de black box

Datadriven marketing is nauwkeurigere marketing.

tekst: Arjan Haring*

Datadriven marketing neemt een grote vlucht en daarmee is het vakgebied van data science belangrijker dan ooit. Wat betekent dit voor de marketingfunctie?

Met de digitale transformatie in volle gang worden in rap tempo klantinteracties veel meer en beter meetbaar. Organisaties willen zonder uitzondering meer datagedreven worden, en hierdoor kent het vakgebied van data science ook een enorme groei. Data science is de kunst om kennis uit data te halen, maar dan op een zeer wetenschappelijke manier. Dit vakgebied is een samensmelting van statistiek, machine learning en predictive analytics.

Inmiddels mag je verwachten dat een data scientist in zowat elke marketingmeeting aanschuift. Maar is de marketingdiscipline dan zo aan het veranderen? Moeten alle marketeers nu ook expert in statistiek en data worden? En is marketing eigenlijk überhaupt nog wel nodig?

Van een andere planeet

Data science is voor vele marketeers een blackbox. Toen ik bij Booking.com, één van de meest datagedreven organisaties van Nederland en misschien wel van de wereld, in het data-scienceteam werkte, viel het me op hoe weinig andere marketingcollega’s eigenlijk begrepen van wat we deden. In andere organisaties zie ik hetzelfde verschijnsel, marketeers en data scientists zitten vaak op verschillende golflengtes. Hoog tijd om de blackbox genaamd data science open te maken en te doorgronden.

Toegegeven, het jargon (‘multi-armed bandits’, ‘epsilon-first’ et cetera) helpt niet echt om data scientists beter te begrijpen. Je zou haast denken dat ze van een andere planeet komen. Maar geloof mij, als je de tijd neemt om ze beter te begrijpen, kun je nog heel wat leren van data scientists, en gelukkig zij ook van jou.

Datawetenschappers halen kennis uit data

Voordat je kennis uit data kunt halen, moet je een goede vraag formuleren. Of zoals Facebook-data scientist Sean Taylor het omschrijft: je moet beginnen met ‘een goed omschreven doel’.

Taylor heeft een overzicht gemaakt van de overeenkomsten die hij ziet in data science-projecten. De gehele hiërarchie van data science-behoeften is volgens Taylor in piramidevorm:

Een goed omschreven doel hebben
Het doel kunnen meten
Het opzetten van experimenten
Het krijgen van statistische bewijskracht
Optimalisatie
Contextuele optimalisatie

SMART

Vroeger werd er door sommige marketeers nog wel eens genoegen genomen met vaag omschreven doelen als ‘de lancering van het product een groot succes maken’. Dit gebeurt gelukkig nauwelijks meer. Al sinds eind jaren negentig moeten doelen SMART geformuleerd worden. Data scientists zijn experts om doelen op het gebied van Specifiek (1) en Meetbaar (2) te formuleren.

Nieuw voor de marketeer is het inzetten van experimenten (3) om te begrijpen wat het effect is van zijn acties. Om zeker te weten dat er bepaalde effecten zijn, bijvoorbeeld ‘klanten die langer dan drie maanden onze dienst gebruiken en deze promoten bij familie en vrienden’ wordt er voldoende statistische bewijskracht (4) gezocht.

Is er eenmaal een effect vastgesteld, ‘klantprofiel XYZ is meer waarschijnlijk om positief te reageren op aanbod ABC’, dan kan deze interactie vrij gemakkelijk worden geoptimaliseerd (5). Wanneer nog meer geavanceerde algoritmes worden toegepast, die bijvoorbeeld meenemen hoe anderen klanten reageerde en hoe waarschijnlijk het is dat een nieuwe website bezoeker anders is dan deze gemiddelde klanten, kun  je spreken van contextuele optimalisatie (6).

Data science is marketing, maar dan meer nauwkeurig

Marketingvraagstukken zijn niet veel veranderd in de laatste tien, twintig jaar. Klanten zijn klanten gebleven en we proberen ze nog vaak iets te verkopen via verschillende kanalen. Alleen is het zo dat we in veel van die kanalen inmiddels beter kunnen meten wat het effect is van onze acties, en daarom worden we gedwongen nauwkeuriger te werk gaan.

In het nauwkeuriger denken en werken hebben de data scientists een streepje voor. Een gemiddelde data scientist met een PhD in natuurkunde op zak is gewend om helder op te schrijven wat er gedaan is, en te beargumenteren welk effect er wordt verwacht. Uitpluizen wat oorzaak en gevolg is, en dat ook nog eens verdedigen voor een groep mierenneukers is waar de data scientist voor opgeleid is.

Erg moeilijk

Vóór de digitale transformatie was het zoals gezegd erg moeilijk om te achterhalen of jouw doelgroep de boodschap gezien had, laat staan of er echt wat mee gedaan werd. Dit betekent dat het ook minder belangrijk was om heel nauwkeurig te werk te gaan. Het effect van jouw acties was immers toch moeilijk te meten. In de digitale kanalen heeft de meetbaarheid van ons vak een grote impact gehad op organisatie en processen.

Totale redesigns van websites bijvoorbeeld, behoren tot de verleden tijd. We weten hoe goed de huidige website presteert en we kunnen moeilijk aantoonbaar maken wat een complete redesign echt oplevert. Daarom houden we ons aan relatief kleine, incrementele aanpassingen. AB-testen, door sommige datawetenschappers ook wel de ‘epsilon-first strategie’ genoemd, bepalen welke content je toont.

De digitale transformatie zet door en kanalen die vroeger moeilijk door te meten waren, zoals offline en above-the-line, komen nu geleidelijk in het bereik van de data scientist.

Logische puzzel

De data scientist ziet een marketingvraagstuk als een logische puzzel. Hoe nauwkeuriger je jouw doelen opschrijft, des te beter snapt de data scientist welke puzzel we aan het oplossen zijn. Wat begint met gewone taal, zal naarmate de puzzel duidelijker wordt overgaan in een wiskundige formule.

Marketingvraagstukken vertaald naar data science

Zoals gezegd denk ik dat dat de marketingvraagstukken zelf niet veel zijn veranderd de afgelopen jaren. Zelfs de traditionele marktkoopman kent de volgende uitdaging; er komt een nieuwe potentiële klant naar je kraam, je weet nog niets van deze persoon, hoe benader je hem?

Je hebt verschillende opties, je geeft bijvoorbeeld een standaard openingspraatje over je kraam en de producten die je verkoopt, of je groet en brengt de artikelen onder de aandacht die vandaag in de aanbieding zijn. Een andere optie is om het aanbod te melden waar de meeste vraag naar is, die producten waar vaste klanten om voor rijden.

Cold start-probleem

Een data scientist herkent bovenstaande situatie als het ‘cold start’-probleem. Dit probleem is vooral bekend van het onderzoek naar recommender-systemen, waar Amazons automatische productaanbevelingen een bekend voorbeeld van zijn. De koude start gaat over het feit dat het systeem nog geen of te weinig informatie heeft over de potentiële klant om een zinvolle suggestie te doen.

Maar net als de marktkoopman kent de data scientist ook trucjes om slim om te gaan met dit probleem. Een standaardoplossing hiervoor is om in het geval van een koude start te doen alsof de mogelijk nieuwe klant een doorsnee klant is. Omdat je nog niets weet, schat je de kans het hoogst in dat de nieuwe klant net zoals de meeste klanten zal zijn. In theorie zorgt dit ervoor dat je de kans verhoogt dat de nieuwe klant positief reageert op jouw eerste aanbod.

Het wordt pas echt interessant als een marketeer samen met een data scientist nog andere strategieën bedenkt om om te gaan met het cold start-probleem. Maar de nauwkeurige uiteenzetting van het marketingvraagstuk hierboven is al de eerste stap om kennis uit data te halen. Vanuit hier zal de data scientist waarschijnlijk gewone taal laten voor wat het is en het probleem gieten in een formule.

Voorbeeld van een nette formulering van het cold start-probleem:

 ‘Data science gaat over het kwantificeren van onzekerheid en vervolgens het vinden van de balans tussen het vergroten van de zekerheid en het uitnutten van reeds bereikte (onzekere) conclusies’ - Friso van Vollenhoven, CTO van FashionTrade.com

 

Heterogeniteit

Een ander bekend marketingvraagstuk is hoe om te gaan met de verschillen tussen mensen. Vaak kiezen marketeers vanwege praktische overwegingen een one-size-fits-all-aanpak in de verschillende kanalen, iedereen krijgt hetzelfde aanbod of dezelfde content.

Door verschillende varianten te testen, krijg je een beter idee van wat werkt en kun je de best presterende variant voorschotelen. Online doen we dit door te AB-testen. Maar dan hebben we het wel over de best presterende one-size-fits-all-aanpak. Deze aanpak houdt geen rekening met individuele verschillen.

Als individuen die marketeers benaderen wel dezelfde eigenschappen zouden hebben en op dezelfde manier reageren, dan spreekt een data scientist over homogene groepen mensen. Het feit dat individuen verschillend reageren, wordt de heterogeniteit van de groep genoemd. Bij een AB-test wordt dit feit genegeerd en beschouwen we groepen als homogeen, alsof iedereen hetzelfde reageert.

Stabiel genoeg?

Voordat een data scientist aan de slag gaat met heterogentiteit wil hij weten of het verschil tussen individuen groot genoeg is, en of het verschil ook bijvoorbeeld stabiel is. Dit maakt uit voor de modellen die moeten worden gebouwd. Even weer een voorbeeld: sommige klanten lezen vaak graag veel productinformatie voordat ze weloverwogen een keuze maken, waar andere klanten zijn juist geholpen met beknopte productinformatie.

Het verschil tussen deze twee soorten mensen kan groot zijn. Het is mogelijk dat je de tweede categorie mensen juist afschrikt met veel productinformatie. Stel dat meer productinformatie toch als beste uit de AB-test komt voor de hele groep, dan zorgt het onderlinge verschil (de heterogeniteit van de groep) ervoor dat je omzet laat liggen.

Ook hier doet de marketeer er verstandig aan om nog eens om de tafel te gaan met de data scientist. Persoonlijk vind ik de beweging naar datagedreven marketing erg goed. Maar dat betekent niet dat het huidige marketingdiscipline per definitie minder belangrijk wordt.

Wat de data scientist van de marketeer kan leren

De data scientist is meestal gemotiveerd om marketingvraagstukken uit te pluizen en dit om te vormen zodat we technologie kunnen inzetten om communicatie te optimaliseren. De marketeer is veelal gemotiveerd om te begrijpen wat klanten willen en hoe we ze het beste kunnen aanspreken. Beiden zijn nodig voor datagedreven marketing.

De nuances van wat werkt en wat niet werkt in het marketingvakgebied zijn essentiële ingrediënten om de modellen van de data scientists echt te slim te maken. Ook zie ik het eerder genoemde experimenteren als iets wat een data scientist niet zonder een ervaren marketeer kan doen.

Conclusie

Digitale transformatie in combinatie met data science zorgt ervoor dat er veel meer in de marketingdiscipline gemeten kan worden. Deze meetbaarheid dwingt ons er ook toe om meer nauwkeurig marketing te gaan bedrijven. Ook al is er nu nog een grote kloof tussen data science en marketing, we werken eigenlijk aan dezelfde doelen.

Op het moment dat marketeer en data scientist de tijd nemen om elkaar te begrijpen, zullen beiden er beter van worden. En is de marketingdiscipline klaar voor de toekomst.

*Arjan Haring is naast datagedreven marketeer sinds 2016 organisatieadviseur en eigenaar van The Control Group. In 2011 richtte hij de machine learning startup Science Rockstars, in 2014 verkocht hij het bedrijf. Daarna maakte hij onderdeel uit van het data science team van Booking.com 

Meer weten over data science in de praktijk? Bezoek het , van Adfo Groep en Crux. 6 december aanstaande in Utrecht.

Plaats als eerste een reactie

Ook een reactie plaatsen? Word lid van Adformatie!

Word lid van Adformatie → Login →
Advertentie