Premium

Digitale assistenten en voice zetten de verhoudingen in search en advertising op de kop

Gaan Bing en Cortana profiteren van doorbraak spraakgestuurde search?

Praten tegen een virtuele assistent. Het voelt nog onwennig. Maar de verwachting is dat we het allemaal gaat doen. Axel Steinman, Argentijn van geboorte en vp international sales bij Bing, meent zelfs dat we aan de vooravond van een disruptie van search en advertising. Hoe dat zo komt en waarom hij daar zo enthousiast over is, bespreken we later.
 
Eerst over de technologische achtergrond van Cortana, de spraakgestuurde virtuele assistent waarmee Microsoft de wereld hoopt te veroveren. Want het betekent nogal wat, dat je kunt praten met een digitale assistent die voor jou het zoekwerk doet en opdrachten uitvoert.
 
Linguïstiek
Om virtuele assistenten in de praktijk te kunnen laten werken, moeten deze bijvoorbeeld gesproken taal kunnen verstaan. Klinkt eenvoudig, maar is het absoluut niet. Elk taalgebied kent bijvoorbeeld zijn eigen dialecten. En zo zijn er meer praktische problemen die om de hoek komen kijken bij spraaktechnologie. Om die op te lossen, is diepgaand wetenschappelijk onderzoek nodig, niet alleen op het gebied van IT, maar ook van linguïstiek.

De ervaringen met voice besturing op de smartphone zijn, laten we zeggen, wisselvallig. Maar er zit progressie in, vervolgt Steinman. Op het weerbarstige terrein van de spraakherkenning bereikte Microsoft vorig jaar jaar een mijlpaal. Steinman verklaart dat de software nu woorden herkent met een accuratesse van meer dan 95 procent: 'Beter dan een mens presteert als je een lijst woorden voorleest’.
 
Wat Microsoft betreft is spraakherkenning daarmee rijp om te worden toegepast. Dit gebeurt inmiddels ook. Zo heeft Skype een optie om real-time een gesprek te vertalen tussen twee mensen die elk een andere taal spreken. En Steinman kondigt aan dat de spraak- en vertaaloptie in meer diensten geïmplementeerd zal worden waar dit relevant is, zoals in Cortana.
 
Begrijpen
Met het slechten van de spraakherkenning barriëre zijn nog niet alle problemen uit de wereld. De digitale assistent moet een vraag namelijk niet alleen feilloos verstaan, het moet deze ook kunnen begrijpen.
 
Search in combinatie met de digitale assistent werkt namelijk totaal anders dan zoeken met een zoekmachine. Waar de vraagsteller in het laatste geval zelf een zoekvraag invoert in de browser, is het in de nieuwe situatie de digitale assistent die voor jou op zoek gaat. En waar in het eerste geval het resultaat een overzicht is met honderden websites waar wellicht het antwoord is te vinden, zal in de nieuwe situatie het antwoord specifiek moeten zijn.
 
Per slot van rekening is het niet erg praktisch als de digitale assistent een zoekvraag beantwoordt met het voorlezen van een waslijst van mogelijke antwoorden. Hier komt de noodzaak van kunstmatige intelligentie om de hoek kijken. Om een antwoord te kunnen geven dat aansluit bij de behoefte, dient de assistent de intentie van de vraagsteller te begrijpen. Welk antwoord sluit het beste aan bij de bedoeling van de vraagsteller.
 
Dat brengt ons op het terrein van kunstmatige intelligentie (AI), eveneens een uitermate complex vakgebied dat vele jaren van baanbrekend wetenschappelijk onderzoek vraagt. Dat er een hype-achtige sfeer leeft rondeom AI, is wat Steinman betreft dan ook niet terecht. 'Om die reden denkt iedereen dat AI iets van de laatste tijd is. Maar bij Microsoft zijn we er al zeker vijftien jaar mee bezig.'
 
Knowledge Graph
Om de intentie van de vraagsteller te kunnen begrijpen, moet de digitale assistent niet alleen diens achtergrond en voorkeuren kennen, hij zal ook bekend moeten zijn van verschillende soorten informatie die aan begrip of woord verbonden zijn. Als voorbeeld geeft Steinman de simpele vraag als: Ik wil naar het strand: ‘Wat is een strand? Hoe zou je strand definiëren? Dat is één manier om die vraag te beantwoorden. Maar je kunt de vraag ook bekijken vanuit het perspectief van de toerist. Welke stranden zijn er in de omgeving? Waar gaan mensen heen? Al die betekenissen zul je paraat moeten hebben om snel en gericht antwoord te geven.’

In vaktermen heet dit de Knowledge Graph. In feite is dit een grote database die wordt gevoed met informatie die afkomstig is uit andere databases, maar ook van eerder uitgevoerde zoekopdrachten.‘Pas als al die informatie is vastgelegd, kun je je erom bekommeren of het antwoord past bij de context waarin de gebruiker een vraagt stelt. Eerst heb je al die informatie nodig over de betekenissen van een woord.’ 
 
Het opbouwen van zo’n database met betekenissen van miljarden woorden en begrippen is een gigantische klus. Steinman merkt op dat Microsoft hier een enorm voordeel heeft, dankzij de beschikbaarheid van Bing. 'In Bing hebben we een miljard objecten gekoppeld aan 20 miljard betekenissen. De Knowledge Graph van Bing produceert de informatie die de Cortana nodig heeft om te werken en te leren.’
 

Algoritmes verrijken
Omdat een voice-gestuurde virtuele assistent niet kan bestaan zonder de onderliggende intelligentie van een zoekmachine, is het aantal mogelijke aanbiedersbeperkt. En de kans dat zich naast Google en Microsoft nieuwe spelers aandienen in de markt, is klein. Het ontwikkelen van een zoekmachine is een miljarden verslindende business waarvoor ze zelfs bij Amazon terugschrikken.
 
Amazon's voice assistent Alexa is 'powered by Bing', vertelt Steinmann. ‘Voor Amazon is het een praktische oplossing om voice search te bieden. En wij profiteren ook. Nee, niet omdat we verdienen aan advertenties. Omdat we hiervan leren. De samenwerking met Amazon geeft ons beter inzicht in hoe de consument omgaat met deze nieuwe manier van zoeken. We verrijken hiermee onze algoritmes.’

Die algoritmes zijn cruciaal, want die bepalen hoe slim een voice-assistent kan zijn. Hoe slimmer de assistent, hoe beter deze kan inschatten in welke situatie de vraagsteller zich bevindt en hoe waarschijnlijker het is dat het antwoord past bij diens intentie. Om die interesses goed te kunnen inschatten, betoogt Steinman, moet de voice-assistent inzicht hebben in de verschillende behoeften die de gebruiker kan hebben.
 
Verschillende levens
Dat is ook waarom Steinman voorspelt dat voice de manier waarop adverteerders omgaan met search zal disrupten. De adverteerder komt er niet meer mee weg om advertenties te presenteren die niet relevant zijn. Een boodschap die niet relevant is, heeft geen waarde en zal irritatie opwekken, met merkschade als gevolg. Advertising moet aansluiten op intent en mindset. En intenties verschillen, afhankelijk van de situatie waarin de gebruiker verkeert.
 
In dit opzicht heeft Microsoft naar eigen zeggen een groot voordeel concurrenten als Facebook en Google/Youtube. ‘Want wij kennen onze gebruiker niet alleen als consument. We ontmoeten hem in drie verschillende leven: thuis (met diensten als Outlook, Skype en MSN) en op kantoor (met Office, Windows en Explorer) en doordat we inzicht hebben in je ‘professionele identiteit’, die wordt gevormd door je professionele interesses en de mensen met wie je contact hebt via LinkedIn.
 
Zelfs een tekstprogramma als Word genereert data. 'Stel, je wilt een artikel schrijven over dinosaurussen. Als je daarover informatie zoekt, kun je dat in Word opzoeken. In theorie zou Microsoft deze informatie kunnen gebruiken om in Word reclame te vertonen. Maar dat is niet de intentie, verzekert Steinman. 'Maar de informatie die we ontlenen aan het vertegenwoordigt wel een bepaalde waarde. Omdat het input waarmee we onze algoritmes verrijken.'
 
 
Veranderend speelveld
Hoe meer Bing weet van de voorkeuren en interesses van de gebruiker, hoe relevanter de antwoorden zullen zijn. En omdat Bing de onderliggende zoektechnologie is van Cortana, wordt ook de virtuele assistent steeds slimmer. Als ik men mijn gezin op reis ga, wil ik altijd de kinderen in de buurt. Omdat het lastig is om twee kamers naast elkaar te boeken, wil ik altijd een suite. Cortana weet dat en gaat automatisch voor mij op zoek naar suites.’
 
De volgende stap zal zijn, dat Cortana ook de boeking verzorgt. Dan onstaat het scenario dat de virtuele assistent in gesprek gaat met de bot van een hotelketen. In die wereld komen alle technieken die nu op het punt staan om door te breken bij elkaar samen: een voice assistent die menselijke taal verstaat en begrijpt dankzij Artificiële Intelligentie die gebruik maakt van zoektechnologie en een uitgebreide Knowledge Graph. In die wereld  zal de ‘zoekbeleving’ van consumenten en daarmee ook de manier waarop adverteerders met search omgaan, ingrijpend veranderen, voorspelt Steinman.
 
De vp international sales van Bing is enthousiast over deze disruptie. De reden waarom, is helder. Op een veranderend speelveld gelden andere spelregels. Steinman ziet een uitgelezen kans die Microsoft heeft om de achterstand op Google, in te lopen en - wie weet - om te zetten in een voorsprong.' Op dit moment is Google in grote delen van de wereld de default zoekmachine voor velen en omdat mensen hechten aan bestaand gebruik, is dit enorm lastig te veranderen. In een nieuwe wereld waarin we gaan zoeken door het uitspreken van opdrachten in plaats van door het intikken van zoekwoorden, zou wel eens kunnen veranderen,' verklaart hij.
 
Een belangrijk terrein waar de digitale assistenten hun werk gaan doen, is de smartphone. Google lijkt in mobile search een voordeel te hebben op Microsoft, omdat het met Android een eigen mobiel platform heeft. Steinman reageert echter dit niet als een groot bezwaar te zien, omdat Cortana (evenals alle Microsoft software) platformonafhankelijk werkt en dus net zo goed functioneert in iOS en Android als in Windows.
 
Battle om de huiskamer
 
Maar de grote strijd zal losbarsten in de huiskamer. Concreet gaat het om de digitale assistenten die zijn ingebouwd in de slimme speakers waarmee we niet alleen toegang hebben tot het wereldwijde web, maar waarmee we ook de meest uiteenlopende apparaten in het huis gaan bedienen. Amazon leidt hier vooralsnog de dans met de Echo (met daarin Alexa), maar de concurrentie zit niet stil. Google ontwikkelde een complete lijn Home speakers met Google Assistant. Microsoft biedt een samen met Harman Kardon ontwikkelde speaker Invoke aan die is voorzien van Cortana, terwijl Apple werkt aan de HomePod (powered uiteraard door Siri).
 
Met de stortvloed van slimme, met het internet verbonden apparaten die op ons afkomt, kan het volgens Steinman niet anders dan dat we dit soort apparaten in huis halen. Maar dat we meer dan één apparaat neerzetten, ligt niet voor de hand. Meer waarschijnlijk is dat we verschillende assistenten te hulp roepen in verschillende situaties. 'Dat je in huis Alexa te hulp roept, en op het werk misschien wel Cortana.'
 
Lachend: ‘En wie weet wordt je wel verliefd op allebei. Volgens onderzoek heeft een kwart van de gebruikers fantasieën over zijn digitale assistent, dus wie weet wat er gebeurt met twee assistenten.’

 

premium

Word lid van Adformatie

Om dit artikel te kunnen lezen, moet je lid zijn van Adformatie. 15.000 vakgenoten gingen jou al voor! Meld je ook aan met een persoonlijk of teamabonnement.

Ja, ik wil een persoonlijk abonnement Ja, ik wil een teamabonnement
Advertentie