Posted on 27/02/2018 by Laurens Vreekamp
Stel, jij krijgt de volgende opdracht van een hoofdredacteur van een landelijke krant:
"Ik wil iedere dag zien welke nieuwsonderwerpen we gisteren niet hebben gecovered (en onze concurrentie wel)."
Hoe zou jij dit dan aanpakken?
Ik had bovenstaande zoekvraag zelf al een tijdje in mijn hoofd zitten. En nu ik bij Spinque werk wilde ik weleens weten wat Spinque Desk hierin voor mij zou kunnen betekenen.
Je kunt je waarschijnlijk wel voorstellen dat een hoofdredacteur van een willekeurig nieuwsmedium zoveel mogelijk wil weten -ook van wat ze niet weet. En in het geval van de specifieke opdracht zoals hier bovenaan staat, wil je als hoofdredacteur waarschijnlijk wel weten wat je niet hebt gedaan t.o.v. andere nieuwsmedia. (Oke, dat je de scoop over de leugen van Halbe Zijlstra hebt gemist -dat wist je waarschijnlijk al wel, maar echt: er zijn zaken waarvan je niet wist dat je ze gemist hebt.)
Het screenshot hieronder toont een fictief dashboard voor een hoofdredacteur. Het deel linksboven is het 'overzicht van gemiste onderwerpen':
Waarom je iedere dag een dergelijk overzicht wil? Om de uniciteit van de ingezette redactionele koers te checken. Om te kijken of jouw redactie geen belangrijke zaken heeft gemist. En überhaupt om op de hoogte te zijn van wat 'de anderen' doen.
En nu we toch bezig zijn: je wilt dan misschien ook graag het omgekeerde weten. En ook over langere of specifieke periodes. En ook niet onbelangrijk: strookt de focus van de eigen publicaties wel met de onderwerpen en insteek waar je leader in bent (of wil zijn)?
Oja, en je wilt deze informatie ook nog koppelen aan je web analytics. Zodat je de volgende drie vragen kunt beantwoorden:
En dan bedenk je: de opdracht formuleren en de vragen stellen zijn relatief eenvoudig, maar... wie gaat deze vragen beantwoorden? En wat heb je dan zoal nodig?
Laat ik je helpen door aan te geven wat ik hier de afgelopen tijd over heb geleerd. Je hebt op zijn minst het volgende nodig:
Met Spinque Desk bij de hand had ik eigenlijk niet meer nodig dan een dataset met nieuwsartikelen (die ik "toevallig" nog had liggen) om direct te kunnen beginnen. Als informatiespecialist op dit domein -de Nederlandse journalistiek- had ik natuurlijk wel een idee over relevante resultaten, maar toen versie 1 van mijn zelf ontworpen search engine de eerste artikelen terug gaf, merkte ik dat ik nog even verder na moest denken over wat er nu echt op het dashboard moest komen.
Traditioneel zou een dergelijk ontwikkeltraject er zo uit zien: iemand heeft een vraag, geeft opdracht, er wordt over gediscussieerd, men gaat naar de tekentafel, er komt een briefing voor een developer, daar wordt iemand bij gezocht, er komen de-briefs, nieuwe voorstellen, en dan, eindelijk, kan men de ontwikkelfase in... om er vervolgens achter te komen dat de originele vraag eigenlijk niet de juiste was. Noem het de waterval-methode voor search engine design.
Met de lean-methode, die goed bij Spinque Desk past, heb je direct resultaat! Het enige dat je nodig hebt is een vraag/opdracht (een goed idee dus!), een dataset en toegang tot Spinque Desk.
Mijn aanpak voor de initiële vraag was als volgt -noem het mijn pseudo-strategie in drie stappen:
Op het dashboard zou ik dan de bijbehorende artikelen willen tonen, zoals aangegeven in Afbeelding 1 - de dashboard-schets:
Wat niet goed bleek te werken bij deze aanpak is, dat je geen artikelen terugkrijgt maar woorden. En die woorden bleken lang niet altijd belangrijke onderwerpen te vertegenwoordigen, laat staan echte 'nieuwsitems' te zijn of de kern van een artikel te schetsen. Kortom: deze strategie voldeed niet om de vraag te beantwoorden.
Na overleg met collega's bij Spinque, gooide ik het over een andere boeg met dit nieuwe inzicht: mijn zoekvraag gaat dus in eerste instantie niet om onderwerp maar om de relevantie van een artikel. Mijn tweede pseudo-strategie ging daarom zo:
In bovenstaand scherm zie je de Spinque Desk-omgeving. Aan de linkerkant zie je visueel weergegeven hoe de zoekstrategie is opgebouwd uit blokken. Het blauwe vlak komt overeen met stap 2 uit onze pseudo-strategie: bepaal relevantie. In dat vlak zie je de bouwblokken die bepalen in welke mate de content van de artikelen dienen overeen te komen.
Aan de rechterkant zie je een voorbeeld van het tussenliggende resultaat. Een artikel van Het Parool (PAR) over de volleyballer Richard Schuil naast een vergelijkbaar artikel uit Trouw (TRN). Het uiteindelijke resultaat bevat de meest relevante artikelen waar de eigen redactie niet over heeft geschreven (stap 3 uit de pseudo-strategie). Dit wordt gerealiseerd door de laatste blokken, linkerhelft, onderaan.
Met deze strategie kwam ik een heel eind. Stap 2 -bepaal relevantie- zie ik overigens niet als een search- of design-probleem maar is echt inhoudelijk van aard: wat vinden wij als zoeker/vrager nu relevant (resultaat)? Als dat nog niet is vastgesteld (en dat is relatief vaak het geval) dan kom je er -Spinque Desk bij de hand- met experiment en discussie makkelijk en snel achter. En, goedkoper dan wanneer je een developer zou hebben ingehuurd.
Uiteindelijk blijven er na strategie-versie 2.0 vanzelfsprekend wel nog enkele (kleine) wensen over om de geschetste oplossing mee te verbeteren:
Wat ik vooral leerde is dat je met Spinque Desk een gereedschap in handen hebt waardoor je vrijwel meteen kunt beginnen met het ontwerpen en uitproberen van je zoekmachine. Zonder eerst veel uit te hoeven denken, tekenen, bediscussiëren en briefen/debriefen, met een groot team. Door te experimenteren met strategieën en zo continu een werkende zoekmachine te kunnen evalueren, kom je er (snel) achter wat wel en niet werkt om relevante resultaten te krijgen.
En het allerbelangrijkste: het lean search engine design proces helpt om er direct achter te komen wat de vraag achter de vraag is:
"Wat is het werkelijke (zoek)probleem dat we willen oplossen?"
Ik ben benieuwd wat nu de volgende vraag is van de hoofdredacteur...