Schoonheid in diversiteit
Omdat elk bedrijfsonderdeel verschillende soorten uitgaven kent, volstond het niet om één model te maken voor het hele waterschap. Dan zouden bijvoorbeeld alle orders van bepaalde bedrijfsonderdelen als uitzonderlijk gemarkeerd worden, terwijl bij andere bedrijfsonderdelen geen enkele order uitzonderlijk zou zijn. Om dit op te lossen hebben we een model gemaakt voor iedere gebruiker die meer dan 20 orders heeft beoordeeld (in de onderzochte periode van 2017 tot 2019).
Klinkt mooi, maar werkt het ook?
Om het model te finetunen en beoordelen hebben we de resultaten voorgelegd aan 2 mensen die beiden 150+ regels beoordeeld hadden in de dataset. Dit waren leerzame sessies die ons de volgende lessen opleverden:
- Verschillende budgethouders maken ieder een eigen afweging voor de beoordeling. Sommige aspecten hiervan zijn moeilijk in een model te vatten.
- Waarschijnlijk lijdt een combinatie van een getraind model en harde regels (bijvoorbeeld alles boven een bepaald bedrag markeren) tot betere resultaten.
- Beoordelaars vinden het lastig te herkennen waarom een regel als uitzondering wordt gemarkeerd.
- Naast de inhoud (is het een normale of een uitzonderlijke regel) is de manier van presenteren van de beoordeling van belang.