Einde inhoudsopgave
Platformisering, algoritmisering en sociale bescherming (MSR nr. 78) 2021/8.2.1
8.2.1 Inleiding aan de hand van een voorbeeld
Willemijn Roozendaal & Marko Jovović, datum 01-05-2021
- Datum
01-05-2021
- Auteur
Willemijn Roozendaal & Marko Jovović1
- JCDI
JCDI:ADS288477:1
- Vakgebied(en)
Arbeidsrecht / Algemeen
Sociale zekerheid algemeen (V)
Voetnoten
Voetnoten
Marko Jovović is advocaat bij Stibbe en staat in die hoedanigheid verschillende online platforms bij.
Cooke 2005, p. 92 e.v.
Er wordt ook wel gesproken van ‘big data’, vgl. Vetzo, Gerards & Nehmelman 2018.
Ontleend aan Kleinberg, Ludwig, Mullainathan & Sunstein 2018.
Idem. In het voorbeeld gaan we uit van supervised learning (zie hierna).
Zie o.a. Kim 2017, p. 857 e.v. of Žliobaitė & Custers 2016, p. 183-201.
Raghavan, Barocas, Kleinberg & Levy 2019.
AlgorithmWatch 2019.
‘Optimaal’ wil in deze context zeggen: zo nauwkeurig mogelijk voor alle bekende gevallen, zonder dat het zo op de bekende gevallen toegesneden is, dat het alleen werkt voor bekende gevallen. Er zijn statistische methoden om te bepalen wat optimaal is.
Algoritmes werden al in de tijd van de oude Grieken gebruikt2 en zijn in feite niet meer dan stappenplannen om van een hoeveelheid informatie (de input) naar een bepaalde uitkomst (de output) te gaan (‘als X, dan Y’). De in de inleiding geschetste maatschappelijke discussie heeft met name betrekking op ‘artificiële intelligentie’, een term waar verschillende soorten algoritmes onder vallen. Wij richten ons hierna op één subtype daarvan, machine learning algoritmes (hierna ook wel: ML-algoritmes). Deze algoritmes kunnen overweg met immense hoeveelheden data.3 Deze worden als input gebruikt om algoritmes te ‘trainen’ om tot een beslisregel te komen, ook wel de decision function genoemd. Er is doorgaans niet één algoritme, maar (minstens) twee: een ‘trainer’ en een ‘beslisser’.4 Het systeem heeft als het ware een ‘leerfase’ en een ‘handelingsfase’. Het trainingsalgoritme wordt in de leerfase ingezet om een model van de data te construeren, het beslisalgoritme. Ter illustratie geven wij een voorbeeld inzake selectie van personeel.5
De eerste stap is het samenstellen van een dataset. Daarin kunnen bijvoorbeeld worden opgenomen persoonlijke gegevens van bestaande werknemers met een bepaalde functie (hierna: functionarissen), zoals cv, postcode, prestaties, socialmediagebruik,6 video-opnames7 en e-mailbestanden,8 alsmede daaraan te koppelen onpersoonlijker datasets, zoals marktcijfers per postcodegebied en arbeidsmarktcijfers per opleiding. Het doel van het gebruik van de dataset is om een model te maken van de eigenschappen van succesvolle functionarissen.
De tweede stap is daarom om gekwantificeerde of kwantificeerbare indicatoren van succes in de dataset aan te wijzen (de doelvariabelen of outputvariabelen), bijvoorbeeld prestaties, klantenwaardering of verkoopcijfers.
Bij de derde stap komt het trainingsalgoritme in beeld. Het doel van het trainingsalgoritme is om tot een functie te komen die optimaal9 de relatie van de afhankelijke variabelen (of inputvariabelen) met de aangewezen doelvariabelen (of outputvariabelen) omschrijft.
De vierde stap is het vaststellen van een formule met een samenvatting van deze samenhang. Dit wordt ook wel aangeduid als ‘het beslisalgoritme’, ‘de beslisser’ of ‘het model’. Opgemerkt zij dat het model niet per se leidt tot een geautomatiseerde beslissing. De uitkomst kan ook slechts gebruikt worden als input voor een menselijke beslissing. De uitkomst van het model zou in ons voorbeeld kunnen bestaan uit de inschatting van de kans dat een nieuw geval (de sollicitant of de nieuwe platformwerker) lijkt op een bekend succesvol geval (‘is dit een high potential?’), het toekennen van een risicoscore (‘deze werker zal met 90% zekerheid >15 uur per week gaan werken’) of de indeling van een nieuw geval in een bepaalde categorie (‘platformwerker X is aantrekkelijk voor postcodegebied Y’). De effectiviteit van het model kan getest worden (gevalideerd worden) door inputgegevens van tot dan toe buiten het model gehouden functionarissen waarvan de output bekend is, in te voeren om te zien of deze output adequaat voorspeld wordt door het model.
Als het model gemaakt is, is de laatste stap om de door nieuwe kandidaten aangeleverde persoonlijke datasets in te voeren in het model. Afhankelijk van hoe het model is ontworpen, geeft deze als gezegd een bepaalde uitkomst per kandidaat.