Het schuldige geheugen? (SteR nr. 32) 2017/II.3.3.5:II.3.3.5 De effectiviteit van de Guilty Knowledge Test

Het schuldige geheugen? (SteR nr. 32) 2017/II.3.3.5

II.3.3.5 De effectiviteit van de Guilty Knowledge Test

Documentgegevens:

mr. D.A.G. van Toor, datum 22-02-2017

Datum: 22-02-2017
Auteur: mr. D.A.G. van Toor
JCDI: JCDI:ADS457994:1
Vakgebied(en): Strafprocesrecht / Algemeen

Na de bespreking van de aandachtspunten om (neuro)geheugendetectietest betrouwbaar af te nemen, volgt in deze paragraaf een overzicht van de correctie classificaties uit meta-analyses, bestaande uit wetenschappelijk en (in veel mindere mate uit) veldonderzoek (omdat daarover weinig wordt gepubliceerd). Het belangrijkste en meeste gebruikte doel is het beoordelen of een persoon daderkennis bezit en daarmee een sterk bewijsmiddel voor de bewezenverklaring te verkrijgen. Een belangrijk punt om de doeltreffendheid van de onderzoeksmethode aan te duiden, is hoe specifiek en sensitief de test is. De specificiteit en sensitiviteit geven de verhouding tussen terechte en valse negatieve uitslagen, respectievelijk de terechte en valse positieve uitslagen weer. Hoe hoger de specificiteit en sensitiviteit van een test, hoe groter de kans dat een individu correct wordt geclassificeerd. In dat geval meet de test wat hij beoogt te meten en komt de score (in grote(re) mate) overeen met de werkelijkheid. In het geval van de GKT betekent een hogere specificiteit en sensitiviteit een hogere kans dat een onschuldige als iemand zonder ‘schuldig geheugen’ wordt geclassificeerd en een schuldige als iemand met een ‘schuldig geheugen’.

Laat ik beginnen met algemene waarneming omtrent de kans op vals-negatieve en vals-positieve classificaties. Als bij de samenstelling en afname van de GKT rekening wordt gehouden met de hierboven beschreven aandachtspunten, is de kans op vals-positieven een stuk kleiner dan de kans op vals-negatieven.1 Voor de GKT worden items met plausibele maar foutieveantwoorden geselecteerd. Een onschuldige persoon heeft geen weet van het correcte antwoord en bij vijf antwoorden dus maar een kans van 20 procent om toevallig en onterecht toch hersenactiviteit te generen bij het daderkennisantwoord (nog daargelaten dat het veroorzaken van hersenactiviteit op het exact juiste moment onwaarschijnlijk is). Bij drie vragen met vijf antwoorden is de kans 0,8 procent dat een onschuldige op (een toevallige en onduidelijke grond toch) alle vragen op het daderkennisantwoord ‘reageert’. Hiermee wordt ook duidelijk dat meerdere items met plausibele, foutieve antwoorden voornamelijk de kans op vals-positieven reduceert. Overigens is vanuit instrumenteel perspectief niet belangrijk welke soort fout wordt gemaakt. In beide gevallen is het resultaat niet overeenkomstig de waarheid.2

Tabel 1. Overzicht van correct en onterecht geclassificeerde schuldigen en onschuldigen met een (neuro)geheugendetectietest.3

	Correct schuldig	Onterecht onschuldig	Correct onschuldig	Onterecht schuldig
Ben-Shakhar & Furedy (1990) Laboratoriumstudies	84%	16%	94%	6%
Elaad (1998) Laboratoriumstudies	81%	19%	96%	4%
Vrij (2000) Laboratoriumstudies	82%	18%	96%	4%
Vrij (2008) Laboratoriumstudies	82%	16%	88%	9%
Meijer, Verschuere & Merkelbach (2010) Laboratoriumstudies Veldstudies	76-84% 42-76%	12-24% 24-58%	83-97% 94-98%	3-17 % 2-6%

Omdat het niet mogelijk is om alle resultaten van verschillend wetenschappelijk onderzoek bij elkaar op te tellen – vanwege de grote verscheidenheid aan methoden van onderzoek en statistische analyses – baseer ik me in deze paragraaf op overzichten van anderen (zie tabel 1). Ben-Shakhar en Furedy behoren tot de eerste die een overzicht hebben gepubliceerd van correcte en onjuiste categorisatie met de GKT.4 Van de 248 schuldigen werden er in tien verschillende laboratiumsettings 208 correct als schuldig geordend. Bij de 208 onschuldigen werd 94 procent correct gecategoriseerd.

Elaad heeft in 1998 een overzicht gepubliceerd van vijftien laboratoriumstudies met in totaal 299 proefpersonen.5 In totaal werden 81 procent schuldigen en 96 procent onschuldigen correct geclassificeerd. Respectievelijk 19 procent en 4 procent werden onterecht als onschuldig of schuldig geordend. Vrij’s overzicht uit 2000 laat vrijwel gelijke percentages zien als Elaad in 1998.6

In 2008 publiceerde Vrij een overzicht van accuraatheidspercentages van enkel neurologische GKT’s.7 Correct geclassificeerd worden ongeveer 80 procent van de schuldigen en bijna 90 procent van de onschuldigen. Dit overzicht wijkt af van de vorige overzichten op het gebied van onterecht als schuldig beoordeelde personen. Met 9 procent is dit meer dan een verdubbeling dan het overzicht uit 2000. Meijer, Verschuere en Merkelbach geven in Psychologie van het Recht een overzicht van percentages bij het gebruik van een (neuro)geheugendetectietest.8 Voor laboratoriumonderzoek geldt dat tussen de 76 en 84 procent correct wordt herkend als schuldig en tussen de 83 en 97 procent als onschuldig. De vals-negatief en -positiefpercentages zijn tussen de 12 en 24 procent en 3 en 17 procent.9

Met uitzondering van het onderzoek van MacLaren dat is opgenomen in het overzicht van Meijer, Verschuere en Merkelbach geeft deze meta-analyse 94 procent correct als laagste score bij de groep onschuldigen personen. Bij schuldige personen wordt in het algemeen zo’n 80 procent correct beoordeeld als een persoon met daderkennis. Gemiddeld heeft de GKT dus een sensitiviteit van ongeveer 0.8 en een specificiteit van 0.94.10 Volgens een meta-analyse uit 2014 (die overigens geen classificatiepercentages vermeldt) lijkt dit vooral te gelden voor huidgeleiding en hersenactiviteit, terwijl ademhaling en hartslag licht lager scoren.11

Overigens blijven vooral de percentages correct schuldigen in veldonderzoek ver achter bij het laboratoriumonderzoek. De enige twee onderzoeken die Meijer, Verschuere en Merkelbach meenemen in hun onderzoek hebben correcte detectie van schuldigen van 42 procent en 76 procent. Hierboven in tabel 1 wordt een overzicht gegeven van deze percentages.

Daarnaast is het interessant om deze resultaten van de GKT te vergelijken met de traditionele leugendetectietest (die gebruik maakt van de controlevragentechniek).12 De traditionele leugendetectie is bekender bij het algemene publiek. Vaak rijst echter de vraag of deze test wel betrouwbaar is. Schuldigen worden rond de 80 procent in laboratoriumonderzoek en 85 procent in veldstudies correct herkend en in 7 procent (laboratorium) en 10 procent (veld) onterecht als onschuldig aangeduid.13 Voor onschuldigen geldt dat tussen de 60 en 80 procent (laboratorium) en 60 en 75 procent (veld) correct als onschuldigen worden beoordeeld.14 Tussen de 10 en 23 procent worden onterecht als schuldig gecategoriseerd.15

Hiermee wordt de zwakte van de traditionele leugendetectietest duidelijk.16 De kans dat een onschuldige persoon daadwerkelijk als onschuldig uit de test komt, is aanzienlijk kleiner. In die zin is de GKT veel effectiever. Hoewel de GKT niet foutloos kan worden toegepast, zijn de resultaten (sensitiviteit van ongeveer 0.8 en een specificiteit van 0.94) uit laboratoriumonderzoek voor experimenteel onderzoek sterk.17 In 80 procent van de onderzoeken wordt een persoon die daderkennis bezit herkend en in 20 procent wordt de persoon die daderkennis bezit ten onterechte niet herkend (een vals-negatieve classificatie). In 94 procent van de onderzoeken wordt een persoon zonder daderkennis terecht als onschuldig beoordeeld en in 6 procent wordt vals-positief geclassificeerd. In een ruime meerderheid van classificaties wordt het doel – het herkennen van schuldigen en onschuldigen op basis van geheugenonderzoek – bereikt.

Dat geen honderd procent score wordt (beter: kan worden) behaald, is mijns inziens niet problematisch. Geen enkele wetenschappelijke methode heeft een sensitiviteit en specificiteit van 1.0. Toch wordt in de praktijk veelvuldig gebruik gemaakt van DNA-onderzoek, psychiatrisch diagnostische tests en verschillende identificatiemethoden, zoals een handschriftanalyse, stemanalyse en geuridentificatieproef. Ook deze tests zijn niet honderd procent betrouwbaar en kunnen dat niet zijn, maar toch worden zij als keten in bewijsredeneringen, bewijsoverwegingen gebruikt. In het (Nederlandse) strafprocesrecht gaat het er ook niet om dat met één methode de waarheid wordt gevonden, maar dat het geheel aan bewijs (in onderlinge samenhang beschouwd) overtuigend genoeg is om een beslissing over de bewijsvraag te nemen.

Daarin kan (neuro)geheugendetectie vanuit een effectiviteitsperspectief absoluut een rol van betekenis spelen (of in de toekomst gaan spelen) omdat (1) over concrete items kan worden vastgesteld of de verdachte daderkennisbezit en; (2) eventueel met een searching GKT startinformatie voor vervolgonderzoek kan worden verkregen. Problematischer is dat tot op heden weinig veldonderzoek met de GKT is gedaan. Uit het overzicht van veldonderzoek blijkt dat de classificatie als onschuldig en de vals-positieve classificatie ongeveer gelijk blijven met het laboratoriumonderzoek. Er worden echter meer vals-negatieve fouten gemaakt en minder vaak correct als schuldig geclassificeerd. Voordat de GKT, zoals die zijn waarde in laboratoriumonderzoek heeft bewezen, hetzelfde effect kan hebben in de praktijk is meer onderzoek nodig.

Toon alle voetnoten

Voetnoten

Voetnoten

E. Elaad, A. Ginton & N. Jungman, ‘Detection Measures in Real-Life Criminal Guilty Knowledge Tests’, Journal of Applied Psychology 1992, 5, p. 757 en G. Ben-Shakhar, M. Bar-Hillel & M. Kremnitzer, ‘Trial by Polygraph: Reconsidering the Use of the Guilty Knowledge Technique in Court’, Law and Human Behavior 2002, 5, p. 533-534 en D. Carmel, E. Dayan, A. Naveh, O. Raveh & G. Ben-Shakhar, ‘Estimating the Validity of the Guilty Knowledge Test From Simulated Experiments: The External Validity of Mock Crime Studies’, Journal of Experimental Psychology: Applied 2003, 4, p. 261 en W.G. Iacono, ‘The Forensic Application of “Brain Fingerprinting”: Why Scientists Should Encourage the Use of P300 Memory Detection Methods’, AJOB 2008, 1, p. 31 en E.H. Meijer & H. Merkelbach, ‘Leugendetectie: oude waarheden en nieuwe technologie’, Justitiële Verkenningen, 2008, 34, p. 45 en D.V. Meegan, ‘Neuroimaging Techniques for Memory Detection: Scientific, Ethical, and Legal Issues’, AJOB 2008, 1, p. 15, 17-18.

Vanuit rechtsbeschermend perspectief is de soort fout wel belangrijk. Een vals-negatief resultaat (ten onrechte onschuldig) is minder acceptabel dan een vals-positief resultaat (ten onrechte schuldig). Het adagium luidt immers niet voor niets ‘beter tien schuldigen vrijgesproken dan één onschuldige veroordeeld’.

Niet alle percentages tellen op tot 100% omdat soms geen beslissing kan worden gemaakt of iemand schuldig of onschuldig is.

G. Ben-Shakhar & J.J. Furedy, Theories and Applications in the Detection of Deception: APsychophysiological and International Perspective, New York, NY: Springer-Verlag 1990, p. 52.

E. Elaad, ‘The Challenge of the Concealed Knowledge Polygraph Test’, Expert Evidence 1998, 3, p. 168.

A. Vrij, Detecting Lies and Deceit, Chichester: John Wiley & Sons 2000, p. 197.

A. Vrij, Detecting Lies and Deceit, Chichester: John Wiley & Sons 2008, p. 358.

E.H. Meijer, B. Verschuere & H. Merkelbach, ‘Leugendetectie met de polygraaf’, in: P.J. van Koppen, H. Merkelbach, M. Jelicic & J.W. de Keijser (red.), Reizen met mijn Rechter:Psychologie van het Recht, Deventer: Kluwer 2010, p. 689-704.

Hierbij is het onderzoek van MacLaren (2001) een uitschieter met 17%. De overige vermeldde onderzoeken in het overzicht hebben een percentage onterecht schuldig van 2, 3, 4 en tweemaal 6%.

10.

Het bijzondere is dat deze percentages sterk overeenkomen met de in 1988 berekende percentages van Lykken, de bedenker van de Guilty Knowledge Test. D.T. Lykken, ‘Detection of Guilty Knowledge: A Comment on Forman and McCauley’, Journal of AppliedPsychology 1988, 2, p. 304.

11.

E.H. Meijer, N. Klein Selle, L. Elber & G. Ben-Shakar, ‘Memory detection with the Concealed Information Test: A meta analysis of skin conductance, respiration, heart rate, and P300 data’, Psychophysiology 2014, 9, p. 891.

12.

G. Ben-Shakhar & J.J. Furedy, Theories and Applications in the Detection of Deception: A Psychophysiological and International Perspective, New York, NY: Springer-Verlag 1990, p. 45-49 en E.H. Meijer, B. Verschuere & H. Merkelbach, ‘Leugendetectie met de polygraaf’, in: P.J. van Koppen, H. Merkelbach, M. Jelicic & J.W. de Keijser (red.), Reizen metmijn Rechter: Psychologie van het Recht, Deventer: Kluwer 2010, p. 696.

De algemene tendens is dan ook om de leugendetectietest te bestempelen als ontoelaatbare methode, zelfs bij vrijwillige afname. HR 14 maart 2006, ECLI:NL:HR:2006:AU5496, r.o. 8.4 (Lucia de B.) en BGH 17 december 1998, BGHSt 44, 308 (Lügendetektorals Beweismittel) en US Supreme Court 31 maart 1998, 44 M. J. 442, r.o. II.A (United States vs. Scheffer (96-1133)). Overigens heeft het Belgische Hof van Cassatie het gebruik niet in algemene zin verboden en ziet het als een ‘bijzondere ondervragingsmethode’ waarvan de feitenrechter zelf de waarde moet vaststellen: Hof van Cassatie van België 15 februari 2006, P.05.1583.F/1.

17.