Methodologie
(1961)–A.D. de Groot– Auteursrechtelijk beschermd5;2 Van formulering naar toetsing: een voorbeeld5;2;1 Psychosomatische specificiteit.Het proces in de derde fase, gezien als een reeks weloverwogen deductie- en specificatie-keuzen, laat zich het beste nader toelichten aan de hand van een voorbeeld. Daarvoor is hier een studie op het gebied van de psychosomatiek gekozen, namelijk Barendregt's proefschrift: ‘De hypothese der psychosomatische specificiteit getoetst aan de Rorschach-reacties van patiënten lijdende aan asthma-bronchiale’ (barendregt 1954). Ook in dit onderzoek-verslag wordt nauwelijks gerept van de voorbereiding van de experimentele opzet (vgl. 5;1;4), met de bijbehorende voor-onderzoekingen, voor-analyses, en discussies, zoals die in werkelijkheid zijn gevoerd, onder meer in de psychosomatische werkgroep (destijds onder leiding van J. Groen) en met de promotor - dat is immers niet nodig voor een logisch strakke berichtgeving, waarnaar Barendregt kennelijk heeft gestreefd. Wel nodig daarvoor, en in dit geval bijzonder duidelijk en instructief uitgewerkt, is de weergave van de verschillende keuze-beslissingen (deductie- en specificatie-stappen), die tenslotte tot de | |||||||||||
[pagina 147]
| |||||||||||
uiteindelijke vorm van de toetsingsexperimenten hebben geleid. Deze beslissingen - verbijzonderingen van de vraagstelling in veel gevallen - zullen hieronder voor één van de door Barendregt getoetste hypothesen achtereenvolgens worden besproken.Ga naar voetnoot1 De toelichting is beknopt gehouden. De lezer wordt uitgenodigd de brug naar het in 5;1 behandelde zelf te slaan, d.w.z. zich zelf nader rekenschap te geven van de verschillende stappen en van de overwegingen waarop zij zijn gebaseerd. De term psychosomatiek, die reeds suggereert dat het zal gaan om de samenhang van psychische en somatische verschijnselen, wordt gewoonlijk speciaal gebruikt voor onderzoekingen, die zich bezighouden met de werking van aetiologische factoren van psychische aard bij het ontstaan en/of beloop van somatische stoornissen (groen, van der horst en bastiaans 1951). Aangenomen wordt dat dergelijke invloeden bestaan. Met name wordt aangenomen, dat zij in sterke mate werkzaam zijn bij het ontstaan van een bepaalde groep ziekten, die dan ook psychosomatosen worden genoemd: colitis ulcerosa, ulcus ventriculi, astma bronchiale, e.a. Over de wijze waarop men zich deze inwerking van het psychische op het lichamelijke moet voorstellen, is vrij uitvoerig getheoretiseerd, mede op basis van enkele fundamentele experimentele studies (o.a. cannon 1929 en 1936). De principiële kern van de gedachtegang is, dat men aanneemt, dat emoties en spanningen functie-wijzigingen van het endocrien-vegetatieve apparaat kunnen teweegbrengen, die met name op bepaalde organen kunnen inwerken: en dat vervolgens deze functiewijzigingen c.q. -stoornissen bij veelvuldige herhaling of lange duur van de eraan ten grondslag liggende emotionele spanningstoestanden kunnen resulteren in organische afwijkingen (van de loo 1952, p. 61). In de volksmond zegt men dan bijvoorbeeld: de zenuwen zijn hem op de maag geslagen (de patiënt heeft onder invloed van bepaalde spanningstoestanden een maagzweer ontwikkeld). Een aantal onderzoekers op dit gebied heeft nu als eerste verscherping van deze algemene theoretische gedachtegang de zgn. hypothese der psychosomatische specificiteit gesteld. Daarin wordt aangenomen, dat er | |||||||||||
[pagina 148]
| |||||||||||
een specifiek verband bestaat tussen enerzijds de geaardheid van de psychische spanningstoestanden en anderzijds de organen waarop deze zullen inwerken, dus het psychosomatische ziektebeeld dat zal ontstaan. Aangezien de ‘geaardheid van de psychische spanningstoestanden’, waarin iemand verkeert, afhankelijk is te achten zowel van zijn uitwendige situatie, dus van de aard van de ‘situatieve druk’ waaraan hij blootstaat, als van zijn persoonlijke verwerkingswijze daarvan, dus van zijn ‘karakter’, kan men, met Groen (groen, van der horst, bastiaans 1951), in eerste instantie drie te verwachten consequenties deduceren en onderzoeken:
De onder 1 en 2 genoemde consequenties zijn nog tamelijk ver verwijderd van de eigenlijke studie van het ontstaan van de ziekte. Zij zijn echter gemakkelijker te onderzoeken dan de onder 3 genoemde en zij lenen zich vrij goed tot wat men zou kunnen noemen het bewijs van de existentie van tenminste een zekere mate van specificiteit in de psychosomatische aetiologie. Tot zover de hypothese der psychosomatische specificiteit, zoals deze door de werkgroep-Groen gehanteerd wordt. De beschrijving van de achtergrond en de inhoud van de hypothese - die eigenlijk veeleer een theorie is - is uiteraard onvolledig, zolang de uitwerking van wat onder ‘bepaalde’ eigenaardigheden, ‘bepaalde’ situaties etc. wordt verstaan, ontbreekt. Deze uitwerking is in de desbetreffende klinische literatuur te vinden, zij het in min of meer omschrijvende, nog weinig scherpe vorm (o.a. in alexander 1943; groen, van der horst en bastiaans 1951). Wij behoeven daarop nu echter nog niet in te gaan. | |||||||||||
[pagina 149]
| |||||||||||
5;2;2 Verbijzonderingen van het probleem.Barendregt heeft zich in zijn onderzoek alleen beziggehouden met de hierboven sub 1 genoemde consequentie, dus met de specificiteit in de ‘persoonlijkheidsstructuur’. Dat is de eerste, logische, beperking; een verbijzondering van het type bd (vgl. 3;2;1). Deze keuze werd door hem getroffen omdat hij, als psycholoog, van psychologische tests als toetsingsinstrument wilde gebruik maken (op. cit., p. 5). Aangezien het echter bijzonder moeilijk is een begrip als ‘persoonlijkheidsstructuur’ op adequate en objectieve wijze operationeel te definiëren, was als eerste verdere beperking een concentratie op bepaalde persoonlijkheidskenmerken noodzakelijk. Dit moesten dan kenmerken zijn, die ten eerste door middel van psychologische tests bepaalbaar waren - op voldoende adequate en objectieve wijze - en die ten tweede logisch voortvloeiden uit dat wat er aan psychosomatische theorievorming met betrekking tot de specificiteit aanwezig was. Deze theorie bestond op dit punt nog hoofdzakelijk uit algemene beschrijvingen, gebaseerd op een overigens reeds vrij uitgebreide klinische casuïstiek, van bij bepaalde ziekten behorende karaktertypen. Hoewel deze beschrijvingen vrij vaag waren, en bij verschillende onderzoekers niet altijd met elkaar in overeenstemming, was het toch zaak van de hierin verwerkte ervaring en voorlopige theorie-vorming een zo goed mogelijk gebruik te maken. Daarin naar voren springende en/of daaruit af te leiden karaktertrekken moesten worden gekozen. Wanneer een karaktertrek of persoonlijkheidskenmerk operationeel gedefinieerd wordt met behulp van test-variabelen, dan krijgt het onderzoek daarnaar het karakter van een onderzoek naar het voorkomen van bepaalde testgedragspatronen. Houden wij nu verder alvast rekening met het feit, dat Barendregt zich in zijn onderzoek speciaal met astma heeft beziggehouden en dat hij uit overwegingen van aansluiting aan reeds verrichte onderzoekingen als instrument de Rorschach-test had gekozen, dan kan de taakstelling in dit stadium van specificatie aldus worden omschreven:
Toetsing van de hypothese, dat bepaalde met behulp van de Rorschachtest adequaat en objectief registreerbare gedragspatronen conform de klinische theorie voor astma-patiënten karakteristiek zijn. | |||||||||||
[pagina 150]
| |||||||||||
Het zal duidelijk zijn, dat het proces van verbijzondering hier al vrij ver voortgeschreden is. De verbijzonderingen zijn tot zover in hoofdzaak van het type bd: de nader te bepalen persoonlijkheidskenmerken (eigenschappen, gedragspatronen) kunnen als onderdeel van de persoonlijkheidsstructuur worden gezien, de per test bepaalbare eigenschappen als een deelverzameling van alle uit de theorie afleidbare eigenschappen, Rorschach-testvariabelen (-gedragspatronen) op hun beurt als een deelverzameling van de vorige deelverzameling; de keuze van astma uit de psychosomatosen tenslotte is ook keuze van een onderdeel (type bd). De overwegingen waarop deze keuzen getroffen zijn, waren merendeels van praktische aard (5;1;3): beperking omdat men niet alles tegelijk kan onderzoeken, tests als aangewezen hulpmiddel juist voor de psycholoog in het team, de Rorschach in verband met aansluiting aan reeds verricht onderzoek, en evenzo astma omdat daarover meer werk was verricht -en omdat daarvoor in het bijzonder financiële steun beschikbaar was (zie de mededeling daaromtrent, op. cit. tegenover p. 1). | |||||||||||
5;2;3 Empirische specificatie van begrippen.De uitwerking van deze taakstelling leidt noodzakelijk tot verdere verbijzonderingen. Onder andere moeten de ‘bepaalde’ eigenschapsbegrippen worden gekozen en door middel van objectief registreerbare Rorschach-gedragspatronen operationeel worden gedefinieerd, c.q. instrumenteel gerealiseerd. Wij bepalen ons nu verder eenvoudigheidshalve tot één van de zeven (sub-)hypothesen, die in dit onderzoek werden getoetst, namelijk Barendregt's zesde hypothese (op. cit., p. 20). Volgens de theorie betreffende het karakter van astma-patiënten is voor hen specifiek een vijandig geaarde agressiviteit; dit in tegenstelling tot de agressiviteit van patiënten met ulcus ventriculi of duodeni, die volgens groen (1947, 1950) meer van competitiegeest zou getuigen. Astma-patiënten koesteren meer of sterker dan anderen vijandigagressieve wensen; maar zij houden deze in. Dit zou één van de factoren zijn, die het voor astma-patiënten ook buiten de aanvallen kenmerkende gevoel van benauwdheid of beklemdheid (Barendregt's 5de hypothese, op. cit., pp. 42-43) veroorzaken. ‘Weliswaar moeten wij dus aannemen,’ aldus Barendregt's redenering (op. cit., p. 20), ‘dat deze wensen ingehouden worden, zodat zij zich in het dagelijkse leven weinig of niet | |||||||||||
[pagina 151]
| |||||||||||
manifesteren, doch als zij er zijn, dan moeten er gedragsgebieden zijn waar deze wensen zich wel uiten. Een van die gebieden zien wij in de reacties op de Rorschach-test, omdat hierin zowel onbewuste als bewuste, zowel latente als manifeste wensen zich kunnen openbaren.’ Laten wij deze redenering eens wat nader bekijken. De eerste stap: ‘dan moeten er dus gedragsgebieden zijn waar deze wensen zich wel uiten’, is klaarblijkelijk gebaseerd op het toetsbaarheidsprincipe (vgl. 3;1;4 en 4;3;1). Dit wordt hier gehanteerd in deze vorm: Het heeft geen zin de (psychologische) hypothese van ingehouden (of onbewuste) wensen te stellen, wanneer daarmee niet tevens wordt aangenomen dat deze wensen zich op de een of andere wijze in de vorm van gedrag manifesteren; het moet ergens uit kunnen blijken, anders is de hypothese niet toetsbaar - en waardeloos. Het toetsbaarheidsprincipe in aanmerking genomen is deze denkstap onaanvechtbaar, en er gaat géén algemeenheid mee verloren. Men kan deze stap opvatten als een zuiver logische, van het type ad (vgl. 3;2;1); men kan er ook de fundamentele, eerste stap naar de empirie in zien, die in ieder onderzoek gemaakt moet worden, dus van het type as - hoewel er van ‘specificatie’ eigenlijk nog geen sprake is. De redenering gaat echter verder. Barendregt neemt aan, dat zij zich (a) als wensen, en (b) in de Rorschach zullen uiten. Aanname (a) betekent nauwelijks een beperking, gezien het tegenwoordige, onder invloed van de psychoanalyse en andere dieptepsychologische ideeën, zo sterk gedilateerde spraakgebruik met betrekking tot termen als ‘wens’. Accepteert men eenmaal, dat een, hypothetisch gestelde, ‘onbewuste wens’ óók een wens is, en dat de, vaak zeer indirecte en soms symbolische, uitingsverschijnselen in het gedrag, die met een dergelijke hypothese corresponderen, manifestaties van deze wens als wens zijn, dan is de conditie ‘uiting als wens’ rekbaar. Zij betekent dan alleen: in overeenstemming met in de psychologie, inclusief dieptepsychologie, gangbare theorieën en opvattingen over wat een wens is en hoe deze zich kan uiten.Ga naar voetnoot1 Zo beschouwd is (a) dus nog geen nieuwe specificatie. Aanname (b) is dit echter wel. Barendregt geeft dit zelf aan in zijn formulering: ‘één van die gebieden’ (waar zulke wensen zich kunnen uiten) ‘zien wij in de reacties op de | |||||||||||
[pagina 152]
| |||||||||||
Rorschach-test’. Er kunnen dus ook andere zijn; en dat de Rorschach er één is, wordt door hem aangenomen. Dit is dus een verbijzonderende empirische specificatie-stap (type bs), die niet logisch dwingend is. Men kan in principe met psychologische (theoretische en/of empirische) argumenten bestrijden, dat dit type ‘ingehouden wensen’ zich in de Rorschach moet, of zelfs kan, manifesteren - een kwestie ter beoordeling voor het forum. Accepteren wij de redenering, dan is het dus zaak aan te tonen, dat astma-patiënten kenmerkend veel antwoorden in de Rorschach produceren, die een vijandig karakter hebben. Daarvoor is een criterium nodig - wanneer is een antwoord ‘vijandig’? - en een methode van scoring om een index van vijandigheid te bepalen, die als maatstaf kan dienen bij de vergelijking van astmapatiënten met anderen. Met andere woorden: het begrip ‘vijandige wensen koesteren’ moet nader empirisch gespecificeerd worden totdat een instrument verkregen is, dat een objectieve operationele definitie van een corresponderende variabele belichaamt.Ga naar voetnoot1 De door Barendregt gekozen methode was een reeds eerder als Rorschachindex voor vijandigheid aanbevolen en gebruikte, namelijk een door Elizur opgestelde index voor ‘hostility’ (elizur 1949). De beschikbaarheid van dit instrument vormde één van de overwegingen, in dit geval van praktische aard (5;1;3), die de keuze van juist deze hypothese hebben bepaald. De index van Elizur is gebaseerd op een eenvoudige telling van het aantal Rorschach-antwoorden, dat volgens bepaalde nauwkeurig omschreven criteria ‘vijandig’ kan worden genoemd. Wij zullen nu op de details ervan niet ingaan. Evenals Barendregt zelf doet (op. cit., p. 43), volstaan wij met de vermelding, dat ook anderen met deze variabele | |||||||||||
[pagina 153]
| |||||||||||
hebben gewerkt en dat positieve resultaten ten aanzien van de betrouwbaarheid en validiteit ervan ter beschikking stonden. Dat betekent allerminst, dat de index uit een oogpunt van objectiviteit, nauwkeurigheid, stabiliteit en adequaatheid ideaal was. Deze onderwerpen komen echter nog systematisch aan de orde in de hoofdstukken 6, 7 en 8, zodat wij ze nu buiten beschouwing kunnen laten. Alleen dringt zich de vraag op of het zinvol en verantwoord is met een stellig niet ideale operationele definitie van vijandigheid te werken. Deze vraag kan in Barendregt's geval positief worden beantwoord, en wel op grond van een confirmatie-overweging (5;1;2). Het ging er in dit stadium van onderzoek van de specificiteitshypothese nog voornamelijk om de existentie van verschillen tussen astma-patiënten en anderen aan te tonen. Een significant statistisch verschil op één of enkele variabelen zou reeds van betekenis zijn, tot op zekere hoogte ongeacht de vraag of die variabelen de - toch nog vrij vage - theoretische begrippen adequaat representeerden. De kwestie van de begrips-validiteit van de variabele (vgl. 8;2;3) was dus nog niet zó belangrijk als zij kan worden bij scherpere theorieën en begrippen met een verder uitgewerkt nomologisch net. En wat de betrouwbaarheid betreft, ook als deze matig is, kunnen statistische verschillen in niet te kleine steekproeven worden aangetoond. Het ging er, met andere woorden, vooral om, aan de hand van de theorie een gelukkige greep te doen, waarmee psychische verschillen tussen astmapatiënten en anderen konden worden aangetoond - min of meer ongeacht hun precieze psychologische betekenis. In verband met dit relatief bescheiden confirmatie-doel was het instrument goed genoeg en het beroep op anderen, die er met een zeker succes mee gewerkt hadden, voldoende. | |||||||||||
5;2;4 Experimentele opzet: verdere specificaties.De ‘gedragspatronen’, waarvan hierboven sprake was, zijn nu operationeel gedefinieerd, maar de experimentele opzet moet nog nader worden geregeld. Verdere specificaties van de vraagstelling vloeien voort uit de keuzen, die hiertoe moeten worden getroffen. Van de experimentele opzet van Barendregt's onderzoekingen (1954) weten wij reeds, dat hij zich, wat de instrumentele kant betreft, tot Rorschach-variabelen, en wat psychosomatosen betreft, tot astma heeft beperkt. Dat bepaalde testgedragspatronen kenmerkend voor astmatici zijn kan men echter alleen aantonen door te laten zien, dat zij bij deze | |||||||||||
[pagina 154]
| |||||||||||
patiënten wel en bij anderen niet voorkomen; of, zwakker gesteld, dat zij bij astmatici sterker en/of veelvuldiger voorkomen dan bij anderen. Wie zijn echter deze ‘anderen’? Met welke controle-populatie moet de experimentele populatie van de te onderzoeken astma-patiënten worden vergeleken? Barendregt sluit zich hier aan bij een indeling van Groen, die drie principieel verschillende gevolgen van een mislukte aanpassing onderscheidt (groen 1953):
Barendregt noemt in verband hiermee vier mogelijkheden, die uit theoretische overwegingen in aanmerking komen, namelijk vergelijking van astmatici met: gezonden; ‘psychopathen’; psychoneurotici en psychotici; patiënten met een andere psychosomatische ziekte. Hij heeft zich tot de eerste en de laatste mogelijkheid beperkt. De door ons nader bekeken zesde hypothese stelt, dat astmatici vijandig-agressieve wensen koesteren. Daarbij wordt aangenomen, dat dit niet een gevolg is van het ziek-zijn (en gehospitaliseerd zijn), maar specifiek bij astma behoort. Daaruit vloeit voort, dat deze hypothese het beste kan worden getoetst door vergelijking met lijders aan een andere psychosomatische ziekte (die ook gehospitaliseerd zijn). Barendregt heeft daarvoor gekozen patiënten lijdende aan ulcus duodeni. De hypothese wordt dus, in de nu bereikte fase van specificatie:
Astma-patiënten geven in hun Rorschach-reacties sterker blijk van vijandig-agressieve wensen - te meten aan de hostility-index van Elizur - dan patiënten met ulcus duodeni.
Natuurlijk moesten nu ook operationele definities van ‘astma-patiënt’ en ‘ulcus-patiënt’ worden opgesteld. Voor deze aangelegenheid heeft Barendregt zich uiteraard verlaten op de diagnosen van de medici in de werkgroep. Alleen duidelijke gevallen - volgens de medici - werden in het onderzoek opgenomen.Ga naar voetnoot1 | |||||||||||
[pagina 155]
| |||||||||||
De volgende vraag die moest worden beantwoord, was die naar de samenstelling van de concrete experimentele en controle-groepen van proefpersonen (patiënten), waarmee zou worden geëxperimenteerd. Een belangrijke (confirmatie-)zorg daarbij was de experimentele uitschakeling van mogelijke ‘storende factoren’ (vgl. 5;1;2). In verband hiermee werkte Barendregt met zogenaamde matched groups, d.w.z. met experimenteleen controlegroepen, die zo goed mogelijk waren gelijkgeschakeld met betrekking tot een aantal variabelen, waarvan bekend is, dat zij van veel invloed kunnen zijn op Rorschach-variabelen. Hij werkte met groepen (steekproeven) van elk 20 proefpersonen, allen volwassen mannen, met ongeveer dezelfde leeftijds-verdeling in elke groep, ongeveer dezelfde intelligentie-verdeling en ongeveer dezelfde verdeling in beroepsniveau (op. cit., pp. 12-14). Verder werden alle proefpersonen door dezelfde proefleider getest. Het effect van deze maatregelen is, dat de verschillen, die mogelijk later gevonden zullen worden, redelijkerwijze aan de experimentele factor (astma tegenover anderen) zullen kunnen worden toegeschreven, hoe ook het verband tussen de gelijkgeschakelde variabelen en de gebruikte Rorschach-scores moge zijn (op. cit., p. 13). Er zijn dus goede (confirmatie-)gronden voor deze maatregelen: de zekerheid, dat mogelijke positieve uitkomsten inderdaad de experimentele hypothese ondersteunen en niet anders kunnen worden geïnterpreteerd, wordt erdoor verhoogd. Anderzijds echter impliceren zij opnieuw beperkingen, verbijzonderingen, resulteren zij in een versmalling: strikt genomen zullen de bevindingen aangaande deze speciale hypothese alleen kunnen worden gegeneraliseerd van de onderzochte steekproef naar een populatie van gehospitaliseerde mannelijke patiënten, van vergelijkbare leeftijds-, intelligentie- en beroepsniveauverdeling. Voor vrouwelijke patiënten of kinderen bijvoorbeeld is - door de keuze van mannen - niets aangetoond. Verder zou men eigenlijk in de formulering moeten opnemen: ‘bij deze proefleider’; in principe is het niet uitgesloten, dat Rorschach-protocollen van andere proefleiders niet discrimineren tussen astma en ulcus. Ook is niet zeker, dat de bevindingen voor astma in vergelijking met ulcus gegeneraliseerd mogen worden als kenmerkend voor astma, dus ook in vergelijking met andere populaties; het zou bijvoorbeeld kunnen zijn, dat niet astmatici bijzonder hoog, maar ulcus-patiënten bijzonder laag scoren op de hostiliteits-index. Iedere keuze-beslissing | |||||||||||
[pagina 156]
| |||||||||||
betekent een beperking, met als gevolg, in eerste instantie, een verbijzondering van de experimentele vraagstelling. Overigens zal de betekenis hiervan voor de confirmatie in 5;3 nader worden onderzocht. | |||||||||||
5;2;5 Statistische toetsing: laatste beslissingen.Barendregt's zesde hypothese kan nu al bijna op de vorm van een voorspelling worden gebracht. Wij verwachten, dat van twee, in bepaalde opzichten gelijkgeschakelde, steekproeven van 20 proefpersonen van respectievelijk astma- en ulcus-patiënten de eerstgenoemde in zijn Rorschach-reacties over het algemeen hogere hostility-scores (volgens Elizur) zal vertonen. Er wordt met name een ‘significant’ verschil verwacht. De laatste beslissingen moeten echter nog vallen, namelijk betreffende de statistische verwerking. Welk model zal worden gebruikt? Welke toets zal worden toegepast? Welke significantiedrempel zal worden aangehouden? Zal er met eenzijdige of tweezijdige overschrijdingskansen worden gewerkt? Het is duidelijk, dat er zal moeten worden uitgegaan van een nulhypothese. Deze luidt, wanneer wij de ulcus- en astma-patiënten opvatten als twee populaties (van mannelijke, gehospitaliseerde, respectievelijk ulcus- en astma-patiënten met zekere leeftijds-, intelligentie-, beroepsniveau-kenmerken): ‘Er is geen verschil tussen de beide populaties wat betreft de verdeling van de in de hypothese gespecificeerde variabele’. Het toetsingsonderzoek krijgt dus statistisch deze vorm, dat zal worden nagegaan of er goede gronden zijn deze hypothese te verwerpen. Kiest men hiertoe een bepaalde statistische toets, dan impliceert dit een nieuwe specificatie: verschillende toetsen zijn gebaseerd op verschillende veronderstellingen over de populatie en vervolgens op verschillende toetsingsgrootheden, die een verschillende gevoeligheid hebben voor afwijkingen van de nulhypothese. Barendregt heeft voor de (zesde) hypothese van de vijandige wensen de twee steekproeven-toets van Wilcoxon toegepast (ook bekend als de Mann Whitney U-toets, vgl. siegel 1956, p. 116 e.v.). Dit is een zogenaamde non-parametrische toets (vgl. 7;2;2), waarin dus géén specifieke veronderstellingen worden gemaakt over de verdeling van de variabele in de populatie(s) - een verstandige keuze in dit geval, omdat over die verdeling (van de hostility-score) weinig of niets bekend is. Uit de nulhypothese volgt nu, dat bij een | |||||||||||
[pagina 157]
| |||||||||||
volstrekt willekeurige keuze van respectievelijk een astma- en een ulcus-protocol de kans, in de populatie, dat de vijandigheids-score van de eerste groter is dan die van de tweede, gelijk ½ is - dus even groot als de kans op een omgekeerde bevinding. De zogenaamde alternatieve hypothese, waartegen de nulhypothese wordt getoetst en die bij de statistische toetsing de uit de theorie afgeleide hypothese representeert, stelt dat deze kans groter dan ½ is, d.w.z. dat ‘de meeste’ vijandigheidsscores van astmatici hoger liggen dan ‘de meeste’ scores voor ulcuspatiënten. Voor de toetsing (van de nulhypothese) worden de steekproef-scores van de twee groepen tezamen naar hun grootte op volgorde geplaatst, en vervolgens wordt van elke astma-score nagegaan, door hoeveel ulcus-scores deze wordt overtroffen. De resulterende aantallen worden opgeteld; dit levert de toetsingsgrootheid U op. Onder de aanname, dat de nulhypothese geldt, kan men nu nagaan hoe groot de kans is dat een zó extreme (extreem kleine) of een nog meer extreme U-waarde optreedt - ‘toevalligerwijze’ dus. Is deze kans ‘erg klein’ - wat dit betekent is nader te specificeren - dan verwerpt men de nulhypothese (vgl. de redenering in 4;1;2). Essentieel is, dat hiermee opnieuw een verbijzondering is ingevoerd; een bepaalde wijze van afwijken van de nulhypothese wordt gespecificeerd door de keuze van de toets - overigens zo goed mogelijk in overeenstemming met de bedoeling van de gestelde hypothese. Tenslotte is nog de vaststelling van een significantie-niveau en een beslissing over één- of tweezijdige toetsing nodig om werkelijk van de hypothese een voorspelling te maken. Barendregt koos, voor een zo duidelijk gerichte hypothese, de eenzijdige toetsing en het 5%-niveau. Dat zijn geen hoge eisen; maar er is in het stadium waarin dit type onderzoek zich bevindt, inderdaad weinig aanleiding om, bij zo betrekkelijk kleine steekproeven, stringenter te werk te gaan. In ieder geval moeten deze eisen vooraf worden vastgesteld; dat is dan de laatste specificatie-stap.
De voorspelling luidt nu: Van twee, in bepaalde opzichten gelijkgeschakelde, steekproeven van respectievelijk 20 astma- en 20 ulcus-patiënten zullen de hostility-scores volgens Elizur bij de eerstgenoemde groep over het algemeen hoger liggen dan bij de tweede; verwacht wordt dat dit verschil significant zal zijn indien getoetst op de eenzijdige overschrijdingskans met de 5%- | |||||||||||
[pagina 158]
| |||||||||||
drempel onder de nulhypothese volgens de twee steekproeventoets van Wilcoxon.
Daarmee is het eindpunt van het proces van deductie en specificatie bereikt. Resteert nu alleen de uitvoering van het toetsingsexperiment - en de evaluatie van de uitkomsten. |
|