Methodologie

(1961)–A.D. de Groot– rechtenstatus

3;3 Explicitering van een theorie of hypothese

3;3;1 Explicitering; vertakkingen.

De empirische toetsing of confirmatieGa naar voetnoot1 van een theorie of hypothese moet geschieden, zoals we gezien hebben, door toetsing (verificatie) van voorspellingen, die via verscheidene deductieve of specificatie-stappen worden verkregen. Doordat deze deductieve of specificatie-stappen een versmalling van de strekking van het theoretisch veronderstelde met zich meebrengen, kan de verificatie van één voorspelling slechts een betrekkelijke betekenis hebben als toetsing van de theorie of hypothese in zijn geheel. Ceteris paribus zal de confirmatiewaarde van een met positief resultaat geverifieerde voorspelling, of van een afgeleide, meer specifieke hypothese, des te geringer zijn naarmate er meer, en meer ingrijpende verbijzonderingsstappen tussen liggen, of naarmate de ‘logische afstand’ tot de oorspronkelijke theorie (of hypothese) groter is. Overeenstemming met de theorie in een bijzonder geval of onder bijzondere condities zegt weinig over de juistheid van de theorie in het algemeen; en wij zijn dikwijls vrijwel gedwongen om ‘bijzondere condities’ in te voeren als wij tot een concrete, verifieerbare voorspelling willen komen.

Men kan natuurlijk trachten deze moeilijkheid althans te verkleinen door het aantal verbijzonderingen en de ingrijpendheid ervan zo klein mogelijk te houden, m.a.w. zo algemeen mogelijke consequenties onmiddellijk te toetsen. Inderdaad is dit, als stelregel voor de toetsing van theorieën of hypothesen vaak een verstandig beleid. Voorzover het onderzoek-technisch en logisch te verwezenlijken is, is het in het algemeen gewenst de verbijzonderingen in het deductieve proces te beperken. Er is echter praktisch altijd - op de uitzonderingen komen wij nog te spreken in 4;2;1 - tenminste een aantal, zorgvuldig en kritisch te kiezen verbijzonderingen nodig om een theorie te kunnen toetsen; noodzakelijkerwijze telkens slechts in één of enkele van haar consequenties.

Daaruit volgt, dat een behoorlijke confirmatie van een theorie of algemene hypothese zal moeten bestaan niet uit de toetsing van één voorspelling, maar van een aantal voorspellingen van uitkomsten van verschillende toetsings-onderzoekingen. De versmalling van de strekking van het onderstelde in de deductieve fase zal alleen gecompenseerd kunnen worden door een aantal verschillende specifieke vertakkingen in studie te nemen. De deductief-specificerende uitwerking van een algemene theorie of hypothese tot een vertakt systeem van bij elkaar aansluitende, meer specifieke hypothesen en, tenslotte, voorspellingen, noemen wij de explicitering van die theorie of hypothese.

Hoe groter de ‘logische afstand’ is van de theorie tot de voorspellingen, hoe algemener en/of hoe omvattender in deze zin de theorie is, des te meer vertakkingen en sub-vertakkingen ervan zullen onderzocht en geconfirmeerd moeten worden om de theorie zelf naar behoren in de empirie te verankeren. Het toetsingsonderzoek van iedere vertakking geschiedt dan in een eigen cyclus, waarvan het hypothesevormingsgedeelte bestaat uit het uitdenken (en formuleren, fase 2) van de te onderzoeken subhypothese of van de te verifiëren voorspelling.

3;3;2 Nomologisch netwerk.

Voor een nadere beschrijving van het systeem van deducties en specificaties, in verschillende vertakkingen, die tezamen het expliciteringsproces uitmaken, is het nodig nog enkele termen in te voeren en onderscheidingen te treffen.

Wij noemen een theorie mèt alle expliciteringen ervan, voor zover deze in een bepaald stadium van het onderzoek zijn uitgewerkt en getoetst, wel het op dat ogenblik beschikbare nomologische net of netwerk van die theorie. Dit kan dus in feite verder of minder ver uitgewerkt zijn. Men kan zich ook een min of meer ideale ‘volledige’ uitwerking ervan denken, bij voorkeur met uitsluitend positieve toetsingsresultaten - al is een dergelijke ‘volledigheid’ van empirisch standpunt nauwelijks anders te definiëren dan door te stellen, dat zij is bereikt, wanneer de theorie definitief is aanvaard door het ‘forum’ van wetenschapsbeoefenaars en dus een systeem van wetten is geworden.Ga naar voetnoot1

In plaats van de theorie als geheel, kan men ook een deel ervan beschouwen, bijvoorbeeld een hypothese of subhypothese met alle bijbehorende relevante verbindingen (‘naar boven’ en ‘zijdelings’) en alle uitgewerkte vertakkingen (‘naar beneden’). Wij spreken dan van het nomologisch netwerk van die hypothese.

Ook is het mogelijk te spreken van het nomologisch net van een theoretisch begrip. Weliswaar vatten wij wetenschap in het algemeen en een nomologisch net in het bijzonder liever op als een systeem van uitspraken dan als een systeem van begrippen (vgl. popper 1959, p. 35), maar dat neemt niet weg, dat in die uitspraken begrippen voorkomen. Het (sub)-systeem van uitspraken, die òf van een bepaald theoretisch begrip gebruik maken, òf van belang zijn als bijdragen tot de bepaling van de theoretische inhoud of empirische betekenis van het begrip, noemen wij het nomologische netwerk van, rondom of met betrekking tot dat begrip. Voor de uitwerking van enkele voorbeelden verwijzen wij naar cronbach en meehl 1955, p. 190 e.v. (vgl. ook hoofdstuk 8, m.n. 8;2;3).

3;3;3 Drie typen relaties.

Het nomologisch netwerk van een theorie omvat: het theoretisch model, met zijn zuiver deductieve uitwerking (ad- en bd-deducties), eventueel los van de empirie te zien; de daaruit afgeleide hypothesen en voorspellingen, beide met empirische referenties (as- en bs-specificaties); en tenslotte de ‘evidence’, de feitelijke empirische bevindingen van (in hoofdzaak toetsings-)onderzoekingen.

Uitgaande van de tweedeling in theoretische (hypothetische) begrippen en empirische variabelen en observaties, kan men stellen (cronbach en meehl 1955, p. 187), dat de uitspraken in een nomologisch net van drie typen moeten zijn: beweringen die relaties uitdrukken tussen:

A.	theoretische begrippen of variabelen onderling;
B.	waarneembare variabelen (eigenschappen, hoeveelheden) onderling;
C.	theoretische begrippen en waarneembare variabelen.

De logische relaties van het type A omvatten allereerst uitspraken over betrekkingen tussen basis-begrippen in het theoretisch model: definitorische relaties, postulaten, en daaruit door deductie verkregen afgeleide

theoretische uitspraken. De empirische relaties van het type B omvatten allereerst uitspraken over feitelijke bevindingen, resultaten, uitkomsten van onderzoekingen. Maar tussen deze beide uitersten in vindt men een grote categorie van uitspraken, die men op verschillende wijze, d.w.z. of als A of als B kan opvatten. Een karakteristiek voorbeeld is de hypothese. Beschouwt men een hypothese los van haar empirische referenties, als een uitsluitend door logische deductie, via ad- en bd-stappen, verkregen consequentie uit de theorie, dan behoort zij tot A. Beschouwt men haar echter mèt haar empirische referenties, d.w.z. inclusief de as- en bs-explicitering, dan is zij te zien als een poging tot samenvatting van reeds verkregen (en nog te verkrijgen) empirische bevindingen, dus een empirische relatie van het type B.

Dit geldt ook voor als waar beschouwde hypothesen van lagere orde, d.i. voor empirische wetten (b.v.: vrouwen zijn gemiddeld kleiner dan mannen). Weliswaar worden deze gewoonlijk gezien als eenvoudige, gemakkelijke, generaliserend gestelde samenvattingen van waarnemingsuitkomsten, maar zij kùnnen ook als zuiver logische consequenties uit een meer algemene wet, hypothese of theorie worden gezien, bijvoorbeeld een meer algemene empirische wet over geslacht en (lengte-)groei bij zoogdieren; of een algemene theorie over de invloed van geslachtshormonen op de menselijke groei. Zelfs een voorspelling kan men, behalve als B - een statement of fact in de modus van de voorspelling - ook als A opvatten, wanneer men haar namelijk, onder abstractie van haar as- en bs-referenties, ziet als een zuiver logische consequentie uit een hypothese.

Wij zien dus, dat de indeling in A- en B-relaties alleen voor extreme typen opgaat: theoretische, definitorische uitspraken en/of postulaten tegenover feitelijke uitspraken. Voor de meeste andere typen uitspraken, met name van de belangrijke categorie van de hypothesen, leveren A en B geen vaste indelingskenmerken op; zij markeren tweeërlei manier van opvatten van eenzelfde uitspraak.

Men heeft wel gesteld, dat hypothesen tot C gerekend moeten worden: zij zouden de verbindingen tussen theoretische begrippen en waarneem-baarheden tot stand brengen (marx 1956, p. 7). Voor zover zij dit doen, doen zij het echter alleen door hun tweeledige karakter, niet qua uitspraak.

Wij geven er daarom de voorkeur aan de categorie C te reserveren voor (uitspraken omtrent) de empirische specificaties zelf - van de typen as en

bs. Aangezien deze niet zonder meer (logisch) volgen uit de initiële uitspraken van de theorie (of hypothese) - d.w.z. via een aanvaarde verzameling van deductieve omzettingsregels alléén - vormen zij wel degelijk een op zichzelf staand en essentieel onderdeel van het nomologische net. De uitspraken van het type C regelen de relaties van de theoretische begrippen tot de empirie. Zij geven aan hoe deze begrippen tot bepaalbare variabelen worden verwerkt en daarmee welke empirische inhoud zij krijgen, wanneer zij voor toetsingsdoeleinden worden gebruikt.

Slechts met behulp van C-uitspraken kunnen A-uitspraken, met name hypothesen-als-afgeleid, worden omgezet in B-uitspraken, met name hypothesen in empirisch toetsbare vorm, en in daaruit weer afgeleide voorspellingen.

3;3;4 Operationele definities van begrippen.

De empirische specificatie-uitspraken van het type C hierboven - of, volgens de indeling van 3;2;1, van de typen as en bs - nemen in het expliciteringsproces blijkbaar een sleutelpositie in. Zij ‘leggen uit’, zij specificeren - of, in geval van vertakkingen van een begrip naar meer dan één empirische variabele: zij expliciteren - wat bedoeld wordt met een begrip, zij leggen de betekenis ervan vast. Zij vervullen een definitorische functie, die noodzakelijk vervuld moet worden om toetsing van theoretische of hypothetische beweringen mogelijk te maken.

Zodra men een begrip in een onderzoek wil gebruiken, heeft men een zeker minimum aan empirische specificaties nodig. Een begrip te ‘gebruiken’ betekent immers: met behulp van of met betrekking tot dat begrip zekere onderscheidingen te treffen, met name tussen gevallen waarin het wel en waarin het niet of waarin het meer en waarin het minder van toepassing is. Er moet ten minste ergens een grens zijn - ‘definiëren’ betekent omgrenzen - die duidelijk genoeg is aangegeven, om objectief, voldoende adequaat aan het begrip-zoals-bedoeld, en op redelijk betrouwbare wijze,Ga naar voetnoot1 A-gevallen en niet-A-gevallen uit elkaar te kunnen houden: jongens en meisjes, intelligente en niet-intelligente kinderen (vgl. 3;2;1); sociale groepen en collecties van mensen, die men niet onder het begrip ‘groep’ laat vallen; democratische en niet-democratische staatsvormen, en dgl. Vaak gaat men verder, door meer dan twee categorieën te onder-

scheiden (protestant, katholiek, buitenkerkelijk), of door een gegradeerde schaal op te stellen, door te ‘meten’: de lichaamslengte, het intelligentiequotiënt, een prijsindex, en dgl.

Wat men hiervoor nodig heeft, is één of meer empirische specificatieuitspraken, die een objectieve instructie verschaffen, hoe men te werk moet gaan om in empirisch gegeven gevallen de onderscheiding tussen A en niet-A, of tussen verschillende schaalwaarden, te treffen. Zodra een begrip door een dergelijke objectieve instructie aan een wijze van onderscheiden gebonden is, zeggen wij dat het in een empirische variabele is omgezet (vgl. hoofdstuk 6 en 7). Deze instructie specificeert dan de operaties van waarneming, registratie, categorisering, rangschikking, berekening, en dgl., die men moet verrichten om in een concreet geval de, kwantitatieve of kwalitatieve, ‘waarde’ van de variabele te bepalen. Zo wordt bijvoorbeeld het begrip ‘intelligentie’ in een onderzoek empirisch gespecificeerd door het geheel van instructies voor de operaties van afnemen en nakijken van test X, berekening van een IQ en, eventueel, indeling bij ‘hoge’ of ‘lage’ intelligentie (vgl. 3;2;1); het begrip ‘sexe’ door de instructie aan het kind: ‘Schrijf op je testboekje ‘J’ als je een jongen bent, ‘M’ als je een meisje bent’, en bijvoorbeeld een controleoperatie, samen met de onderwijzer, op de J's en M's.

Het is duidelijk, dat het begrip in kwestie door een dergelijk stel instructies voor te verrichten operaties gedefinieerd wordt; men noemt een definitie op deze basis een operationele definitie.Ga naar voetnoot1

Uitgaande van het toetsbaarheidsprincipe (3;1;4) kunnen wij nu stellen: (1) Uit een theorie moet tenminste een aantal toetsbare hypothesen kunnen worden afgeleid. (2) Daartoe moeten tenminste enkele begrippen in elk van die hypothesen empirisch manipuleerbaar zijn of gemaakt worden. (3) Daartoe is nodig, dat die begrippen empirisch gespecificeerd worden (omgezet worden in empirische variabelen) door middel van objectieve operationele definities van de voor het gebruik van die begrippen relevante onderscheidingen.

3;3;5 Verhouding van begrip en variabele.

De verhouding tussen het (theoretische) begrip-zoals-bedoeld en de (empirische) variabele-zoals-bepaald - die dus door een (of meer) operationele definitie(s) wordt geregeld - kan van verschillende aard zijn. In 3;2;1 hebben wij reeds een onderscheiding ingevoerd tussen tweeërlei empirische specificatie: ‘specificeren’ in de zin van vollediger, tot in meer bijzonderheden aangeven wat bedoeld wordt, zonder ‘verlies aan algemeenheid’, type as; en ‘specificeren’ tevens in de zin van specifieker maken, dus met verlies aan algemeenheid van het bedoelde, type bs. Behalve op afzonderlijke specificatie-stappen van verschillende aard kan men deze onderscheiding ook op gehele operationele definities van begrippen toepassen: de operationeel gedefinieerde variabele kan het begrip volstrekt dekken (type as), of slechts partieel dekken (type bs). De voorbeelden uit 3;2;1 - de bepalingswijze van de sexe en die van de intelligentie tegenover elkaar - kunnen ook hiervoor dienen.

Het geval van volstrekte dekking (as) levert weinig problemen op. Het doet zich vooral vaak voor bij operationele definities, die neerkomen op het aangeven van een methode (en een instrument) om een variabele te ‘meten’, in de dagelijkse betekenis van dit woord (vgl. 7;2). Met een thermometer ‘meet’ men de temperatuur; maar men kan gerust zeggen, dat het aantal graden dat men afleest de temperatuur ‘is’ - zij het dat men verschillende schalen kan gebruiken. Evenzo bijvoorbeeld: reactie-tijd = het aantal afgelezen (honderdste) seconden in een, correct opgesteld en uitgevoerd, reactie-experiment; lichaamslengte = het aantal afgelezen centimeters; produktie = het aantal getelde afgeleverde produkteenheden. Zulke (empirische) begrippen hebben ten opzichte van de operationeel gedefinieerde variabele géén ‘surplus-betekenis’ van enig belang (vgl. 2;3;6).

Veel problematischer zijn de gevallen van partiële dekking (bs), d.w.z. partiële dekking van òf het bedoelde begrip óf de bedoelde onderscheiding. Het is nodig deze twee gevallen uit elkaar te houden omdat anders gemakkelijk misverstand kan ontstaan over wat met ‘partiële dekking’ wordt bedoeld. Een goed voorbeeld levert de onderscheiding tussen jongens en meisjes, die in 3;3;4 werd besproken. Wij konden de operationele definitie, via de instructie: ‘Schrijf een J op je boekje, als je een jongen bent’, enz. als een as-geval opvatten, omdat voor de meeste doeleinden kan worden aangenomen, dat met deze grove procedure niets

of nauwelijks iets van de bedoeling verloren ging. De onderscheiding-als-bedoeld wordt volledig gedekt door de onderscheiding-als-bepaald - maar dit betekent natuurlijk allerminst, dat hiermee een definitie is gegeven, die ‘dekt’ wat sexe is, laat staan wat een ‘jongen’ of een ‘meisje’ is.Ga naar voetnoot1

In het algemeen kan men zeggen, dat operationele definities van systeem- of objects-begrippen, die concreet-empirische of abstract-hypothetische entiteiten, systemen, processen aanduiden, zelden mogelijk en ook zelden nodig zijn (b.v. ‘molecuul’, ‘staat’, ‘mens’, ‘puberteit’, ‘ego’). Objecten in deze zin zijn echter, bij definitie, dragers van eigenschappen of attributen (torgerson 1960, p. 9); het is dus wel mogelijk en soms nodig, ook bij de meest hypothetische begrippen (vgl. 2;3;6), operationele onderscheidingen te treffen tussen (categorieën van) objecten, of afgrenzingen van een object naar één of enkele van zijn attributen te operationaliseren. Tenslotte komen natuurlijk attribuuts-begrippen bij uitstek voor operationele definitie in aanmerking. De verdere discussie in deze paragraaf en in volgende hoofdstukken (4;2;4 en hfdst. 8) heeft praktisch alleen op attribuuts-begrippen betrekking.

In sommige gevallen van partiële dekking is in principe wel een volstrekt dekkende operationele definitie voorhanden, maar deze is alleen via zo omslachtige of tijdrovende procedures toe te passen dat men met een benadering volstaat. Men weet dan dus wel precies wat men zou willen hebben (meten), maar neemt uit praktische overwegingen genoegen met een indirect-benaderende bepalingswijze.Ga naar voetnoot2 In de economie en demografie komen zulke operationele definities veel voor: reële kosten of reële frequentie-verhoudingen worden benaderd door veelal indirecte standaardramings-methoden, indices e.d. Ook Kinsey wist zeer goed wat hij bedoelde met ‘frequency of sexual outlet’, maar hij kon hierover alleen via mededelingen van zijn proefpersonen in een interview gegevens verkrijgen (kinsey e.a. 1948). Van partiële dekking en benadering kan men bijvoorbeeld ook spreken, als bij onderzoekingen over de voorspelling van studiesucces niet wordt gewacht totdat men, na zoveel jaren, definitief kan

onderscheiden tussen gediplomeerden en niet-gediplomeerden, maar met een tussentijds criterium, dus met een benaderende operationele definitie van ‘studie-succes’ wordt volstaan (vgl. b.v. t.h. delft 1959).

Problematischer zijn de gevallen waarin de niet verdisconteerde surplusbetekenis van het begrip niet precies is aan te geven. In het zojuist genoemde onderzoek-rapport blijkt dit verschil duidelijk, zodra niet meer over het (empirische) studie-succes maar over de operationalisering van ‘geschiktheid’ voor de studie wordt gesproken (op. cit., hfdst. 9). In het algemeen zijn het de meer theoretische, hypothetische (attribuuts-)begrippen, die moeilijkheden opleveren, o.a. doordat zij met verschillende empirische verschijnselen samenhangen. De mate van ‘welvaart’ in een land, de ‘intelligentie’ of de mate van ‘sociale aanpassing’ van een individu, is moeilijk anders dan met een zekere willekeurige (bs-)specificatie in één variabele (index of testuitslag) uit te drukken. Bijvoorbeeld: de broodprijs als index voor het welvaartspeil; de score op test X als index voor de ‘intelligentie’ of de ‘sociale aanpassing’.

Het voorbeeld van de intelligentie is in zoverre interessant, dat hier één begrip zich expliciteert in een veelheid van min of meer geaccepteerde, operationeel gedefinieerde variabelen (testmethoden). Elke test-definitie is een betrekkelijk willekeurige specificatie (bs) van het begrip. Wel wordt uiteraard geëist dat, en empirisch nagegaan of, verschillende intelligentietests een grootste gemene deler hebben - die sinds spearman (1904) wel wordt aangeduid als de ‘algemene factor g’. In de tegenwoordige situatie kan men desgewenst de inhoud van het begrip intelligentie omschrijven door een opsomming van alle acceptabel geachte bepalingsmethoden en door verwijzing naar de algemene factor, die daaruit door factoranalyse empirisch zou kunnen worden getrokken, als een dergelijk omvangrijk testprogramma op een voldoende grote en representatieve steekproef uit de bedoelde populatie uitvoerbaar zou zijn. Dat is dus in principe weer een operationele definitie van een variabele; die dan echter alleen kan worden benaderd, op verschillende manieren. Men kan waarschijnlijk wel zeggen, dat een dergelijke definitie, als wij van de benadering afzien, althans het begrip intelligentie, zoals het in de differentiële psychologie gangbaar is, ‘volstrekt dekt’.

Men kan op soortgelijke wijze een analyse van de verhouding van andere begrippen tot hun operationele definities beproeven, bijvoorbeeld ‘neuroticisme’ van een proefpersoon, mate van ‘interactie’ in een (psycho-

logische) groep, mate van ‘leesbaarheid’ van een tekst, de onderscheiding tussen een ‘democratisch’ en een ‘autocratisch’ leiderschapsklimaat, de ‘status’ van een beroep - om enkele bekende voorbeelden te noemen. Qualitatief zijn er ongetwijfeld meer verschillende gevallen te onderscheiden; wij zullen echter met het bovenstaande volstaan.

Het problematische van de gevallen van ‘partiële dekking’ ligt voor de hand: de kernvraag is in hoeverre de operationeel gedefinieerde variabele als representant van het begrip adequaat is. Deze vraag komt in hoofdstuk 8 nader aan de orde. Een andere belangrijke vraag is die naar de begripsontwikkeling: in hoeverre werken operationele definities op de inhoud van het begrip zelf terug? Dit punt zal in hoofdstuk 4 nog aan de orde komen (vgl. 4;2;4).

voetnoot1: Deze term wordt tegenwoordig bij voorkeur gebruikt. De letterlijke betekenis is ‘versteviging’ - vgl. Ned.: ‘steun verlenen aan een hypothese of theorie’ - met dien verstande dat de versteviging ook negatief kan zijn. Confirmatie betekent, in onze terminologie, toetsing inclusief het eerste deel van de evaluatie, nl. het bepalen van de ‘confirmatie-waarde’ van de uitkomsten (vgl. hoofdstuk 4).

voetnoot1: De term ‘nomologisch’ (letterlijk wet-kundig) zinspeelt op deze ideale toestand, die trouwens ook degenen die het nomologische net in de sociaal-wetenschappelijke literatuur hebben ingevoerd (vgl. met name cronbach en meehl 1955, p. 187 e.v.) voor ogen heeft gestaan, blijkens hun beschrijving. Hier wordt echter uitdrukkelijk gesproken van het netwerk in een bepaald stadium van de theorie-ontwikkeling. Ook wordt de in dat stadium beschikbare ‘evidence’, de stand van de empirische feiten in verband met de theorie in kwestie, uitdrukkelijk tot het netwerk gerekend.

voetnoot1: Voor een nadere analyse van de hier zonder toelichting gebruikte begrippen ‘objectief’, ‘adequaat’ en ‘betrouwbaar’ vergelijke men de hoofdstukken 6, 7 en 8.

voetnoot1: De operaties van een operationele definitie behoeven geen empirische specificaties te zijn. Men kan b.v. ook in de wiskunde - of theoretische natuurkunde (bridgman 1928) - een formule of instructie, die aangeeft hoe men Y moet berekenen als men X heeft, als een operationele definitie van Y opvatten.

voetnoot1: De verwarring ontstaat, doordat men onwillekeurig de functie van een beperkt ‘stipulatieve’, operationele definitie verwart met die van andere typen definities - die er te over zijn (vgl. b.v. robinson 1950).

voetnoot2: Hieronder valt niet het geval van een statistische schatting van een populatieparameter uit steekproef-bevindingen. Dan blijft de schattingsuitkomst een schatting van de ‘eigenlijke’ variabele; er is geen plaatsvervangende operationele definitie bij in het spel.

Vorige Volgende