| |
| |
| |
Aanhangsel
Bepaling van een schaal voor de vragen 81-83 van de enquête over rookgewoonten
door Drs. Ch.A.G. Nass, Hoofd Afdeling Statistiek, N.I.P.G. te Leiden
De bedoeling van de drie vragen is te bepalen, welke ‘houding’ de ondervraagde heeft tegenover het roken. Vraag 81 bestaat uit een batterij van 6 keuzen, die alle betrekking hebben op een bepaalde bewering over het roken. Er moet telkens worden gekozen uit 5 mogelijke antwoorden. Gemakshalve worden de uitwijkmogelijkheden ‘geen antwoord’ van de ondervraagde en ‘niet ingevuld’ door de ondervrager ook tot de antwoorden gerekend. Vraag 82 is een keuze uit 6 oordelen over niet-rokers + 2 uitwijkmogelijkheden. Vraag 83 bestaat uit 2 keuzen, die het al of niet mogen roken van zoons, resp. dochters betreffen. In beide gevallen zijn 10 antwoorden mogelijk.
De gezamenlijke inhoud van de drie vragen bestrijkt een groot aantal mentale dimensies. Het is de bedoeling er hiervan één uit te kiezen, die men de hoofddimensie zou kunnen noemen, teneinde later de samenhang hiervan na te gaan met een aantal andere, op soortgelijke wijze verkregen, hoofddimensies. Om het onderzoek naar die samenhang mogelijk te maken, is het nodig, dat iedere hoofddimensie operationeel wordt gedefinieerd door een bepaalde schaal, dat wil zeggen, dat voor iedere hoofddimensie een regel moet worden gemaakt, die voor iedere ondervraagde, op grond van de gegeven antwoorden een getal van de schaal aanwijst.
De sociologische betekenis van een hoofddimensie is meestal a priori gegeven, want deze was de grondslag voor de batterij van vragen. Is deze betekenis van polaire aard dan kan hij zonder meer dienen als de betekenis van de schaal. Bij de vragen 81-83 is dit begrip, aangeduid als ‘houding tegenover het roken’, duidelijk polair. Voor de keuze van de hoofddimensie zal men dus streven naar de ‘sterkste polaire tendentie’, die uit de gezamenlijke antwoorden naar voren komt. Om tot een wiskundig bruikbaar equivalent van de genoemde tendentie te komen, moeten de antwoorden op de een of andere manier worden gequantificeerd. De meest algemene manier is aan ieder mogelijk antwoord de waarde 1 toe te kennen, als het gegeven wordt en o als het niet gegeven wordt. Men heeft dan de batterij omgezet in even zovele kwantitatieve variabelen als er mogelijke antwoorden zijn. Het streven naar de sterkste
| |
| |
polaire tendentie kan nu worden vervangen door het streven naar de langste as van de correlatiematrix van deze variabelen. Men ontmoet dan echter de volgende hinderpalen:
1. | Rechtstreekse berekening van de langste as is kostbaar of tijdrovend wegens het grote aantal variabelen (in ons geval 58). |
2. | Als er twee variabelen veel sterker gecorreleerd zijn dan de andere onderling, dan valt de langste as samen met een gemiddelde van die twee variabelen en de andere komen nauwelijks aan bod. Dit doet zich voor, wanneer de verzameling twee mogelijke antwoorden bevat, zodanig, dat haast iedereen die het ene antwoord geeft, ook het andere zal geven. Hetzelfde euvel doet zich voor, als twee keuzen (dus twee groepen van elkaar uitsluitende variabelen) sterk gecorreleerd zijn. Soms kan men van te voren vermoeden, dat dit het geval zal zijn, zoals bij de twee keuzen van vraag 83, over het mogen roken van zoons of dochters. Men moet echter rekening houden met de mogelijkheid, dat er ook onwillekeurig een al te grote evenwijdigheid van aangeboden keuzen aanwezig kan zijn, terwijl het denkbaar is, dat een wèl vermoede evenwijdigheid niet door de uitkomst wordt bevestigd. |
3. | Men zal ervoor moeten zorgen, dat de hoofddimensie voldoende overeenstemt met de sociologische betekenis, die men eraan hecht. In de eerste plaats is dit nodig om de betekenis van de richting van de schaal vast te stellen, dus in ons geval, of hoge, dan wel lage cijfers wijzen op een positieve instelling tegenover het roken. In de tweede plaats hoort het niet voor te komen, dat twee antwoorden, waarvan men a priori overtuigd is dat ze in dezelfde richting wijzen, volgens de hoofddimensie in tegengestelde richting wijzen. Men moet dan òf zijn mening òf de formule òf beide corrigeren. Dit kan betrekking hebben op weinig frequente antwoorden, waarvan de berekende coëfficiënt in de hoofddimensie zeer onbetrouwbaar is. De waarde van de coëfficiënt heeft in dat geval ook weinig invloed op de later te onderzoeken samenhang van de hoofddimensie met zijn soortgenoten. De correctie is dan te beschouwen als het wegnemen van een praktisch onbelangrijke schoonheidsfout. Maar als de schaal helemaal niet klopt, is de correctie een subtiele en tijdrovende zaak. |
De langste as van de correlatiematrix der mogelijke antwoorden, met vermijding van de genoemde hinderpalen, kan men de optimale as noemen.
Er is gelukkig een omstandigheid, die het streven naar de optimale as vergemakkelijkt. Voor de wegingscoëfficiënten wordt slechts een geringe nauwkeurigheid vereist, om een dimensie te verkrijgen, die sterk met de optimale as is gecorreleerd en dus bijna even goed is. Ook in praktisch opzicht is grove afronding van die coëfficiënten, tot kleine, gemakkelijk
| |
| |
hanteerbare getallen, aan te bevelen. Men kan zijn doel bereiken met een opportunistische iteratieve tactiek: een grove voorlopige hoofddimensie berekenen uit een deel van het materiaal, dat zich er goed toe leent en deze trapsgewijze verbeteren en uitbreiden over het gehele materiaal, gebruikmakend van langste assen en maximale correlaties, al te evenwijdige keuzen combinerend en telkens de gevonden resultaten toetsend aan zijn sociologische opvattingen en vooroordelen. De details van deze tactiek zullen duidelijker worden uit de hier volgende toepassing.
Vraag 81, bestaande uit 6 onafhankelijke keuzen, ieder met 5 mogelijke antwoorden, lijkt een geschikt punt van uitgang. Door het kiezen van een gelijkvormige schaal voor de 5 antwoorden, kan men het aantal variabelen terugbrengen tot 6. In een dergelijk geval kunnen de frequentieverdelingen van de keuzen helpen bij het kiezen van die schaal. De frequentieverdelingen zijn:
|
|
Antwoorden |
|
|
|
|
Vraag |
Keuze |
1 |
2 |
3 |
4 |
5 |
Totaal |
81 |
1 |
24 |
16 |
1.229 |
20 |
4 |
1.297 |
81 |
2 |
20 |
12 |
1.244 |
20 |
1 |
1.297 |
81 |
3 |
347 |
56 |
846 |
44 |
4 |
1.297 |
81 |
4 |
250 |
63 |
926 |
46 |
12 |
1.297 |
81 |
5 |
328 |
47 |
884 |
32 |
6 |
1.297 |
81 |
6 |
777 |
47 |
426 |
40 |
7 |
1.297 |
De betekenis van de antwoorden en de keuzen doen in dit stadium nog niet ter zake.
Men begint met de twee kolommen uit te zoeken, die de sterkste tegengestelde tendenties hebben. Dit blijken de kolommen 1 en 3 te zijn. Zonder uitzondering gaan kleinere getallen in 1 gepaard met grotere getallen in 3 en geen ander paar kolommen vertoont dit verschijnsel in zo'n sterke mate. Deze kolommen krijgen dus de uiterste waarden in de op te stellen schaal. Vervolgens gaat men van iedere andere kolom na, of hij meer meegaat met kolom 1 dan wel met kolom 3. Het blijkt, dat de kolommen 2 en 4 duidelijk meegaan met kolom 1 en dat kolom 5 zich tamelijk onafhankelijk gedraagt. Nu is het ogenblik gekomen om te zien in hoeverre dit strookt met de betekenis van de kolommen. Deze is:
1 |
2 |
3 |
4 |
5 |
Eens |
Gedeeltelijk eens |
Niet eens |
Geen antwoord |
Niet ingevuld |
Dat 1 en 3 het beste als de extreme waarden gekozen kunnen worden, strookt kennelijk met de betekenis. Ook dat 5 ongeveer in het midden
| |
| |
hiervan zou komen te liggen. Dat 2 en 4 dichter bij 1 dan bij 3 zouden moeten liggen, is niet a priori duidelijk, maar er is a priori evenmin bezwaar tegen. Met het oog op de bewerkelijkheid moet men zich echter afvragen of deze voorlopige schaal niet nog meer te vereenvoudigen is zonder ernstig verlies aan informatie. Er lijkt weinig bezwaar te bestaan tegen combinatie van de antwoorden 1, 2 en 4. Kolom 5 is kwantitatief onbelangrijk en kan zonder bezwaar met het vorige drietal worden gecombineerd. Kennen wij nu nog de waarde o toe aan de combinatie 1, 2, 4 en 5 en de waarde 1 aan het tegenover die combinatie staande antwoord 3, dan is de gemakkelijkste hulpschaal bereikt, die er mogelijk is.
Om de correlatiematrix van de 6 aldus gedefinieerde variabelen, die wij a1, a2, ..., a6 zullen noemen, te vinden, hebben wij de matrix van de sommen van de kwadraten a12, a12, enz. en van de produkten a1a2, a1a3 enz. nodig, waaraan nog een regel en een kolom zijn toegevoegd met de sommen van a1, a2 enz. en in het vakje links boven het aantal proefpersonen.
Dank zij de eenvoudige hulpschaal is deze matrix zeer gemakkelijk te vinden: de som van a1 is bij voorbeeld het aantal p.p. die bij keuze 1 van vraag 81 het antwoord ‘niet eens’ hebben gegeven. De som van a12 is hieraan gelijk, omdat a1 alleen de waarde 0 en 1 kan hebben. De som van het produkt a1a2 is het aantal p.p., dat zowel bij keuze 1 als bij keuze 2 het antwoord ‘niet eens’ hebben gekozen, enz. De betreffende matrix is:
|
e |
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
e |
1.297 |
1.229 |
1.244 |
846 |
926 |
884 |
426 |
a1 |
1.229 |
1.229 |
1.211 |
827 |
905 |
858 |
416 |
a2 |
1.244 |
1.211 |
1.244 |
831 |
916 |
865 |
421 |
a3 |
846 |
827 |
831 |
846 |
636 |
649 |
286 |
a4 |
926 |
905 |
916 |
636 |
926 |
634 |
344 |
a5 |
884 |
858 |
865 |
649 |
634 |
884 |
258 |
a6 |
426 |
416 |
421 |
286 |
344 |
258 |
426 |
De bovenste rij en de linkerkolom hebben betrekking op het aantal p.p. en de sommen, de rest op de kwadraten- en produktensommen van de 6 variabelen. Uit deze (7 × 7)-metrix verkrijgt men de (6 × 6)-matrix van de produkten- en kwadratensommen ten opzichte van de gemiddelden, dus
Σ (a1 - ā1)2, Σ (a1 - ā1) (a2 - ā2) enz., door van ieder getal het produkt van de 2 corresponderende getallen in de bovenste rij en de linkerkolom, gedeeld door het hoekgetal 1.297, af te trekken. De bovenste rij en de linkerkolom worden dan uiteraard allemaal nullen en worden weggelaten. Men krijgt dus:
| |
| |
64 |
32 |
25 |
28 |
20 |
12 |
32 |
51 |
20 |
28 |
17 |
12 |
25 |
20 |
294 |
32 |
72 |
8 |
28 |
28 |
32 |
265 |
3 |
40 |
20 |
17 |
72 |
3 |
281 |
-32 |
12 |
12 |
8 |
40 |
-32 |
286 |
Hieruit vindt men de correlatiematrix door alle getallen te delen door het produkt van de wortels uit de 2 diagonale getallen, die in dezelfde rij, resp. kolom, liggen.
De reciproquen van de wortels uit de diagonale getallen zijn:
0.125 0.141 0.058 0.061 0.060 0.059 Men moet dus eerst de rijen van de vorige matrix met deze getallen vermenigvuldigen en daarna de kolommen. De correlatiematrix in procenten is:
|
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
a1 |
100 |
56 |
18 |
21 |
15 |
9 |
a2 |
56 |
100 |
16 |
24 |
14 |
10 |
a3 |
18 |
16 |
100 |
12 |
25 |
3 |
a4 |
21 |
24 |
12 |
100 |
1 |
14 |
a5 |
15 |
14 |
25 |
1 |
100 |
-11 |
a6 |
9 |
10 |
3 |
14 |
-11 |
100 |
----- |
----- |
----- |
----- |
----- |
----- |
----- |
Som |
219 |
220 |
174 |
172 |
144 |
125 |
Hiervan moet dus de langste as gevonden worden. In het algemeen is de volgende stap, dat men enige van de 6 variabelen van teken laat veranderen, zodanig, dat de som van alle getallen in de matrix zo groot mogelijk worden. In dit geval hoeft dat niet, want iedere tekenverandering maakt het totaal kleiner. Men telt vervolgens alle kolommen op. De 6 aldus verkregen getallen zijn reeds ruwweg evenredig met de gezochte gewichten. Een betere benadering krijgt men door de laatst gevonden rij met alle rijen van de correlatiematrix te vermenigvuldigen. Vermenigvuldiging van 2 rijen betekent, dat de 6 paren van overeenkomstige getallen worden vermenigvuldigd en de produkten worden opgeteld. Dit herhaalt men een aantal malen, waarbij men gerust een decimaal kan weglaten, als de getallen te groot worden. Men kan ze ook met een willekeurige constante vermenigvuldigen. Hier volgen de 3 laatste aldus verkregen rijen:
| |
| |
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
Som |
Quotiënt |
59 |
59 |
36 |
39 |
27 |
17 |
237 |
1.899 |
112 |
113 |
68 |
73 |
52 |
32 |
450 |
1.898 |
214 |
215 |
129 |
137 |
99 |
60 |
854 |
|
De quotiënten van twee opeenvolgende sommen, in de laatste kolom, zijn benaderingen van het kwadraat van de lengte van de langste as. In het begin van het benaderingsproces zullen deze toenemen en na een aantal herhalingen zullen ze verder nagenoeg constant blijven, wat een teken is, dat men op kan houden. Uit de grootte van het quotiënt kan men zien, hoe lang de langste as is, oftewel hoe sterk de sterkste tendentie binnen de variabelen is. Was er helemaal geen tendentie, dan zouden alle assen gelijk zijn aan 1.
De getallen van de laatste rij vermenigvuldigd met de reciproque wortels van de diagonale getallen (zie boven) leveren de scores van het antwoord ‘niet eens’ op de 6 beweringen. Voor ieder ander antwoord wordt een o toegekend:
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
267 |
303 |
75 |
84 |
59 |
35 |
Klopt dit nu met de betekenis, die wij van plan zijn aan de schaal toe te kennen? De 6 beweringen, gerangschikt naar de bovenstaande scores, zijn:
Score voor ‘niet eens’ |
Beweringen |
a6 |
1 |
35 |
Of je roker bent of niet maakt geheel niets uit. |
a5 |
6 |
59 |
Flinke en verstandige mensen roken niet. |
a3 |
5 |
75 |
Rokers zijn net kleine kinderen, die zich een pleziertje niet kunnen ontzeggen. |
a4 |
2 |
84 |
Wie rookt weet van het leven te genieten en er het beste van te maken. |
a1 |
4 |
267 |
Sommigen zeggen dat je nog een klein kind bent als je niet rookt. |
a2 |
3 |
303 |
Anderen zeggen dat het stom zou zijn om niet te roken, daar haast iedereen het doet. |
In deze volgorde van beweringen is wel iets te ontdekken van de polariteit pro of contra tegenover het roken. De drie onderste beweringen zijn meer pro dan de drie bovenste. Maar a5 en a3, die op de tweede en derde plaats staan, zijn meer contra dan a6, die bovenaan staat. Er schijnt dus een zwakke binding te zijn tussen hoge scores voor ‘niet eens’ en de contrapool. Een erg zwakke binding, want de scores moeten worden opgeteld
| |
| |
en zijn allemaal positief. Is men van oordeel, dat flinke en verstandige mensen niet roken en dat rokers net kleine kinderen zijn, dan krijgt men voor beide vragen een o. Is men het met beide beweringen niet eens, dan krijgt men er 59 + 75 punten voor en stijgt dus dienovereenkomstig op een schaal, die pretendeert contra roken als positieve pool te hebben. En iemand, die het met geen enkele bewering eens is, krijgt de maximale score voor contraroken. Wij kunnen dus zeggen, dat de pro-contra-tendentie voor zover in deze vragen aanwezig, lang niet samenvalt met de langste as. Is er dan een andere tendentie, die dat beter doet?
Bekijkt men nu de inhoud van de beweringen, los van de houding tegenover het roken, dan ziet men, dat de bovenste het bezonkenste of verstandigste of verdraagzaamste is en dat ze min of meer geleidelijk ongeremder, dommer en agressiever worden. Dit lijkt wat op de polariteit primaire-secundaire reactie. Hoge scores voor ‘niet eens’ zijn min of meer gebonden aan de secundaire reactiewijze. Voor deze polariteit is het logisch dat alle scores positief zijn, want wie het met geen enkele van deze vragen eens is, geeft daarmee het duidelijkste blijk van bedachtzaamheid.
De conclusie is, dat de langste as voornamelijk bepaald schijnt door de niet bedoelde primaire-secundaire polariteit en slechts weinig door de bedoelde pro-contra. De batterij was blijkbaar slecht gericht.
Wij gaan nu proberen of de op één na langste as van de correlatie-ellipsoïde meer succes heeft. De op één na langste as is de langste as van de doorsnede loodrecht op de langste as van de ellipsoïde. De matrix van die doorsnede vindt men door de langste as uit de correlatiematrix te elimineren. Daartoe voegen wij eerst aan de correlatiematrix, als bovenste rij en als meest linkerkolom, de coëfficiënten van de langste as, dat zijn de getallen van de laatste benaderingen, dus 214, 215, 129, 137, 99, 60, toe. In de linkerbovenhoek zetten wij de som van de kwadraten van deze getallen, gedeeld door het kwadraat van de lengte van de langste as, dus 1406.17/1.9 = 740. Vervolgens trekken wij van alle getallen van de correlatiematrix weer het produkt van de twee corresponderende getallen in de bovenste rij en linkerkolom, gedeeld door het hoekgetal 740, af. De matrix van de doorsnede is dan:
|
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
a1 |
38 |
-6 |
-19 |
-19 |
-14 |
-8 |
a2 |
-6 |
38 |
-21 |
-16 |
-15 |
-7 |
a3 |
-19 |
-21 |
78 |
-12 |
7 |
-7 |
a4 |
-19 |
-16 |
-12 |
75 |
-17 |
3 |
a5 |
-14 |
-15 |
7 |
-17 |
87 |
-19 |
a6 |
-8 |
-7 |
-7 |
3 |
-19 |
95 |
|
----- |
----- |
----- |
----- |
----- |
----- |
|
-66 |
-65 |
-52 |
-61 |
-58 |
-38 |
| |
| |
Onderaan staan de sommen per kolom met overslaan van de diagonale getallen. Men verandert nu het teken van de variabele met het grootste negatieve totaal, dat is dus a1. Hierdoor worden alle getallen in de bovenste rij en de linkerkolom positief. De kolommen worden weer op dezelfde manier opgeteld en nu blijkt a2 het grootste negatieve totaal op te leveren. Daarna komt a6 aan de beurt en daarna blijken alle totalen positief te zijn. De matrix van de doorsnede ziet er nu als volgt uit, waarbij de rijen en kolommen met veranderd teken door pijlen zijn aangegeven.
|
↓ |
↓ |
|
|
|
↓ |
|
a1 |
a2 |
a3 |
a4 |
a5 |
a6 |
→ a1 |
38 |
-6 |
19 |
19 |
14 |
-8 |
→ a2 |
-6 |
38 |
21 |
16 |
15 |
-7 |
a3 |
19 |
21 |
78 |
-12 |
7 |
7 |
a4 |
19 |
16 |
-12 |
75 |
-17 |
-3 |
a5 |
14 |
15 |
7 |
-17 |
87 |
19 |
→ a6 |
-8 |
-7 |
7 |
-3 |
19 |
95 |
|
----- |
----- |
----- |
----- |
----- |
----- |
|
76 |
77 |
120 |
78 |
125 |
103 |
Tot. Quot. |
|
|
|
|
|
|
225 1.20 |
9 |
16 |
60 |
-49 |
100 |
89 |
269 |
11 |
19 |
71 |
-59 |
120 |
107 |
De totalen onder de matrix, waarin de diagonale getallen nu wèl meegerekend zijn, dienen weer als eerste, ruwe benadering van de gewichten van de op één na langste as. De twee laatste benaderingen volgen daaronder. Het kwadraat van de lengte van de op één na langste as blijkt 1.20 te zijn, dat is dus aanmerkelijk korter dan de langste (1.90). Om de scores te vinden moeten de gewichten vermenigvuldigd worden met de meer genoemde reciproque wortels:
125, 141, 58, 61, 60, 59 en a1, a2 en a6 moeten hun oorspronkelijke teken terugkrijgen. De scores worden dus:
a1 (3) |
a2 (4) |
a3 (2) |
a4 (5) |
a5 (1) |
a6 (6) |
-14 |
-27 |
41 |
-36 |
72 |
-63 |
Achter de variabelen staat tussen haakjes hun rangnummer, volgens dalende waarden van de score voor ‘niet eens’.
Deze scores blijken inderdaad veel beter te kloppen met de pro-contrapolariteit. Positieve scores krijgt men voor het afwijzen van de beweringen a3 en a5, dat rokers net kleine kinderen zijn en niet-rokers flink en verstandig zouden zijn, dus in beide gevallen een indicatie pro-roken. Het is ook aannemelijk te maken, dat afwijzing van a5 een hogere score verdient dan afwijzing van a3, omdat de laatste eerder op de treiterige vorm dan op de feitelijke inhoud kan berusten.
| |
| |
Afwijzing van de andere beweringen zijn even zovele contra-rokenindicaties en men krijgt er ook een negatieve score voor. De laagste score krijgt men voor afwijzing van de bewering, dat het niets uitmaakt of je wel of geen roker bent en deze indicatie contra het roken is ook sterker te achten dan afwijzing van drie beweringen, die tegelijk een grote lading niet ter zake doende sentimenten bevatten. En wie het nergens mee eens is, komt nu niet aan een van de polen te staan, maar ergens in het midden.
Van nauwkeurigheid is bij deze scores natuurlijk geen sprake en wij besluiten gemakshalve voor afwijzing van a3 en a5 een 1 te geven, en -1 voor afwijzing van de andere beweringen. Voor de hele vraag 81 is nu één variabele verkregen, die de waarden -3, -2, -1, 0, 1 en 2 kan aannemen.
Het meeste werk is nu gedaan, want uit de andere vragen kunnen wij telkens de dimensie nemen, die zo goed mogelijk met deze schaal correleert en dus behoorlijk met de bedoelde polariteit overeenkomt.
Vraag 82 bestaat uit een enkele keuze met 8 mogelijke antwoorden. De acht bijbehorende 1-0-variabelen noemen wij b1, ..., b8. Als best passende scores beschouwen wij de regressiecoëfficiënten van a op b1 t/m b8. Deze zijn zeer eenvoudig te berekenen dank zij de 1-0-variabelen en de simpele schaal van a. Zij zijn namelijk gelijk aan de gemiddelde waarde van a voor die personen, welke het betreffende b-antwoord gegeven hebben:
ā = Σ a/n (Σ a) is de som van de aantallen van deze personen, die de beweringen a 3 en a 5 hebben afgewezen, minus de som van de aantallen, die a 1, a 2, a 4 en a 6 afgewezen hebben, terwijl n het totale aantal van deze personen is. Behalve de waarden a zijn die van n van belang, omdat bij kleine n de bijbehorende a onbelangrijk en onbetrouwbaar is. Het resultaat is:
Niet-rokers gezien als: |
Σ a |
n |
ā |
b1 Flinke mensen met sterke wil |
-386 |
197 |
-2.0 |
b2 Mensen, die eigenlijk niet goed weten te leven |
-29 |
25 |
-1.2 |
b3 Verstandige mensen, die weten wat goed is voor de mens |
-265 |
122 |
-2.2 |
b4 Mensen, die zich braaf willen voordoen |
-7 |
9 |
-1.1 |
b5 Hele gewone normale mensen |
-1170 |
810 |
-1.4 |
b6 Mensen, die nooit goed met de wereld in aanraking zijn gekomen |
-32 |
26 |
-1.2 |
b7 Een combinatie hiervan |
-135 |
62 |
-2.2 |
b8 Geen antwoord |
-71 |
46 |
-1.5 |
| |
| |
Alle best passende scores zijn dus negatief, maar dat heeft hier geen betekenis, omdat de schaal niet essentieel verandert als men bij alle scores hetzelfde getal optelt of ze allemaal met hetzelfde getal vermenigvuldigt. De antwoorden b1, b3 en b7 hebben de kleinste scores (in de buurt van -2).
Deze staan dus bij de negatieve pool en dat moet de contra-rokenpool zijn, want dit is ook zo bij de gebruikte schaal van a. Voor b1 en b3 klopt dit. Voor b7 is het niet a priori duidelijk. Blijkbaar zijn de antwoorden b1 en b3 het vaakste gecombineerd.
Vervolgens komen de antwoorden b5 en b8 met een score van ongeveer -1.5. Deze moeten dus ergens in het midden van de schaal liggen, hetgeen klopt met de betekenis.
Verdere antwoorden hebben scores van ongeveer -1 en inderdaad rechtvaardigt hun inhoud de ligging bij de positieve pool. Wij kiezen voor vraag 82 dus de volgende schaal:
b1 |
b2 |
b3 |
b4 |
b5 |
b6 |
b7 |
b8 |
0 |
2 |
0 |
2 |
1 |
2 |
0 |
1 |
De variabele op deze schaal noemen wij b.
De polariteit primair - secundair, die ook wel in vraag 82 behoorlijk vertegenwoordigd zal zijn, hebben wij grotendeels ontweken, door de correlatie met a. Hetzelfde principe passen wij toe op de beide keuzen van vraag 83, die het mogen roken van echte of denkbeeldige zoons, resp. dochters betreffen.
Zoons |
|
|
|
Dochters |
|
|
Σa |
n |
ā |
|
ā |
n |
Σa |
-293 |
112 |
-2.6 |
Mag helemaal niet |
-1.9 |
490 |
-908 |
-63 |
45 |
-1.4 |
Mag altijd |
-1.4 |
30 |
- 43 |
- 1 |
2 |
- .5 |
Met 10 jaar |
0 |
0 |
0 |
- 15 |
13 |
-1.2 |
Met 12 jaar |
-1.2 |
6 |
- 7 |
-235 |
166 |
-1.4 |
Met 14 jaar |
-1.5 |
47 |
- 69 |
-702 |
482 |
-1.5 |
Met 16 jaar |
-1.4 |
204 |
-292 |
-590 |
357 |
-1.7 |
Met 18 jaar |
-1.4 |
317 |
-458 |
- 82 |
50 |
-1.6 |
Met 20 jaar |
-1.5 |
93 |
-141 |
- 10 |
4 |
-2.5 |
Met 22 jaar |
-1.2 |
13 |
- 15 |
-104 |
66 |
-1.6 |
Geen antwoord |
-1.7 |
97 |
-162 |
Bij de zoons zit het voornaamste verschil tussen het eerste antwoord en de rest, als men de scores voor 10 jaar en 22 jaar wegens kleine aantallen buiten beschouwing laat. De opklimmende leeftijd schijnt maar weinig van de pro-contratendentie af te hangen. ‘Geen antwoord’ past beter bij
| |
| |
‘mag wel’ dan bij ‘mag niet’. Bij de dochters zijn de verschillen duidelijk kleiner. Blijkbaar is de bedoelde tendentie hier zwakker vertegenwoordigd. ‘Geen antwoord’ schijnt hier dichter bij ‘mag niet’ dan wel ‘mag wel’ te liggen. We besluiten om de score 0 toe te kennen aan ‘mag helemaal niet’ en de score 1 aan de andere antwoorden. De variabelen op deze 1-0 schaal noemen we z en d, voor zoons, respectievelijk dochters.
|
a |
b |
z |
d |
a |
100 |
27 |
29 |
17 |
b |
27 |
100 |
16 |
22 |
z |
29 |
16 |
100 |
36 |
d |
17 |
22 |
36 |
100 |
----- |
----- |
----- |
----- |
----- |
Som |
173 |
165 |
181 |
175 |
De hele batterij van de vragen 81-83 is nu teruggebracht tot 4 variabelen, a, b, z en d. Dank zij de eenvoudige schalen wordt de correlatiematrix hiervan betrekkelijk gemakkelijk op de boven beschreven wijze gevonden:
De reciproque wortels uit de diagonale getallen, waarmede rijen en kolommen van de matrix der kwadraten- en produktensommen t.o.v. de gemiddelden vermenigvuldigd moesten worden om de correlatiematrix op te leveren, zijn evenredig met: 257, 526, 990 en 571.
Het blijkt, dat de correlaties elkaar weinig in kracht ontlopen. In het bijzonder is de correlatie tussen de verwante variabelen z en d niet veel groter dan die van de andere paren, zodat het niet nodig is om die twee wegens te sterke evenwijdigheid te combineren. Ook de sommen van de 4 kolommen verschillen niet veel, zodat de gewichten van de genormaliseerde (= gedeeld door de standaard afwijking) variabelen in de langste as wel ongeveer gelijk zullen zijn. De coëfficiënten van de niet genormaliseerde variabelen zijn dan ongeveer evenredig met de bovengenoemde reciproque wortels, dus afgerond met de getallen 1, 2, 4 en 2. Een zoon zonder algeheel rookverbod wordt dus tweemaal zo zwaar geteld als een dito dochter en vier maal zo zwaar als het afwijzen van een contra-rokenbewering of het niet afwijzen van een pro-rokenbewering uit vraag 81.
Omdat variabele a zelf al een algebraïsche som is van 6 subvariabelen, is de uiteindelijke hoofddimensie een algebraïsche som van 9 scores. Vier van deze scores krijgen een negatief teken, namelijk die voor a1, a2, a4 en a6, hetgeen een beetje hinderlijk is. Men kan dit bezwaar als volgt opheffen. De vier genoemde subvariabelen hebben de scores 0, 0, 1, 0, 0, waaraan de 1 dus wordt toegekend voor ‘niet eens’. Vanwege het negatieve teken vermenigvuldigt men deze scores met -1 en om het nega- | |
| |
tieve getal weg te werken telt men overal 1 bij op, zodat de betreffende scores worden: 1, 1, 0, 1, 1. Het scoringssysteem wordt dan:
Vraag |
Kolom ponskaart I |
Scores |
81a |
65 |
1 1 0 1 1 |
b |
66 |
1 1 0 1 1 |
c |
67 |
0 0 1 0 0 |
d |
68 |
1 1 0 1 1 |
e |
69 |
0 0 1 0 0 |
f |
70 |
1 1 0 1 1 |
82 |
71 |
0 4 0 4 2 4 0 2 |
83a |
72 |
0 4 4 4 4 4 4 4 4 4 |
b |
73 |
0 2 2 2 2 2 2 2 2 2 |
Deze schaal zal te zijner tijd vergeleken worden met een andere, die door prof. Gadourek volgens andere principes is vastgesteld.
De aldus gecompleteerde schaal is dan een operationele definitie van ‘pro-roken’ voor de gehele populatie. Hij vertegenwoordigt slechts een deel van de mentale lading van de batterij 81-83. Een ander en misschien groter gedeelte, dat we ‘secundaire reactie’ genoemd hebben, werd moedwillig met de rest over boord gegooid. Was dat deel dan zo waardeloos?
Op zich zelf waarschijnlijk niet. Het lag in vivo (in de menselijke geest), waarschijnlijk veel dieper dan het ‘pro-roken’, zodat het structureel, in het geheel van alle batterijen, misschien wel belangrijker is. Maar deze lading wordt niet gedekt door de vooraf beraamde vlag. Zou men hem in alle hoofddimensies toelaten, dan maakt men vele vlaggen vals. En een uiteindelijke beschrijving van de totale structuur met behulp van die vlaggen zou misleidend zijn. |
|