covariantie (Jöreskog & Sörbom, 1986, p. 41). Bovendien maakt het voor de passing van een model wel degelijk uit of er twee hoog gecorreleerde factoren onderscheiden worden, of dat er één factor gepostuleerd wordt; in het laatste geval wordt de toetsing verricht met één vrijheidsgraad meer.
Natuurlijk heeft De Jong gelijk als hij stelt dat de parameterwaarden ook geschat hadden kunnen worden met behulp van de ‘maximum likelihood’ methode. In dat geval zou de passing van een model geëvalueerd kunnen worden aan de hand van een chi-kwadraat verdeelde toetsingsgrootheid, onder de additionele aanname dat de geobserveerde scores multivariaat normaal verdeeld zijn. Indien de geobserveerde scores niet multivariaat normaal verdeeld zijn, is deze toetsingsgrootheid waarschijnlijk niet chi-kwadraat verdeeld. In mijn geval bleken de geobserveerde scores op de diverse intellectuele vaardigheidstoetsen verre van normaal verdeeld te zijn, er kan derhalve geen sprake zijn van een multivariate normale verdeling der scores. Ik geef daarom de voorkeur aan een schattingsprocedure (ULS) waarbij geen aannamen betreffende de verdeling van de scores geschonden behoeven te worden boven een procedure waar deze wel geschonden worden en de toetsingsgrootheid waarschijnlijk alleen een schijnprecisie suggereert. Helaas zijn de verdelingen van de passingsmaten onder deze schattingsmethode onbekend en er kan derhalve geen overschrijdingskans aan de geschatte grootheden gekoppeld worden. Wel is het natuurlijk zo dat een model met hogere passingsindex altijd beter past dan een model met een lagere passingsindex. Echter, kleine passingsverschillen zijn moeilijk op hun significantie te beoordelen, maar de passingsverschillen tussen de in het artikel onderscheiden modellen zijn zondermeer groot (met name wanneer een selectie uit de variabelen gemaakt werd) en dit probleem deed zich dus niet voor.
Met behulp van LISREL kunnen (o.a.) correlatiematrices geanalyseerd worden op de aan-of afwezigheid van bepaalde structuren. Het ‘probleem’ van de correlatiecoëfficiënten verdient meer aandacht dan het krijgt van De Jong. Hier kan ik volstaan in te haken op de door De Jong gesignaleerde problematiek van bodem- en plafondeffecten. Deze effecten hebben inderdaad een negatieve invloed op de hoogte van de correlatiecoëfficiënt. M.a.w. deze effecten zijn structuurbedervend. Maar wat als een gehypothetiseerde structuur ondanks dergelijke effecten toch gevonden wordt? De empirie keert zich in dit geval zonneklaar tegen De Jongs suggestie dat dan geen structuur getoetst kan worden.
De opmerking dat de verschillende getoetste modellen onvoldoende gespecificeerd zijn, berust duidelijk op onwetendheid. Waarom zou anders Tabel 2 in het artikel opgenomen zijn? In deze tabel worden de relaties tussen de in de verschillende modellen onderscheiden vaardigheden en de vaardigheidstoetsen zondermeer eenduidig benoemd. De verschillende LISREL-modellen kunnen op basis van deze tabel eenvoudig geformuleerd worden. Voorbeelden op dit punt lijken mij overbodig.
Aangaande de modellen met gecorreleerde vaardigheidsfactoren vraagt De Jong zich af welke factoren in de verschillende modellen wel en welke factoren in de verschillende modellen niet gecorreleerd mogen zijn. Misschien heb ik dit punt in het artikel enigszins te veel impliciet gelaten, maar voor een goede lezer, die enigszins op de hoogte is met LISREL, blijkt op tenminste op twee plaatsen dat in de oblique modellen alle correlaties tussen factoren toegestaan (vrij geschat mogen) worden. In dit verband breekt De Jong een lans vooreen Guttman-achtig model; SI-factoren die meer gemeenschappelijk hebben (bij voorbeeld: EMI en NMI) zouden onderling hoger mogen correleren dan SI-factoren die minder gemeenschappelijk hebben (bij voorbeeld: EMI en CMT). Naar mijn mening is een dit model niet toetsbaar zonder de toevoeging van volstrekt arbitraire restricties (vergelijk: Kelderman, Mellenbergh & Elshout, 1981; Hoeks, Mellenbergh & Molenaar, 1989). Een dergelijk model is in feite logisch inconsistent.