| |
| |
| |
De toverformules van Box en Jenkins
Economische voorspellingen met behulp van tijdreeksanalyse
Frank den Butter
Inleiding
De wonderbaarlijke wereld van de toekomstvoorspellers is gemeenlijk gehuld in een sluier van magie en mysterie. Slechts in een sfeer van gedempt licht kunnen prognosten en helderzienden hun paranormale begaafdheid en esoterische kennis tot volle ontplooiing brengen. Glazen bollen, pendels of wichelroeden worden daarbij als instrumenten gehanteerd, en raadselachtige formules verbazen de ademloze toeschouwers. De wetenschap haalt echter voor deze kleurrijke, occulte wereld de schouders op en laat haar met een hooghartige glimlach links liggen.
Anders was het toen in 1970 Box en Jenkins hun 553 pagina's dik receptenboek voor voorspelformules publiceerden. Deze formules zijn nl. gesteld in de koele taal van de wiskunde en de glazen bollen zijn vervangen door computers. Onweerspreekbaar rekent de wetenschap dit tot haar grondgebied. De tijdreeksanalyse volgens Box en Jenkins verkreeg in korte tijd een overweldigende populariteit. In de vaktijdschriften verscheen - en verschijnt - een hele reeks van wetenschappelijke artikelen waarin de methoden van de beide protagonisten worden gebruikt, uitgelegd of verdiept. Het werd zelfs een commercieel succes. Zo heeft Jenkins een eigen bedrijfje - Gwylym Jenkins and Partners Ltd. - opgericht dat overal in Europa cursussen organiseert waar het nieuwe voorspelevangelie wordt verkondigd en waar tegen veel geld de tovenaarsleerlingen door de meester in de geheimen van de kunst worden ingewijd. Daarnaast kan men zich eenvoudigweg door de firma Jenkins de toekomst laten voorrekenen, uiteraard eveneens tegen een royale betaling.
De nieuwe voorspelmethode wekte echter ook weerstand en scepsis. Met name in de economische wetenschap, waar Box en Jenkins een groot afzetgebied vonden, is er een verhitte discussie gaande over de voor- en nadelen van deze vorm van tijdreeksanalyse. De Groningse econometrie-hoogleraar Rijken van Olst haalde zelfs de verzamelde werken van Shakespeare uit de kast om in ESB, het populaire vakblad voor economen, zijn gramschap te uiten over deze door de computer geïnspireerde nieuwlichterij. Hij was in Brussel naar een cursus van Jenkins gegaan en het woord van de meester heeft daar op hem kennelijk een averechtse uitwerking gehad. Onmiddellijk hebben de Eindhovense bedrijfskundige Van Winkel en de Rotterdamse polemist Bomhoff de Groningse professor van repliek gediend, de laatste door hem op zijn beurt met de werken van Dostojewski om de oren te slaan.
Vermeldenswaard is ook de uitvoerige discussie in de Royal Statistical Society op 23 juli 1976 naar aanleiding van een voordracht van Prothero en Wallis. Alle groten uit het vak namen aan deze discussie deel. Prothero en Wallis hadden - overigens in navolging van anderen - de methode van Box en Jenkins vergeleken met de meer traditionele econometrische modelbouw en deze vergelijking was in het nadeel van de eerstgenoemde methode uitgevallen. Enkele volgelingen van Box en Jenkins verzetten zich echter met kracht tegen deze conclusies. De uitlatingen en, naar een ooggetuige mij vertelde, ook de gedragingen van discussianten waren van een ongebruikelijke hevigheid voor dit eerbiedwaardige Engelse genootschap. Van het kribbige antwoord van Prothero en Wallis aan Anderson, één van de vurigste pleitbezorgers van de modellen van Box en Jenkins, is het volgende zelfs doorgedrongen tot het officiële verslag in de Journal of The Royal Statistical Society:
‘... we believe that many of Mr. Anderson's remarks are misconceived and best passed by in silence, while we have not the
| |
| |
space to correct all of his mistakes...’
Men kan zich afvragen waarom de gemoederen door deze voorspelmethode zo verhit raken en dergelijke emoties, die toch in wetenschappelijke discussies uitgebannen dienen te worden, naar boven komen. Het is immers niet ongebruikelijk dat een wetenschapper voorspellingen doet. Het voorspellen van zonsverduisteringen, om maar iets te noemen, is in de moderne westerse wereld reeds lang verdwenen uit de sfeer van de magie. Weersverwachtingen zijn niet meer uit ons leven weg te denken. Ook in de economische wetenschap zijn prognoses niet onbekend. Het Centraal Planbureau levert ze al jaren, zonder dat zijn directeur als tovermeester te kijk wordt gezet. Integendeel, de eerste directeur van dit bureau verkreeg zelfs de Nobelprijs voor economie.
Dit soort voorspellingen is echter gebaseerd op theorieën waarin men via logische en deductieve weg tot uitkomsten komt. Zo wordt het optreden van zonsverduisteringen berekend met behulp van natuurkundige wetmatigheden over de banen van de aarde en de maan ten opzichte van de zon. Het is zelfs niet noodzakelijk dat het voorspelde fenomeen al eerder is voorgekomen of waargenomen. De ontdekking van de planeet Neptunus was een direct gevolg van de hemelmechanica van Newton en over het bestaan van de achterkant van de maan bestond reeds lang zekerheid voordat deze voor het eerst werd gefotografeerd. Voorspellingen van het weer of de economie zijn vaak met grotere onzekerheden behept dan in de natuurkunde maar ook hier speelt de deductie een grote rol. Het KNMI volgt voor zijn weersverwachtingen de loop van depressies en hoge drukgebieden en het Planbureau hanteert economische modellen bij zijn voorspellingen. Deze maquettes van de economie zijn opgebouwd uit een aantal vergelijkingen en iedere vergelijking afzonderlijk vormt een afbeelding van een causaal of technisch verband dat volgens de theorie in de economische werkelijkheid bestaat en dat aan de hand van statistische gegevens is gekwantificeerd.
Bij de voorspelmethode van Box en Jenkins is een dergelijke theoretische achtergrond echter vrijwel geheel afwezig. Voor de voorspelling van een bepaalde grootheid worden alleen vroegere gegevens, d.w.z. een tijdreeks, van die grootheid zelf gebruikt. Bij het opstellen van de voorspelformule vraagt men zich niet af, waarom de grootheid in het verleden zo'n verloop heeft gehad. In die zin is de formule bij wijze van spreken een black box waarvan men wel de contouren maar niet de inhoud kent. Dit is het essentiële verschil met de traditionele wetenschappelijke voorspelmethodes. Wellicht roept deze zwarte doos associaties op met zwarte kunst en wekt zodoende bij sommigen twijfel of deze voorspelmethode inderdaad niet elementen bevat, die toebehoren aan die andere wereld van toekomstvoorspellers. Bovendien gaan Box en Jenkins en hun volgelingen deze associaties niet uit de weg. Zo is het huismerk van de firma Jenkins een glazen bol en hebben Granger en Newbold in hun recente boek over het voorspellen van economische tijdreeksen een conversatie tussen Macbeth en de opperheks als motto voor een hoofdstuk gekozen.
In het vervolg van dit opstel schets ik eerst wat de tijdreeksanalyse van Box en Jenkins inhoudt en hoe de modellen geconstrueerd worden. Vooropgesteld zij dat naar mijn mening deze tijdreeksanalyse wel degelijk zijn nut heeft in de economische wetenschap en niet per se als onnodige geleerdheid of onwetenschappelijke beunhazerij bestempeld dient te worden. Aan de andere kant moeten de voorspelmogelijkheden van de Box-Jenkins-modellen niet overtrokken worden, zeker niet in vergelijking met goede econometrische modellen. Bovendien is voorspellen lang niet het enige doel van de econometrie. Ik zal echter laten zien hoe de Box-Jenkins-modellen juist een uitstekend hulpmiddel zijn bij de econometrische modelbouw en zelfs tot uitgangspunt dienen voor de moderne theoretische ontwikkelingen op dit gebied.
In dit verhaal gebruik ik geen wiskundige formules. Wel vallen er een aantal termen waarvan de specifieke betekenis in dit bestek niet altijd volledig duidelijk gemaakt kan worden. Mijn bedoeling is echter alleen aan niet-ingewijden een globale en intuïtieve indruk te geven van de technieken waarover de economische toekomstvoorspellers beschikken en mogelijkerwijs zullen beschikken.
Natuurlijk beslaan deze technieken slechts een ondergeschikt deel van het actuele onderzoeksgebied van de meters van de economie. Verreweg de belangrijkste discussies spelen zich af rond de vraag welke economische theorie bij het meten moet worden gehanteerd. De gebruikte technieken zijn daarbij van secundair belang. Toch is er sprake van een wisselwerking daar een geavanceerde techniek soms een economische dwaaltheorie weet te ontmaskeren waar een eenvoudige techniek in dit opzicht faalt. Bovendien kan zo een weg worden aangegeven waarlangs de theorie zich dient te ver- | |
| |
diepen. Vandaar dat ik in dit opstel enkele moderne technieken onder de aandacht wil brengen.
| |
ARIMA-modellen
Box en Jenkins zijn geenszins de uitvinders van de tijdreeksanalyse. Reeds in 1807 toonde de Franse wiskundige Fourier aan dat iedere reeks van waarnemingen benaderd kan worden door een aantal golfbewegingen in de vorm van sinussen en cosinussen bij elkaar op te tellen. Andere pioniers op het gebied van de tijdreeksanalyse zijn Yule, Wold, Wiener, Kolmogoroff en Kalman. Het is de grote verdienste van Box en Jenkins dat zij de verschillende theorieën in een groot kader samengebracht, gesystematiseerd en daarmee gepopulariseerd hebben. Zij geven aan hoe men voor een bepaalde tijdreeks een geschikt model kan vinden uit de overkoepelende klasse van zgn. ARIMA-modellen. AR staat daarbij voor autoregressive, I voor integrated en MA voor moving average. Dergelijke tijdreeksen zijn b.v. de maandelijks gemeten prijsindex van de gezinsconsumptie, de dagelijkse uitgifte van bankbiljetten van 10 gulden, of, buiten het gebied van de economie, de druk in een ketel gemeten om de 9 seconden. In beginsel is het mogelijk met de receptuur van Box en Jenkins voor iedere tijdreeks een passend ARIMA-model te bepalen als er maar genoeg waarnemingen voorhanden zijn.
Om te begrijpen hoe zo'n tijdreeks ontleed wordt kan men in analogie aan een radio denken. Daarin wordt het signaal zoveel mogelijk van de ruis gescheiden. Hetzelfde gebeurt in de tijdreeksanalyse. Bijna iedere tijdreeks bevat een zekere systematiek en deze tracht men af te zonderen van het gedeelte waarover men niets weet, de storingen. Deze storingen vormen het uitgangspunt bij de ARIMA-modellen. Een reeks die geen enkele systematiek vertoont, waar iedere waarneming geheel onafhankelijk van de vorige is, noemt men witte ruis. Een ARIMA-model ontstaat - hier gaat de analogie met het radiosignaal niet verder op - als een transformatie van de witte ruis. De invoer van zo'n model is een reeks van onderling onafhankelijke storingen en de systematiek wordt er ingebracht door deze storingen via een transformatie (in de tijd) afhankelijk van elkaar te maken, d.w.z. door ze op een bepaalde manier volgtijdelijk bij elkaar op te tellen. Men zal zich nu afvragen waarom er in een transformatie van een invoer van storingen wel een systematiek te ontdekken valt, terwijl die invoer zelf geen enkel vast patroon vertoont. In de statistiek is dit echter een bekend verschijnsel. Bij het werpen met één dobbelsteen zijn b.v. de kansen op de uitkomsten 1 t/m 6 precies gelijk aan elkaar en in deze reeks worpen zit geen systematiek. Indien men echter het aantal ogen van twee worpen bij elkaar optelt is de kans op de uitkomst 7 groter dan de kans op 2 als uitkomst.
De tijdreeksanalyse van Box en Jenkins geschiedt grofweg in drie fasen: de identificatie, het schatten en de controle. In de identificatiefase probeert men te achterhalen welk type transformatie het best bij de tijdreeks past: een autoregressieve transformatie (AR), een voortschrijdend gemiddelde (MA) of een combinatie van beide. De AR en de MA geven de manier aan waarop de storingen bij elkaar zijn geteld: bij een MA-transformatie is iedere nieuwe waarneming een som van de nieuwe storing en een aantal vorige storingen, terwijl in een AR-transformatie de nieuwe storing bij een aantal vorige waarnemingen wordt opgeteld. Daarbij is het tevens van belang over welke periode de waarnemingen van de reeks van elkaar afhankelijk zijn, d.w.z. hoe groot het aantal vorige storingen of vorige waarnemingen is. Meestal zullen opeenvolgende waarnemingen met elkaar samenhangen maar het kan voorkomen dat de lengte van deze samenhang zich over meer dan één periode uitstrekt. Daarnaast vindt men b.v. bij kwartaalcijfers die een seizoenpatroon vertonen een periodiciteit van 4, d.w.z. het cijfer voor een bepaald kwartaal is afhankelijk van de waarneming van een jaar geleden. De analisten voeren deze identificatie uit aan de hand van de patronen in twee reeksen die zij met het cijfermateriaal berekenen: de autocorrelaties en de partiële autocorrelaties. De gevonden patronen zijn echter niet altijd even duidelijk en leiden niet altijd tot definitieve conclusies omtrent het juiste type transformatie. Soms dient men de analyse te doen op het eerste verschil, of zelfs tweemaal het eerste verschil van de oorspronkelijke tijdreeks. Bij voorbeeld van de tijdreeks 6, 10, 16, 21 is het eerste verschil 4, 6, 5. In dat geval is de tijdreeks (onder meer) een gesommeerde, of ‘geïntegreerde’ transformatie van witte ruis en vandaar de I van integrated.
Indien men het type transformatie met het aantal perioden van afhankelijkheid heeft geïdentificeerd, meet men vervolgens de gewichten - de parameters - die bij de desbetreffende transformatie horen. Zo kan men b.v. bij een autoregressieve transformatie met lengte 2 (AR(2)model) vinden dat de waarde van een kwartaalreeks voor ge-
| |
| |
middeld 60% afhangt van de waarde één kwartaal eerder plus gemiddeld 20% van de waarde twee kwartalen eerder. Dit meten, schatten, van de parameters gebeurt aan de hand van al de waarnemingen van de tijdreeks en een uitgebreide statistische theorie ligt hieraan ten grondslag.
Tot slot gaat men na of de invoer die bij de geschatte transformatie hoort en die via deze transformatie tot de geanalyseerde tijdreeks leidt, inderdaad witte ruis is, m.a.w. of men erin geslaagd is op juiste wijze het systematische deel te scheiden van een deel waarin verder geen systematiek zit. Indien dit het geval is, is men klaar en heeft men een passend ARIMA-model gevonden. In de praktijk heeft het resultaat van deze toets echter regelmatig aanleiding tot een nieuwe specificatie van het model en daarmee tot nieuwe schattingen. In feite vindt er dus een wisselwerking plaats tussen de controle-, de identificatie- en de schattingsfase. Men gaat net zo lang door totdat de invoer er redelijk als witte ruis uitziet.
Uit het voorgaande zal duidelijk zijn dat een computer een onontbeerlijk hulpmiddel is voor de tijdreeksanalyse van Box en Jenkins. Evenzeer is het duidelijk dat het goede model niet door de computer op zijn eigen houtje gevonden kan worden, maar dat menselijke tussenkomst noodzakelijk is, zeker bij het zoeken naar de passende transformatie in de identificatiefase waar de nodige ‘feeling’ van pas komt en vaak enig probeerwerk onvermijdelijk is. Nadere informatie over de reeks is daarentegen meestal niet nodig. Zo maakt het voor de analyse in principe weinig verschil of de reeks betrekking heeft op de inflatie, de bankbiljettenuitgifte of de keteldruk. Wel kan het nuttig zijn als men van te voren weet dat een reeks een bepaald patroon vertoont, b.v. ten gevolge van seizoenbewegingen. Indien deze bewegingen een rol spelen en men is er van te voren niet op verdacht, komt men er bij de identificatie van de reeks overigens vanzelf achter.
Bij het voorspellen met het Box-Jenkinsmodel gaat men ervan uit dat de voor het verleden gevonden systematiek ook in de toekomst zal gelden. Dit is overigens gebruikelijk bij het voorspellen en niet anders mogelijk indien men, zoals bij het Box-Jenkins-model, het waarom van de systematiek niet kent. De uit het model volgende voorspelformules zijn gebaseerd op de samenhang tussen de toekomstige waarden van de reeks en de waarden uit het heden en het verleden, waarvoor reeds waarnemingen beschikbaar zijn. In feite gebeurt er iets dergelijks als in een intelligentietest wanneer men b.v. de reeks 2, 5, 9, 14, 20 moet aanvullen. Indien men de systematiek eenmaal onderkend heeft, weet men zeker dat het volgende getal 27 is. Daarentegen zijn de voorspellingen met een Box-Jenkins-model onzeker, omdat de tijdreeks immers ook een deel zonder systematiek bevat. Over dit deel valt voor de toekomst niets te zeggen. De onzekerheden cumuleren: hoe verder men in de toekomst wil kijken, des te groter de onzekerheidsmarges van de voorspellingen zijn. De waarden uit het heden en het verleden krijgen namelijk steeds minder invloed wanneer men verder vooruit wil voorspellen. Na een bepaald punt is de kennis van de systematiek van de reeks zelfs volkomen nutteloos omdat er dan geen enkel verband meer bestaat tussen de waargenomen en de te voorspellen waarden van de reeks.
| |
| |
| |
Toepassingen van ARIMA-modellen
Tot zover mijn uiteenzetting hoe de ARIMA-modellen en bijbehorende voorspelformules volgens het receptenboek van Box en Jenkins bereid worden. Vanzelfsprekend is er om deze theorie heen veel onderzoek verricht. Bij wijze van voorbeeld noem ik twee korreltjes uit de rijstebrijberg. Men kan zich afvragen of de manier waarop de parameters in het model geschat worden, niet dient te variëren met het aantal te voorspellen perioden, m.a.w. is het niet beter een andere schattingsmethode toe te passen indien men twee perioden vooruit wil voorspellen, dan wanneer er slechts één periode vooruit te voorspellen valt. Gelukkigerwijs blijkt dit niet het geval te zijn; een zelfde schattingsmethode is optimaal voor ieder willekeurig aantal vooruit te voorspellen perioden. Een andere vraag is of men altijd van alle beschikbare gegevens van een reeks gebruik moet maken. Theoretisch is dit inderdaad het beste maar in een door mij onderzocht praktijkgeval bleek het er niet veel toe te doen voor de voorspelformule of men met maandcijfers dan wel met kwartaalcijfers werkte, indien men een half jaar of verder vooruit wilde voorspellen. De extra informatie die de maandcijfers in dit geval boden, was voor de voorspellingen nauwelijks relevant.
De ARIMA-modellen van Box en Jenkins worden natuurlijk in de economie voornamelijk toegepast vanwege de voorspelmogelijkheden. Het is een handig gereedschap om een reeks te extrapoleren zonder dat men daarbij de gegevens van andere reeksen en een economische theorie nodig heeft. Toch bestaan er enkele andere toepassingen. Naast het doen van feitelijke voorspellingen gebruikt men de Box-Jenkinsmodellen ook voor het genereren van verwachtingen. Deze geven a.h.w. aan hoe men in het verleden bij de indertijd beschikbare informatie de toekomst zag. Eigenlijk zijn deze verwachtingen dus de voorspellingen uit het verleden. Verwachtingen spelen in verschillende economische theorieën een belangrijke rol. Zo beïnvloeden inflatieverwachtingen het niveau van de rente. Omdat over deze verwachtingen geen echte gegevens beschikbaar zijn, bedient men zich soms van een Box-Jenkins-model om ze te maken, daarbij ervan uitgaande dat de door de theorie beschreven economische subjecten ‘slim’ genoeg waren om bij hun verwachtingen intuïtief zo'n Box-Jenkins-model te hanteren.
De speurtocht naar een verborgen periodiciteit in bepaalde verschijnselen heeft een belangrijke bijdrage geleverd tot de ontwikkeling van de tijdreeksanalyse. Een van de pioniers op dit gebied is onze landgenoot Buys Ballot, die in het midden van de vorige eeuw periodieke schommelingen in de temperatuur onderzocht. De meest bekende vorm van periodiciteit zijn de seizoenbewegingen. Deze bewegingen behoren tot de systematiek die met de Box-Jenkins-modellen beschreven kan worden en zodoende is het mogelijk met een ARIMA-model een reeks voor seizoen te corrigeren. Dit is echter een nogal moeizaam en onontgonnen toepassingsgebied. De Vos heeft voor de Nederlandse werkloosheidscijfers een Box-Jenkins-model ontworpen waarmee hij deze gegevens, die voortdurend in de politieke belangstelling staan, van hun seizoenpatroon kan ontdoen. Bovendien heeft Cleveland aangetoond dat de Census X11 methode, een veelvuldig gebruikte seizoencorrectiemethode, tot een, zij het zeer ingewikkelde, ARIMA-transformatie is te herschrijven.
| |
ARIMA-modellen versus econometrische modellen
Keren wij nu terug naar de vraag die in de roerige bijeenkomst van de Royal Statistical Society aan de orde was: kunnen de formules van Box en Jenkins in voorspelkracht wedijveren met de traditionele econometrische modellen. Het probleem bij deze vraag is dat een eerlijke vergelijking vaak niet mogelijk is. Een econometrisch model maakt nl. gebruik van zgn. exogene grootheden, die niet door het model zelf verklaard worden, maar buiten het model om, en die voor het model als gegeven grootheden gelden. Het is daarom niet verwonderlijk wanneer een econometrisch model het wint van een Box-Jenkins-model bij de verklaring van het verloop van een tijdreeks. Zo worden in een model van de Nederlandse hypotheekmarkt de twee voornaamste grootheden ongeveer tweemaal zo goed verklaard door het volledige econometrische model dan door passende ARIMA-modellen. Ja, het zou zelfs vreemd zijn indien het econometrische model het niet beter doet. Dit zou betekenen dat de economische theorie geen enkele bijdrage tot de verklaring van de desbetreffende grootheid levert, althans geen bijdrage die kwantitatief valt te achterhalen.
Om met een econometrisch model te voorspellen moet men echter de toekomstige waarden van de exogene variabelen kennen. Nu zijn deze exogenen soms mak-
| |
| |
| |
| |
kelijker of beter te voorspellen dan de grootheid die men in feite wil voorspellen. Men beweerde vroeger wel eens dat het Centraal Planbureau niet zozeer uitblonk vanwege zijn goede modellen, maar vanwege zijn goede natte vinger, omdat het zo nauwkeurig de exogene ontwikkelingen wist in te schatten. In dat geval spelen intuïtieve en subjectieve elementen een rol en wordt een objectieve vergelijking met Box-Jenkins-modellen natuurlijk onmogelijk. Het kan ook voorkomen dat de huidige waarden van de exogenen van invloed zijn op de toekomstige waarden van de te voorspellen grootheid en dat dit systematische verband sterker is dan tussen de huidige en toekomstige waarden van de te voorspellen grootheid zelf. Dan is een eerlijke vergelijking tussen het econometrische en het Box-Jenkins-model wel mogelijk omdat subjectieve elementen in dit geval uitgebannen zijn. Over het algemeen zal het beter zijn die exogene informatie te gebruiken. Interessant is in zo'n geval na te gaan tot hoever in de toekomst het verband tussen de exogenen en de te voorspellen grootheid van nut is voor de prognoses.
| |
Transferfuncties en causaliteit
Tot nu toe heb ik in dit opstel het Box-Jenkins-model als tegenhanger, ja zelfs als concurrent, beschreven van iets wat gemakshalve met econometrisch model is aangeduid. Deze door de discussies gesuggereerde tegenstelling is echter kunstmatig en onterecht. Veelal worden de namen van Box en Jenkins alleen met de ARIMA-modellen verbonden. Ik heb dit in het voorafgaande ook gedaan, maar eigenlijk is het onjuist. In hun boek besteden beide auteurs uitvoerig aandacht aan de zgn. transferfuncties. Een transferfunctie beschrijft een tijdreeks niet alleen als een transformatie van witte ruis (zoals het ARIMA-model), maar daarnaast speelt ook een exogene variabele een rol als invoer. De mogelijke transformaties zijn voor ruis en exogene invoervariabele hetzelfde, maar terwijl het verloop van de ruis volkomen onbekend is verondersteld, wordt dat van de exogene juist volkomen bekend geacht. Zo'n transferfunctie is in feite de meest algemene vorm van een eenvoudige vergelijking uit een econometrisch model. De constructie van een transferfunctie geschiedt gelijk een ARIMA-model in drie fasen. Voor de identificatie van de juiste transformatie van de exogene invoervariabele dient voor deze variabele eerst een passend ARIMA-model gevonden te worden. Daarmee wordt deze reeks tot witte ruis teruggetransformeerd (gefilterd) en deze handeling noemen we het witten van de reeks. Behalve in de identificatiefase spelen de ARIMA-modellen ook in de controlefase een rol.
Met het witten van de invoervariabele gaat men na of de onderzochte tijdreeks, de uitvoervariabele, wel werkelijk door de invoer beïnvloed wordt. Beide variabelen kunnen nl. op het eerste gezicht met elkaar gecorreleerd zijn, b.v. omdat beide eenzelfde trend of eenzelfde seizoen- of conjunctuurpatroon vertonen. Dat behoeft nog niet te betekenen dat informatie over de ene reeks relevant voor de andere is. Anders gezegd: dat de invoer bijdraagt tot de verklaring van de uitvoer en dat deze laatste beter voorspeld wordt met de transferfunctie dan met een passend ARIMA-model. Indien de huidige waarden van de invoer inderdaad informatie bevatten over de huidige en/of toekomstige waarden van de uitvoer, spreekt men van een causaal verband tussen invoer en uitvoer. Om deze causaliteitstoets uit te voeren zijn dus wederom ARIMA-modellen nodig. Het is vanzelfsprekend ook mogelijk om de causaliteit in omgekeerde richting te onderzoeken.
Causaliteit is, zeker in wetenschapsfilosofische discussies, een nogal beladen begrip. Misschien schudden sommige geleerden wel meewarig hun hoofd wanneer zij vernemen hoe luchthartig er hier met dit woord wordt omgesprongen. De definitie waarbij er van causaliteit sprake is wanneer de ene reeks extra informatie over de andere aandraagt is evenwel niet bedoeld als het ei van Columbus in bovengenoemde discussies. Het is slechts een poging dit begrip een operationele inhoud te geven. In eerste aanleg moet de veronderstelling van een causale relatie tussen twee grootheden op theoretische overwegingen gebaseerd zijn, en deze overwegingen kunnen al dan niet empirisch ondersteund worden door de toets op causaliteit. Men mag daarentegen niet zonder meer stellen dat er tussen twee grootheden een causale relatie bestaat omdat de causaliteitstoets positief uitvalt. Er kan nl. sprake zijn van een vermeende samenhang b.v. omdat een derde factor de beide grootheden beïnvloedt en wel met verschillende vertragingen. Het gevaar van een schijncorrelatie, zoals die tussen de toename van het aantal televisietoestellen en het aantal krankzinnigen, is overigens bij een causaliteitstoets afwezig omdat men (één van) de beide reeksen wit.
| |
| |
| |
Toekomst voor toekomstvoorspellers
Het boek van Box en Jenkins uit 1970 bespreekt de ARIMA-modellen en de enkelvoudige transferfuncties met één exogene variabele als invoer. Inmiddels is de analyse verder uitgebouwd. In eerste instantie tot multipele transferfuncties waarin meerdere exogene variabelen als invoer opgenomen worden. Computerprogramma's hiervoor zijn sinds enkele jaren in de handel en deze techniek begint zo langzamerhand tot de standaarduitrusting van de zichzelf respecterende wetenschappelijke instituten te horen.
De volgende stap bevindt zich nog in de laboratoriumfase. Dit is het onderzoek naar stelsels van transferfuncties waarin meerdere tijdreeksen gelijktijdig en in onderlinge samenhang, d.w.z. simultaan, verklaard worden. Naast eventuele exogene variabelen wordt de invoer van deze simultane stelsels gevormd door een aantal reeksen witte ruis. Daarom spreekt men van multivariate modellen in tegenstelling tot de univariate ARIMA-modellen en transferfuncties waar de invoer slechts één reeks witte ruis bevat. De methoden om de parameters van deze stelsels te schatten zijn reeds ontwikkeld maar er bestaan nog niet veel bevredigende toepassingen. In het septembernummer van Econometrica, een vooraanstaand internationaal vakblad voor econometristen, geeft Wallis twee voorbeelden: een model voor de Amerikaanse varkensmarkt en een model, dat eerder door Zellner en Palm onderzocht werd en waarin drie belangrijke macroeconomische grootheden (consumptie, nationaal inkomen en investeringen) verklaard worden. Exogene variabelen spelen in deze modellen (nog) geen rol.
Eigenlijk is een simultaan stelsel van transferfuncties niets anders dan een zeer algemene vorm van het klassieke econometrische model met simultane vergelijkingen, het type modellen waar het CPB reeds jaren mee werkt en de tegenhanger van de univariate ARIMA-modellen in de discussie in de Royal Statistical Society. In feite liggen de ARIMA-modellen aan de basis van de moderne en breed georiënteerde theorievorming over de simultane econometrische modellen en mag er dus van een tegenstelling geen sprake zijn. Een ARIMA-model is de meest eenvoudige gedaante van zo'n simultaan model en het is denkbaar dat sommige grootheden niet beter dan met een eenvoudig univariaat ARIMA-model voorspeld kunnen worden (b.v. de ‘eigenlijke’ exogenen, zie later). Aan de andere kant zou het een blamage voor de economische theorie (of de modelbouwers) betekenen indien dit voor alle economische grootheden zou gelden.
De economische theorie leert welke grootheden in een econometrisch model elkaar mogelijkerwijs beïnvloeden en welke niet. De economische wetmatigheden leiden in het model gewoonlijk tot eenvoudige vergelijkingen, waarin slechts een beperkt aantal grootheden met elkaar samenhangen. Het gaat hier om de directe samenhang tussen de desbetreffende grootheden; indirect zijn veel meer endogenen van het model afhankelijk van elkaar, maar deze samenhang komt tot stand via de simultaniteit en de dynamiek van het model. Zo levert de economische theorie dus veel informatie over de algemene structuur van het model. Dit geldt echter niet voor de vertragingsstructuur. In de oudere econometrische modellen zijn de vertragingsstructuren nogal stief- | |
| |
moederlijk behandeld. Dit is niet zo erg wanneer de modellen op jaarcijfers gebaseerd zijn. Momenteel gebruikt men echter vaak kwartaalcijfers en zelfs maandcijfers, en dan is de vertragingsstructuur veel belangrijker. Bovendien berusten de voorspelmogelijkheden van een model immers geheel en al op de aanwezigheid van vertraagde variabelen. Het is juist voor deze vertragingsstructuur dat het simultane stelsel van transferfuncties een algemeen kader biedt. Omdat, zoals gezegd, de economische theorie weinig of geen informatie verschaft over de vertragingsstructuur, berust de identificatie van de vertragingsstructuur dus in zeer grote mate op cijfermateriaal en econometrische technieken.
De identificatie van de vertragingsstructuur loopt via de zgn. finale vorm van het model. In de finale vorm is iedere te voorspellen d.w.z. endogene grootheid een functie van zijn eigen vertraagde waarden en van de ‘eigenlijke’ exogenen, al dan niet vertraagd. Exogeen zijn alleen die variabelen die informatie bijdragen tot de voorspelling van de endogenen. M.a.w. die de endogenen veroorzaken. De exogenen vormen als het ware die autonome schokken die het model in beweging zetten. Daarentegen kunnen andere grootheden uit het model nooit een bijdrage leveren tot de voorspelling van de exogenen, die dus stuk voor stuk onvoorspelbaar zijn met het model. Immers indien een ‘exogene’ variabele wel beïnvloed zou worden, eventueel vertraagd, door een endogene of een andere exogene variabele, zou men het model met een extra vergelijking moeten uitbreiden. Daarmee is deze ‘exogene’ endogeen geworden en komt niet meer voor in een finale vormvergelijking van een andere endogene.
Lang niet alle exogene grootheden in de bestaande econometrische modellen voldoen aan de stringente eisen die gesteld zijn aan de ‘eigenlijke’ exogenen in de finale vormvergelijking. Enkele avant-gardisten onder de econometristen zijn dan ook al naarstig naar nieuwe kandidaten aan het speuren, hoe paradoxaal het ook moge klinken: voor betere voorspellingen op zoek naar het onvoorspelbare. Een hulpmiddel hierbij is wellicht een gegeneraliseerde causaliteitstoets, die een willekeurige verzameling samenhangende grootheden aan de hand van tijdreekswaarnemingen in twee delen weet te splitsen: één deel met de grootheden die veroorzaakt worden en de rest met de grootheden die alleen zelf veroorzaken, de ‘eigenlijke’ exogenen.
Met de simultane transferfuncties, de gegeneraliseerde causaliteitstoets en de identificatie van vertragingsstructuren via de finale vorm zijn we terecht gekomen bij de toekomstmuziek van de toekomstvoorspellers. Op vele plaatsen in de wereld is men in de econometrische laboratoria bezig dit gebied te ontginnen en het pad te effenen voor de empiristen die deze nieuwe technieken op relevante problemen uit de praktijk willen toepassen. In hoeverre dit tot voor het beleid interessante verbeteringen van de voorspellingen zal leiden en het de laatste tijd door kamikaze-econometristen en de oliecrisis enigermate bezoedelde blazoen van de econometrische modelbouw weer zal oppoetsen, ligt echter nog in de schoot van de toekomst verborgen. Alleen een waarzegger weet deze vraag met gepaste zekerheid te beantwoorden.
| |
Enige Literatuur
Anderson, O.D., ‘A Commentary on “A Survey of Time Series”’, International Statistical Review, Vol. 45, No. 3, 1977, blz. 273-297. |
Box, G.E.P. en G.M. Jenkins, Time Series Analysis, Holden Day, San Francisco, 1970. |
Granger, C.W.J. en P. Newbold, Forecasting Economic Time Series, Academic Press, New York, 1977. Makridakis, S., ‘A Survey of Time Series’, International Statistical Review, Vol 44, No 1, 1976, blz. 29-70. |
Prothero, D.L. en K.F. Wallis, ‘Modelling Macroeconomic Time Series’, Journal of the Royal Statistical Society A, 139, Part 4, 1976, blz. 468-500. |
Wallis, K.F., ‘Multiple Time Series Analysis and the Final Form of Econometric Models’, Econometrica, Vol 45, No 6, 1977, blz. 1481-1497. |
|
|