eens een rekenlineaal heeft vastgehouden. Tienvingerige wezens gebruiken vaak log10 in plaats van log2 wat het voordeel heeft dat de logarithme van een getal dan ongeveer gelijk is aan het aantal cijfers van dat getal, maar het liefst gebruiken we een heel mooi grondgetal dat allerlei aardige eigenschappen bezit. U heeft voor het vervolg alleen maar log2 nodig, die we gewoon log noemen.
Een ‘bit’ (van binary digit) is een maateenheid voor informatie. Als je van een persoon alleen weet of het een man of een vrouw is dan heb je 1 bit informatie over hem/haar. Weet je ook nog de leeftijd van die persoon dan is die informatie zo'n zes, zeven bits waard, want na zes, zeven ja/neevragen kun je elke mensenleeftijd raden. Met de twintig ja/nee-antwoorden uit het spel ‘twenty questions’ (‘het hangt aan de muur en het tikt’) zijn meer dan een miljoen onderwerpen te onderscheiden. Dat een willekeurige speelkaart klaver is geeft 2 bits informatie: er is immers keus uit vier soorten (dat het een zwarte kaart is geeft 1 bit, dat het niet de schoppen is, het ze bit). Dat een willekeurige speelkaart een aas is geeft zo'n drieëneenhalf bit informatie want de kans daarop is 1 op 13. Dat een speelkaart de klaveraas is geeft 2 + 3,5 = 5,5 bits aan informatie. Het verband met log is nu wel duidelijk: de informatie die uit m mogelijkheden er eentje aanwijst is logm bits waard. Terwijl je de 4 kaartsoorten moet vermenigvuldigen met de 13 kaartnummers om de 52 speelkaarten te krijgen, hoef je de informatiegroottes alleen maar op te tellen.
Die bit lijkt een mooie informatieëenheid, maar voor praktische situaties heb je er toch niet veel aan. Wat is b.v. de informatie van de vorige zin, of - nog erger - van deze (een vraag)? Het eenvoudigste, en het enige dat wij in dit stukje zullen gaan doen, is te zeggen: de informatie is per letter 5 bits (want er zijn immers, met Deense letters en leestekens mee, precies 32 letters). Een woord van 5 letters heeft dus een informatie van 25 bits. ‘ja’ is tien bits, ‘nee’ is vijftien bits en ‘neen’ twintig bits. We zijn nu in staat aan onze stelling (10) van hierboven een concrete uitdrukking te geven, door b.v. n maar eens de waarde 1000 te geven en m de waarde 32. We krijgen dan de volgende uitspraak (het mits-gedeelte laten we even weg):
(11) Een alfabetische lijst van duizend woorden, ieder van 32 bits, kan in 5000 bits opgeborgen worden.
Bedenken we nu dat vijf bits één letter is, dan kunnen we, enigszins slordig, ook lezen:
(12) Een alfabetische lijst van duizend woorden, ieder van zes letters, kan in duizend letters opgeborgen worden.
De zesduizend letters uit de lijst kunnen dus opgeborgen in een zes maal zo klein volume. Maar het kan nog veel zuiniger als we m bijvoorbeeld ook 1000 noemen. We krijgen dan:
(13) Een alfabetische lijst van 1000 woorden, ieder van 1000 bits, kan in 10 000 bits opgeborgen worden.
Vertalen we dit weer in letters, en vervangen we ‘woord’ door ‘titel’ omdat 200 letters wat veel is voor een woord (het langste woord in Van Dale is ‘wapenstilstandsonderhandelingen’), dan krijgen we deze verrassende uitspraak:
(14) Een alfabetische lijst van 1000 titels, ieder van 200 letters, kan in 2000 letters opgeborgen worden.
Elke titel van 200 letters gaat dus in 2 letters, een reductie van 99%, is dat niet wonderbaar?
U weet dus nu wat stelling (10) betekent, en ik zou het hierbij kunnen laten want promotiestellingen zijn meningen waarop ‘O’ het enige antwoord is. Maar deze stelling is er eentje zoals die in de wiskunde gebruikelijk zijn: het is een uitspraak waarvan de uitspreker de pretentie heeft een bewijs te hebben. Een onbewezen stelling heet in de wiskunde een ‘vermoeden’ (‘conjecture’). Wij gaan dus nu even die stelling bewijzen. Daarbij spelen drie ideeën een rol.