Beperking door ontleding
Woorden hoeven trouwens niet eens zo vreselijk exotisch te zijn, om toch te kunnen ontbreken. De woordenlijst moet immers veel méér bevatten dan alleen de woorden uit een woordenboek (de zogenaamde lemma's). Ook alle afgeleide vormen moeten aanwezig zijn. Dus niet alleen de lemma's aap en aangeven, maar ook apen, aapje, aapjes, aangeef aangeeft, aangaf aangaven, aangegeven.
Om te voorkomen dat een woordenlijst gigantische afmetingen krijgt, zal een fabrikant er alleen woorden instoppen die met enige regelmaat in geschreven Nederlands voorkomen. Een gewoon Nederlands woord als aapje zal daarom toch vaak ontbreken. Tenzij er in het spellingprogramma regels voor woordontleding zijn ingebouwd, die bijvoorbeeld eerst alle verklein-woordsvormen als -je, -kje, -tje en -pje van een gelezen woord verwijderen voordat het in de lijst wordt opgezocht.
De kwaliteit van een computerprogramma voor spellingcontrole valt of staat met de kwaliteit van de bijbehorende woordenlijst. Ten eerste moet de lijst groot genoeg zijn: voor het Nederlands minimaal 50.000 à 60.000 frequente woordvormen, maar liever nog veel meer. Ten tweede moet ze op een handige manier gecodeerd zijn, zodat de omvang kleiner wordt en de snelheid waarmee het woord wordt opgezocht, groter.
Omdat een woordenlijst gecodeerd en gesorteerd moet worden, is het bij sommige programma's niet mogelijk om zelf woorden aan de lijst toe te voegen. Zonder die mogelijkheid is een programma voor spellingcontrole praktisch onbruikbaar.
Het Nederlands is - net als het Duits - een taal waarin het mogelijk is om nieuwe woorden te maken uit bestaande woorden. In een taal als het Engels kan dat niet. Van lever en worst kunnen we leverworst maken en van slager plus worst kunnen we slagersworst maken.
Omdat het mogelijk is om steeds weer nieuwe woorden te maken, zal een woordenlijst voor spellingcontrole nooit volledig kunnen zijn. Op zichzelf is dat helemaal niet erg, mits die woordenlijst op dezelfde manier samengesteld wordt als de woordenlijst in ons hoofd; een lijst van mogelijke onderdelen van woorden in plaats van echte woorden, dus alleen lever en worst, en niet leverworst. Wanneer dan bovendien het achtervoegsel -en in de lijst wordt opgenomen, krijgen we meteen de meervouden erbij. Natuurlijk moet er dan in het bijbehorende spellingprogramma gezorgd worden voor de nodige regels die de losse onderdelen met elkaar kunnen combineren.