Om man vill ta fram någon form av statistik av förändring av ords användning över tid så är förekomsten av ett visst ord inte jämförbar mellan t.ex. åren 1906 och 1907 eftersom det finns nåt i stil med 400% mer skannat material från det förra året jämfört med det senare. Det gäller såklart också om man jämför hur ofta ett ord förekommer 1907 jämför med 2007 eftersom mängden publicerad text är helt olika.
Det finns säkert också mindre skillnader mellan olika år som kan påverka, och särskilt om man söker på ord som förekommer kanske bara förekommer rätt sällan.
Finns det statistik över hur mycket tillgänglig, sökbart material det finns per år? Det bästa vore ju såklart i antal tecken men bara i antal sidor skulle göra det möjligt att justera för att se faktiskt förändring över tid.