Frekvens (eller relativ frekvens ) - förhållandet mellan antalet instanser av ett givet objekt och det totala antalet instanser av alla objekt i en given uppsättning. Ibland hänvisas till antalet instanser av ett givet objekt som den absoluta frekvensen för det objektet. Inom lingvistik och lexikostatistik förstås ord, bokstäver, fraser som sådana objekt, inom kryptografi och datavetenskap - även kombinationer av bokstäver och vilka symboler som helst. En uppsättning kan betyda vilken text som helst, en samling texter (korpus) eller till och med ett språk.
Beräkningen av frekvensen av ord utförs enligt formeln :
där Freq x är frekvensen för ordet "x", Q x är antalet ordanvändningar av ordet "x", Q all är det totala antalet ordanvändningar. I de flesta fall uttrycks frekvensen i procent. I ordböcker kan frekvensen av ord återspeglas i märken - vanliga, sällsynta, etc.
Frekvensen för bokstäver bestäms på liknande sätt. Den högre frekvensen av konsonanter i ett visst segment av texten (till exempel i dikter) är ett av tecknen på alliteration (tillsammans med positionella egenskaper). Höga vokalfrekvenser i texten indikerar indirekt assonans . Frekvensanalys används i kryptografi för att identifiera de vanligaste bokstäverna i ett visst språk.
Frekvensen av ord och bokstäver var det viktigaste verktyget för kryptoanalys under eran före blockchifferens allestädes närvarande .
Blanda inte ihop termerna frekvens och frekvens .
Frekvensstatistik för bokstäver på ryska språket (om materialet från NKRIA ): [1]
brev | rang | använder | frekvens | |
---|---|---|---|---|
a | 3 | 40487008 | 8,01 % | |
b | 21 | 8051767 | 1,59 % | |
i | 9 | 22930719 | 4,54 % | |
G | 19 | 8564640 | 1,70 % | |
d | 13 | 15052118 | 2,98 % | |
e | 2 | 42691213 | 8,45 % | |
yo | 33 | 184928 | 0,04 % | |
och | 25 | 4746916 | 0,94 % | |
h | tjugo | 8329904 | 1,65 % | |
och | fyra | 37153142 | 7,35 % | |
th | 23 | 6106262 | 1,21 % | |
till | elva | 17653469 | 3,49 % | |
l | tio | 22230174 | 4,40 % | |
m | 12 | 16203060 | 3,21 % | |
n | 5 | 33838881 | 6,70 % | |
handla om | ett | 55414481 | 10,97 % | |
P | fjorton | 14201572 | 2,81 % | |
R | åtta | 23916825 | 4,73 % | |
Med | 7 | 27627040 | 5,47 % | |
t | 6 | 31620970 | 6,26 % | |
på | femton | 13245712 | 2,62 % | |
f | 31 | 1335747 | 0,26 % | |
X | 24 | 4904176 | 0,97 % | |
c | 28 | 2438807 | 0,48 % | |
h | 22 | 7300193 | 1,44 % | |
sh | 26 | 3678738 | 0,73 % | |
sch | 29 | 1822476 | 0,36 % | |
b | 32 | 185452 | 0,04 % | |
s | 17 | 9595941 | 1,90 % | |
b | arton | 8784613 | 1,74 % | |
eh | trettio | 1610107 | 0,32 % | |
Yu | 27 | 3220715 | 0,64 % | |
jag | 16 | 10139085 | 2,01 % |