Frekvens

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 10 september 2019; kontroller kräver 17 redigeringar .

Frekvens (eller relativ frekvens ) - förhållandet mellan antalet instanser av ett givet objekt och det totala antalet instanser av alla objekt i en given uppsättning. Ibland hänvisas till antalet instanser av ett givet objekt som den absoluta frekvensen för det objektet. Inom lingvistik och lexikostatistik förstås ord, bokstäver, fraser som sådana objekt, inom kryptografi och datavetenskap - även kombinationer av bokstäver och vilka symboler som helst. En uppsättning kan betyda vilken text som helst, en samling texter (korpus) eller till och med ett språk.

Beräkningen av frekvensen av ord utförs enligt formeln :

där Freq x är frekvensen för ordet "x", Q x är antalet ordanvändningar av ordet "x", Q all är det totala antalet ordanvändningar. I de flesta fall uttrycks frekvensen i procent. I ordböcker kan frekvensen av ord återspeglas i märken - vanliga, sällsynta, etc.

Frekvensen för bokstäver bestäms på liknande sätt. Den högre frekvensen av konsonanter i ett visst segment av texten (till exempel i dikter) är ett av tecknen på alliteration (tillsammans med positionella egenskaper). Höga vokalfrekvenser i texten indikerar indirekt assonans . Frekvensanalys används i kryptografi för att identifiera de vanligaste bokstäverna i ett visst språk.

Frekvensen av ord och bokstäver var det viktigaste verktyget för kryptoanalys under eran före blockchifferens allestädes närvarande .

Blanda inte ihop termerna frekvens och frekvens .


Frekvens av ryska bokstäver

Frekvensstatistik för bokstäver på ryska språket (om materialet från NKRIA ): [1]

brev rang använder frekvens
a 3 40487008 8,01 % 8.01 
b 21 8051767 1,59 % 1,59 
i 9 22930719 4,54 % 4,54 
G 19 8564640 1,70 % 1.7 
d 13 15052118 2,98 % 2,98 
e 2 42691213 8,45 % 8.45 
yo 33 184928 0,04 % 0,04 
och 25 4746916 0,94 % 0,94 
h tjugo 8329904 1,65 % 1,65 
och fyra 37153142 7,35 % 7.35 
th 23 6106262 1,21 % 1.21 
till elva 17653469 3,49 % 3,49 
l tio 22230174 4,40 % 4.4 
m 12 16203060 3,21 % 3.21 
n 5 33838881 6,70 % 6.7 
handla om ett 55414481 10,97 % 10,97 
P fjorton 14201572 2,81 % 2,81 
R åtta 23916825 4,73 % 4,73 
Med 7 27627040 5,47 % 5,47 
t 6 31620970 6,26 % 6,26 
femton 13245712 2,62 % 2,62 
f 31 1335747 0,26 % 0,26 
X 24 4904176 0,97 % 0,97 
c 28 2438807 0,48 % 0,48 
h 22 7300193 1,44 % 1,44 
sh 26 3678738 0,73 % 0,73 
sch 29 1822476 0,36 % 0,36 
b 32 185452 0,04 % 0,04 
s 17 9595941 1,90 % 1.9 
b arton 8784613 1,74 % 1,74 
eh trettio 1610107 0,32 % 0,32 
Yu 27 3220715 0,64 % 0,64 
jag 16 10139085 2,01 % 2.01 

Se även

Anteckningar

  1. O. N. Lyashevskaya, S. A. Sharov. Ny frekvensordbok över ryskt ordförråd  (åtkomstdatum: 23 april 2017)

Länkar