Joynes koefficient

Joyne-koefficienten är en koefficient inom lingvistik som visar hur universell eller, omvänt, hur specialiserad användningen av ett visst ord är i texter av olika ämnen. Om ordet endast används i texter av ett visst smalt ämne är Joyne-koefficienten nära 0, men om frekvensen av ordanvändning är ungefär densamma i någon text är koefficienten nära 100.

Beräkning

Joyne-koefficienten definieras av formeln [1] [2]

var är antalet tematiska segment som de studerade texterna är indelade i;

är medelfrekvensen för ett ord i alla segment;

— Standardavvikelse för frekvenser för enskilda segment.

För att beräkna Joine-koefficienten är texterna som studeras indelade i segment av olika ämnen med ungefär samma volym (vid sammanställning av frekvensordböcker tilldelas vanligtvis 100 segment). För varje segment beräknas användningsfrekvensen för ett visst ord, det vill säga antalet ordanvändningar dividerat med segmentets totala volym. För den erhållna serien av frekvenser beräknas standardavvikelsen , varefter de erhållna värdena ersätts i formeln.

Exempel

Låt de studerade texterna delas in i 4 segment, vart och ett med en storlek på 1 miljon ord. Ett visst ord, till exempel "koefficient" förekommer i dessa segment 10, 11, 8 respektive 3 gånger. Då = 10, = 11, = 9, = 3 användningar per miljon. Betyda

standardavvikelse

Sedan Joine-koefficienten

Anteckningar

  1. Sharov S.A., Lyashevskaya O.N. Frekvensordbok för det moderna ryska språket baserad på materialet från National Corpus of the Russian Language Arkiverad 21 september 2019 på Wayback Machine - M .: Publishing Center "Azbukovnik", 2009. - 1060 sid.
  2. Frekvensordbok för franska ord : A. Juilland, D. Brodin och C. Davidovitch De romanska språken och deras strukturer, första serien F 1. Mouton, Haag-Paris, 1970. lxxv, 503 s. ⨍ 120.

Se även

frekvensordbok