Joyne-koefficienten är en koefficient inom lingvistik som visar hur universell eller, omvänt, hur specialiserad användningen av ett visst ord är i texter av olika ämnen. Om ordet endast används i texter av ett visst smalt ämne är Joyne-koefficienten nära 0, men om frekvensen av ordanvändning är ungefär densamma i någon text är koefficienten nära 100.
Joyne-koefficienten definieras av formeln [1] [2]
var är antalet tematiska segment som de studerade texterna är indelade i;
är medelfrekvensen för ett ord i alla segment;
— Standardavvikelse för frekvenser för enskilda segment.
För att beräkna Joine-koefficienten är texterna som studeras indelade i segment av olika ämnen med ungefär samma volym (vid sammanställning av frekvensordböcker tilldelas vanligtvis 100 segment). För varje segment beräknas användningsfrekvensen för ett visst ord, det vill säga antalet ordanvändningar dividerat med segmentets totala volym. För den erhållna serien av frekvenser beräknas standardavvikelsen , varefter de erhållna värdena ersätts i formeln.
Låt de studerade texterna delas in i 4 segment, vart och ett med en storlek på 1 miljon ord. Ett visst ord, till exempel "koefficient" förekommer i dessa segment 10, 11, 8 respektive 3 gånger. Då = 10, = 11, = 9, = 3 användningar per miljon. Betyda
standardavvikelse
Sedan Joine-koefficienten