Det finns två klasser av kommunikationssystem: digitala och analoga . En digital signal är en signal som har ett ändligt antal diskreta nivåer. Analoga signaler är kontinuerliga. Ett typiskt exempel på en sådan signal är en röstsignal som sänds över en konventionell telefon. Information som sänds med analoga signaler måste också skyddas, inklusive med kryptografiska metoder.
Det finns två olika sätt att kryptera en talsignal. Det första är att blanda ( krypta ) signalen på något sätt. Detta görs genom att ändra förhållandet mellan tid, amplitud och frekvens inom det användbara området. Det andra sättet är att omvandla signalen till en digital form, på vilken de vanliga metoderna för diskret kryptering är tillämpliga. Det krypterade meddelandet sänds sedan över kanalen med hjälp av ett modem. Efter dekryptering av det mottagna kryptogrammet återställs den analoga vågformen igen.
Innan vi går in på detaljer är det nödvändigt att uppehålla sig vid vissa funktioner i talsignaler.
Kontinuerliga signaler kännetecknas av sitt spektrum. Spektrum för en signal är dess ekvivalenta uppsättning av sinusformade komponenter (även kallade övertoner eller frekvenskomponenter ). Signalens spektrum erhålls genom att utöka funktionen som uttrycker signalformens beroende av tid, i en Fourier-serie . Spektrum för en periodisk signal är linje (diskret), den består av övertoner med flera frekvenser. Spektrum för en icke-periodisk signal är kontinuerlig. Ett typiskt spektrum av en talsignal visas i fig. 1. Fig. ett
Frekvenskomponenter i intervallen 3-4 kHz och mindre än 300 Hz minskar snabbt. Således bidrar mycket högfrekventa komponenter betydligt mindre till signalen än frekvenser i intervallet 500-3000 Hz.
Om vi begränsar oss till frekvenser som inte överstiger 3 kHz och använder en mycket känslig analysator, så har spektrumet som produceras av vissa ljud formen av en taggig kurva ungefär av följande form (se fig. 2). Ris. 2
Vi ser flera toppar i grafen, kallade formanter . Förändringen av dessa frekvenskomponenter över tiden kan avbildas på en tredimensionell graf (genom att lägga till en tredje koordinat - tid).
Talsignalen är en bärare av semantisk information. Denna information, när du lyssnar på en talsignal, kan spelas in som en meddelandetext. Den auditiva uppfattningen av en talsignal är rikare och bär både grundläggande textinformation och ytterligare information i form av stress och intonation. De elementära enheterna för auditiv information är elementära ljud - fonem , och de semantiska enheterna är klingande stavelser, ord och fraser. Varje språk har sin egen uppsättning fonem. Till exempel, på ryska och engelska finns det cirka 40 fonem.
Uppsättningen av fonem är indelad i tre klasser. Vokaler bildar en familj, konsonanter och några andra fonetiska ljud (för engelska är dessa till exempel ljuden ch , sh ) bildar två klasser som kallas plosiver och frikativ . Vokaler produceras av stämbandens rörelse under påverkan av luftströmmar. När de passerar genom struphuvudet förvandlas de till en serie vibrationer. Sedan passerar luftflödet genom ett antal resonatorer, varav de viktigaste är näsan, munnen och halsen, och förvandlas till fonem som uppfattas av det mänskliga örat. De resulterande ljuden beror på formen och storleken på dessa resonatorer, men i stor utsträckning kännetecknas de av lågfrekventa komponenter.
Vokalljud produceras under lång tid. Som regel tar det cirka 100 ms att nå sin toppamplitud. Explosiva ljud produceras genom att "stänga av" luftströmmen och sedan släppa ut den med en explosiv effekt. Blockering av luftflödet kan göras på olika sätt - med tungan, gommen eller läpparna. Till exempel är ljudet "p" uttalat när luftflödet blockeras med läpparna. Explosiva ljud kännetecknas av sina högfrekventa komponenter. Upp till 90 % av deras amplitudtoppar har en varaktighet som inte överstiger 5 ms . Frikativen produceras genom att delvis blockera luftflödet, vilket resulterar i ett ljud som liknar "vitt brus". Detta ljud filtreras sedan av röstkanalsresonatorerna. Frikativen är vanligtvis rik på amplitudtoppar som varar 20-50 ms och koncentrerad i frekvenser från 1 till 3 kHz. Ett exempel på en frikativ är ljudet "sss ..."
En annan viktig egenskap hos mänskligt tal är tonhöjdsfrekvensen . Detta är stämbandens vibrationsfrekvens. Medelvärdet för denna frekvens varierar från person till person, och varje högtalare har en oktavvariation över eller under denna mittfrekvens. Normalt, hos en man, fluktuerar grundtonsfrekvensen runt 130 Hz, hos en kvinna är den högre.
Talsignaler förmedlar inte bara information, utan ger också information om talarens röstegenskaper, vilket gör det möjligt att identifiera honom med rösten. Du kan använda tonhöjd, formanter, timing och andra egenskaper hos talsignalen för att försöka bilda en signal som liknar originalet. Denna återgivning kan vara något onaturlig och en del av högtalarens individuella egenskaper kommer att gå förlorade. Sådana reproduktionsprinciper ligger till grund för vocodern , som kommer att diskuteras senare.
Överväg först den första metoden för att kryptera talsignaler i deras analoga form. När man bedömer styrkan av kryptering av talsignaler i analog form, är det först och främst nödvändigt att ta hänsyn till möjligheterna för mänsklig uppfattning när man lyssnar på den resulterande signalen och försöker återställa all information. Denna uppfattning är mycket subjektiv: vissa människor uppfattar med gehör mycket bättre än andra. Det är till exempel välkänt att föräldrar förstår sina barns "tal" långt innan andra människor börjar förstå det. I detta avseende talar man om den så kallade kvarvarande förståeligheten av signalen .
För att bedöma tillförlitligheten av krypteringen är det tillrådligt att lyssna på kodade telefonmeddelanden flera gånger i rad. Faktum är att den mänskliga hjärnan kan anpassa sig till "extraktionen" av information och snabbt analysera vad som hörs. Det händer ofta att efter den andra eller tredje lyssningen börjar en person känna igen enskilda ord eller stavelser. Det är möjligt att en blandning av olika fragment leder till en förståelse av budskapets innebörd. Det finns till och med experter för att förstå kodade meddelanden. Den enklaste formen av transformationer som beaktas är signaltransformationer i frekvensdomänen: inversioner , cykliska inversioner och frekvenspermutationer .
Den enklaste är spektruminversionstransformationen. Det utförs enligt följande. Betrakta till exempel en signal som ligger i intervallet 300–3000 Hz (se fig. 3). Ris. 3
Låt oss försöka konvertera signalen på ett sådant sätt att de höga och låga frekvenserna vänds om. För att göra detta, överväg de individuella övertonerna i vår signal. Om - en av övertonerna levereras tillsammans med signalen till ingången på enheten, kallad mixer , då kommer dess utgång att vara signalen . Enligt den välkända jämställdheten
Värdena och kan väljas. Genom att ställa in och får vi följande amplitudvinkelspektrum för mixerutgången (se fig. 4). Ris. fyra
När vi betraktar varje överton i signalen och motsvarande mixerutgång får vi följande graf (se fig. 5). Ris. 5
Mellan bärvågsfrekvensen finns två band, som kallas övre respektive undre band . Det övre området liknar originalsignalen, endast flyttat uppåt (varje frekvenskomponent ökar med ). Det nedre området är en spegelbild av originalsignalen. Nu, genom att välja en lämplig bärfrekvens och använda mixern för att flytta det övre området, kan vi få en inverterad talsignal (se fig. 6). Ris. 6
Genom att välja en bärfrekvens för olika signaler kan var och en av dem överföras till ett annat frekvensområde. Detta gör det möjligt att sända flera telefonsignaler på en kanal.
Inversionstransformationen beror inte på den hemliga nyckeln. Detta är en kodning som inte är resistent mot attacker från en motståndare med liknande utrustning. Utvecklingen av idén om en invers kod, som låter dig ange en hemlig nyckel, är att använda den så kallade cykliska inversionen. Kärnan i den cykliska inversionstransformationen är som följer.
Som vi redan har noterat, om den inverterade signalen är i samma område som den ursprungliga signalen (300 - 3000 Hz), är bärvågsfrekvensen 3300 Hz. För en annan bärfrekvens, säg 4000 Hz, får vi en inverterad signal med det spektrum som visas i fig. 7 Fig. 7
Denna signal faller inte inom det ursprungliga bandet. Vi kan komma överens om att överföra den del av spektrumet som överstiger 3000 Hz till den nedre delen av det ursprungliga spektrumet (se fig. 8). Ris. åtta
Denna överföring av en del av spektrumet är idén om cyklisk inversion. En typisk växelriktare har 4 till 16 olika bärfrekvenser. Detta ger samma antal möjliga cykliska skift. Med hjälp av nyckeln kan bärfrekvensen väljas på samma sätt som görs för det enkla substitutionschifferet. Du kan också använda en pseudo-slumptalsgenerator , som väljer en variabel bärvågsfrekvens. Vanligtvis görs detta med ett intervall på 10 eller 20 ms. En enhet som implementerar denna metod kallas en cyklisk inverterad intervallomkopplare .
Sådana system har två allvarliga svagheter. För det första finns det bara ett litet antal möjliga bärvågsfrekvenser åt gången, så att den ursprungliga signalen kan rekonstrueras genom att räkna upp dem med hjälp av relativt enkel utrustning. För det andra, och ännu viktigare, är den kvarvarande förståeligheten av utsignalen för en sådan metod oacceptabelt hög, vilket manifesteras genom direkt avlyssning. Det tredje sättet att ändra signalen i frekvensdomänen är att dela upp området. Signalspektrumet är uppdelat i ett antal lika stora delband, som kan bytas ut med varandra. Till detta kan vi lägga till möjligheten att invertera för vissa delområden. Vi kommer att illustrera denna idé med följande exempel.
Tänk på signalen som visas i fig. 9. I vårt exempel är frekvensomfånget uppdelat i fem lika delar, som omarrangeras i enlighet med den specificerade numreringen, medan den första och femte delen är inverterade (se fig. 10).
Det finns 5 totalt i vårt exempel! möjliga permutationer och möjligheter till invertering. Totalt - signalkonverteringsalternativ. Detta är naturligtvis inte särskilt mycket. Situationen är värre med kvarstående begriplighet. Om endast permutationer av ränder används, så når den kvarvarande läsbarheten för de flesta av dem 10%, vilket naturligtvis inte garanterar hållbarhet. Ris. 9 Fig. tio
Några av anledningarna till detta är lätta att förstå. Detta kommer till exempel att vara fallet om vissa delområden förblir oförändrade. Dessutom är det känt att vanligtvis ligger mer än 40 % av signalenergin i de två första delbanden motsvarande den första formanten. När kryptoanalytikern väl hittar rätt positioner för de två första underbanden och flyttar dem till rätt ställen kommer han delvis att återställa signalen och få en bra chans att förstå meddelandefragmentet.
Man kan försöka förbättra säkerhetssystemet genom att använda ett antal olika permutationer som ändras med korta intervall med hjälp av en pseudo-slumptalsgenerator . Ofta, för riktiga system, lagras de bästa (i termer av låg återstående förståelse) permutationerna i ROM (skrivskyddat minne) som finns inuti enheten.
Även om generatorn kan generera en mycket stor periodsekvens och nyckelstorleken kan väljas tillräckligt stor, även i detta fall, är den kvarvarande förståeligheten för en stor del av transformationerna så stor att systemet inte helt kan tillhandahålla den nödvändiga säkerhetstillförlitligheten.
Detsamma kan sägas om alla scrambler som bara använder frekvensdomänåtgärder. Deras användning begränsas endast till situationer där målet är att hindra den tillfällige lyssnaren från att förstå konversationen, eller till och med en motståndare som inte har rätt utrustning, att förstå konversationen. Som kommer att framgå av det följande ökar mer avancerade system antingen bredden på signalspektrumet eller introducerar tidsfördröjningar i överföringen. Sådana förändringar ger sina egna problem och därför bör frekvensförvrängare endast användas när garanterad robusthet inte krävs.
Till ovanstående bör vi lägga till en anteckning om antalet subband som används av frekvensförvrängaren. I det föregående exemplet var det fem. Det är klart att med en ökning av detta antal skulle antalet möjliga permutationer öka avsevärt, vilket skulle leda till en ökning av stabiliteten i systemet. Införandet av för många delområden är dock förenat med stora praktiska svårigheter. Faktum är att i receptionen är det nödvändigt att återställa den ursprungliga signalen. Filter och andra kretskomponenter introducerar brus och är inte precis linjära system. Alla signaltransformationer som utförs under överföringen är ofullkomliga och leder till en försämring av dess kvalitet vid utgången. Scramblers är särskilt känsliga för sådana förvrängningar. Därför gör en ökning av antalet delband systemet antingen oanvändbart eller oekonomiskt.
Låt oss nu överväga scramblers som påverkar signalens tidskomponenter. De är baserade på följande principer.
Först delas den analoga signalen in i lika tidsintervall som kallas ramar . Varje ram är i sin tur också uppdelad i ännu mindre delar som kallas segment . Insignalen omvandlas genom att omarrangera segmenten inom varje ram. För att göra detta spelas talsignalen vid den sändande änden in på ett band, som är "klippt" i lika delar, numrerat i ordning. Sedan blandas de och "limmas" i någon annan ordning. Signalen som återges från det limmade bandet sänds över en kommunikationskanal och spelas i mottagningsänden återigen upp på ett band, som i sin tur klipps i samma delar som vid sändning. Delarna "limmas" i stigande nummerordning och signalen återställs.
Vi illustrerar denna process med följande exempel.
På fig. Ram 11 är uppdelad i 8 segment. Segmenten omarrangeras sedan enligt permutationen
När du ställer in systemet måste du välja ram- och segmentlängder. Eftersom signalen inte förstörs inuti segmentet är det önskvärt att välja segment så korta att de inte innehåller hela fragment av meddelandet, till exempel enskilda ord. Å andra sidan påverkar segmentets längd allvarligt ljudkvaliteten på den sända signalen, vilket förklaras av rent tekniska skäl. Ju mindre segment, desto lägre ljudkvalitet. Därför krävs en rimlig kompromiss i valet av segmentlängd. Ris. 11
Vid val av ramlängd är det nödvändigt att ta hänsyn till tidsfördröjningsfaktorn mellan den analoga insignalen som kommer in i utrustningen och den rekonstruerade analoga signalen vid mottagningen. För att förstå detta, låt oss återgå till det sista exemplet (se fig. 10). Låt segmentet i vårt exempel vara ett tidsintervall i T s. Sedan tar inmatningen av åtta talsegment till ingången från scramblern 8 T s. Permutationen av segmenten skulle kunna vara sådan att det åttonde segmentet skulle vara det första (dvs. att sändas över kommunikationskanalen i första hand). I ett sådant fall kan inte överföringen påbörjas innan hela ramen har matats in i förvrängaren. Detta kommer att kräva 8 T s. Från början av ramöverföringen till dess slut krävs ytterligare 8 T :er. Därför är en tidsfördröjning oundviklig. Mottagaren kan inte påbörja dekryptering förrän hela ramen har tagits emot. Sålunda, även om sändningstiden inte tas med i beräkningen, är fördröjningen 16 Ts per talsegment. I allmänhet, för ett system som arbetar med m segment per ram, kan fördröjningstiden vara 2 mT s. Ur användarens synvinkel är detta oönskat och en sådan fördröjning bör minimeras. Tillräckligt långa ramar är dock önskvärda för att öka krypteringssäkerheten. För att verifiera detta noterar vi följande.
När vi diskuterade fonems egenskaper kunde vi märka att talljuds egenskaper bevaras under ett ganska långt tidsintervall (formanters struktur förändras långsamt). Om ramen är så liten att den består av en enda ton, så kommer oavsett hur vi förvränger den, resultatet att bli en enda kontinuerlig ton (med en viss förlust av ljudkvalitet som ett resultat av vårt ingripande). Vi kommer inte att kunna uppnå tillräcklig spridning av segmenten på grund av deras ringa antal. Detta kan göra att betydande delar av orden förblir oförändrade, vilket gör att lyssnaren kan känna igen en del av meddelandet.
Det finns inte heller något självklart sätt att välja längd på segmenten. I praktiken är det nödvändigt att experimentellt verifiera valet av segmentlängd. Vanligtvis är ett bra test för detta att försöka återskapa resultatet av slumpmässigt talade siffror från 1 till 10. Det är tydligt att detta problem är mycket enklare än när du vill veta ett meddelande som ingenting är känt om. Experiment visar att om ramlängden inte är tillräckligt stor, så klarar de aktuella systemen inte ett sådant test väl. I de flesta fall, i utrustning av denna typ, är ramar uppdelade i ett antal segment som sträcker sig från 8 till 16, där varje segment vanligtvis varar från 20 till 60 ms.
Förutom valet av ram- och segmentlängder är permutation en viktig parameter. Uppenbarligen är vissa permutationer bättre än andra, och det är nödvändigt att bestämma hur de ska väljas och hur man hanterar deras val. Precis som med inversionstransformationer och frekvenspermutationer finns det flera alternativ för att använda grundsystemet. Du kan välja en fast permutation för att transformera varje ram. En annan variant är kopplad till valet (med hjälp av en nyckel) av flera permutationer och deras periodiska användning. Det bästa sättet är att använda en pseudo-slumpgenerator för att välja den permutation som används för att transformera varje ram individuellt. För en sådan variant är frågan om längden på perioden för motsvarande sekvens av permutationer relevant, eftersom den upprepade användningen av samma permutation är oönskad. Detta är i sin tur relaterat till valet av antalet segment i ramen. Till exempel, om detta nummer är 8 och varje segment har en varaktighet på 40 ms, sedan efter 3,6 timmar. kontinuerlig drift permutationer kommer att börja upprepas.
Som vi redan har noterat är inte alla permutationer "bra" när det gäller krypteringstillförlitlighet. Till exempel, om du lyssnar på signalen efter att ha tillämpat var och en av de två ersättningarna
, , (1)
då skulle vi i det första fallet finna en mycket högre kvarstående förståelighet än i det andra.
Anmärkning . I (1) är de permutationer som övervägs de nedre permutationsraderna, där de översta raderna är de ursprungliga segmentorderna och de nedre raderna är segmentordningarna efter permutationen.
Anledningen till denna skillnad i permutationer (1) är att i den första av dem förblir symbolerna 1, 4, 5, 8 orörliga, och resten flyttas endast till närliggande positioner, medan i den andra uppstår bättre blandning.
Det övervägda exemplet leder till ett naturligt kvantitativt mått på "kvaliteten" av en permutation. Låt, för en godtycklig permutation α , symbolen α(i) beteckna den position till vilken α flyttar det i -te segmentet. Då är förskjutningen av symbolen i efter permutationen , och medelförskjutningen efter permutationen kännetecknas av värdet
För den första substitutionen från (1) är den genomsnittliga förspänningen s(α) 0,5, för den andra är den 2,5. Värdet s(α) kallas skiftfaktorn för substitutionen α . Det har observerats att permutationer som resulterar i en utsignal med låg kvarstående förståelighet har en stor skiftfaktor, även om det omvända kanske inte är sant. Som ett exempel, här är en substitution α av åtta element med en skiftfaktor på 4, som inte tål "hörseltest":
. (2)
Förutom sin låga skjuvfaktor har den första substitutionen i (1) andra oönskade egenskaper. Tänk till exempel på närliggande segment 4 och 5. I den förvrängda ramen är de placerade i samma ordning som i den ursprungliga. Om segmenten är 40 ms långa är segmentparet i fråga cirka 80 ms. Som vi redan har noterat kan de flesta fonem kännas igen i ett sådant tidsintervall. I samma substitution, såväl som i substitution (2), ligger segment 6 och 8 intill. Detta är också oönskat. Faktum är att när man lyssnar på ett par angränsande segment av typ i, i + 2 i en kodad signal, kan den mänskliga hjärnan vanligtvis återställa det saknade segmentet i + 1 , det vill säga återställa motsvarande del av meddelandet. Något liknande sker i andra fall.
I de betraktade situationerna talar vi alltså också om viss kvarstående förståelighet. Detta indikerar komplexiteten i att formalisera definitionen av "bra" permutationer ur skyddssynpunkt, och följaktligen komplexiteten i deras beräkning. Därför finns det betydande skillnader i beräkningen av antalet "bra" permutationer, detta kan bero på utvecklarens subjektiva preferenser.
Nu måste vi lösa frågan om hur man väljer permutationer med hjälp av en nyckel. Det finns två naturliga sätt att göra detta val. Den första består i att välja en godtycklig permutation av en given grad och sedan testa den. Beroende på om det passar eller inte, används permutationen för att transformera ramen. Ett annat sätt är att förvälja alla "bra" permutationer i ROM (skrivskyddat minne) som finns i själva hårdvaran och välja dem för användning med hjälp av en pseudoslumpmässig sekvens. Låt oss överväga båda metoderna.
Det mest ogynnsamma för den första metoden är tidsfaktorn. I slutet av ett tidsintervall som är lika med varaktigheten av ramen måste vi välja nästa lämpliga permutation. I detta fall är det inte önskvärt att upprepa samma permutation, vilket i princip är möjligt även för en slumpmässig kontrollsekvens. Därför behövs kontroll för att eliminera uppkomsten av olämpliga permutationer. Att vänta på en lämplig permutation kräver ytterligare tid, vilket är oönskat.
Den andra metoden använder endast de permutationer som är inspelade i ROM. Om deras utbud inte är för stort, så förbättrar detta fiendens chanser. I det fall då ramen inte består av för många segment, säg 8, och det är möjligt att lagra alla "bra" permutationer, är den andra metoden att föredra. För att förstå en annan fördel med den andra metoden är det nödvändigt att överväga möjligheten av en interceptor med samma utrustning och en komplett uppsättning "bra" permutationer.
Anta att en av permutationerna som lagras i ROM är den andra permutationen från (1), och vi använde den för att blanda ramen. En interceptor, som önskar bestämma vilken permutation som ska användas, kan iterera över permutationer omvända till den lagrade permutationspoolen. Om vårt minne också innehåller den nedre substitutionssträngen
, (3)
då kan interceptorn prova det (istället för den använda). Resultatet av den successiva tillämpningen av den ursprungliga substitutionen och den inversa substitutionen (3) är substitutionen
.
Den är så nära en identisk ersättning att den nästan alltid låter motståndaren återställa den ursprungliga ramen. Förutom (3) finns det andra permutationer som är "nära" den sanna. I fallet när ramen består av 8 segment finns det ganska många sådana par av "nära" permutationer och situationen är ganska farlig (ur skyddssynpunkt). Poängen är att vi måste justera definitionen av en "bra" permutation och därmed minska antalet i minnet. Det är nödvändigt att undvika att lagra par av permutationer som motsvarar permutationer och för vilka produkten eller är nära den identiska permutationen. Om ROM-minnet är fyllt med den gjorda korrigeringen och antalet lagrade permutationer är tillräckligt stort, blir den andra metoden för att välja dem för att blanda ramar mer att föredra.
Låt oss först överväga frågan om möjligheten att återställa informationen i en kodad signal genom direkt avlyssning. Ur en utvecklares synvinkel måste en balans hittas mellan minimal kvarstående förståelighet och minimal tidsfördröjning.
Det finns ett antal sätt att minska kvarvarande läsbarhet. En är att helt enkelt vända om ordningen på segmenten. Observationer visar att när man använder denna metod minskar nivån på framgångsrikt lyssnande med nästan 10 %. En annan metod har också att göra med frekvensdomänen. Här har vi i åtanke den gemensamma användningen av frekvens- och tidsblandning i ett tvådimensionellt system. Även om denna metod minskar framgångsfrekvensen för lyssnande med nästan 20 %, är den dyrare att implementera. Observera dock att alla förändringar i signalen kommer att minska kvaliteten på återgivningen och att frekvensdistorsion, i synnerhet, är starkt beroende av brus och icke-linjäritet i överföringen.
Genom att använda sådana metoder, eller en kombination av dem, kan kvarvarande förståelighet reduceras till en sådan nivå att inget meddelande kan höras. Tänk nu på frågan om systemets motstånd mot mer sofistikerade attacker.
En av dem är att försöka ordna om talsignalen ram för ram. Denna uppgift utförs med hjälp av ett instrument som kallas sonograph . Den här enheten återger sonogrammet för varje bildruta. Ett sonogram är en tredimensionell graf i koordinatsystemets tid (horisontell), frekvens (vertikal), amplitud (tredje koordinat), med hjälp av en "gråskala". I denna skala representerar svart den maximala amplituden och vit representerar minimum. Amplitudförändringar representeras av gråskaleförändringar. En ljusare nyans motsvarande en mindre amplitud. Således, även om ett sonogram har tre dimensioner, presenteras det vanligtvis i två dimensioner.
Avkodning av ett visst antal ramar genom att sampla innehållet i ROM-minnet kan tillåta oss att bestämma en del av den pseudo-slumpmässiga sekvensen som är tillräcklig för att bestämma nyckeln. För att motverka detta behövs en lämplig pseudo-slumpsekvensgenerator som är resistent mot ett sådant hot.
Låt oss anta att vårt system är motståndskraftigt mot det beskrivna tillvägagångssättet. Detta innebär att det enda sättet som en kryptoanalytiker kan ta emot ett meddelande är att dekryptera varje bildruta. Men då är uppenbarligen tiden som krävs för att återställa meddelandet direkt proportionell mot antalet bildrutor. En kryptoanalytiker kan automatisera processen att iterera över de permutationer som finns i ROM-minnet för att testa kriteriet att den mottagna signalen är en talsignal (detta kan till exempel göras från ett sonogram ). För att skydda mot denna möjlighet uppstår återigen frågan om att öka antalet "bra" permutationer, vilket kräver en ökning av ramvaraktigheten och sändningstidsfördröjningen.
Som vi såg tidigare kan tidsfördröjningen under överföringen av den transformerade ramen vara dubbelt så lång som själva ramen. Detta är en konsekvens av det faktum att för vissa permutationer kan segmentet försenas med hela bildrutevaraktigheten. För att minska denna fördröjning kan du ytterligare begränsa uppsättningen av permutationer som används, och se till att varje segment fördröjs "inte för länge". Detta uppnås genom att använda permutationer med relativt små förskjutningar för varje tecken.
Låt oss sammanfatta övervägandet av scramblers.
Scramblers kännetecknas av en analog utgång som ligger i samma område som originalsignalen. Dessutom har de vanligtvis karakteristiska spektrala egenskaper och en utsignal som är en sekvens av öppna talfonem (omordnade). Deras styrka beror på både typen av förvrängning och hur den genomförs. I synnerhet kan användningen av en nyckelberoende pseudo-slumpgenerator för kryptering avsevärt öka säkerhetsnivån. Tillförlitligheten hos varje vald krypteringsmetod beror i stor utsträckning på typen och kvaliteten på kommunikationskanalen. Scramblers sträcker sig från enkla växelriktare till komplexa tidsfrekvenssystem med relativt hög robusthet. De används vanligtvis som tillfälliga krypteringssystem.
För att omvandla talsignalen till digital form tas prover , det vill säga signalvärden med jämna mellanrum τ. Intervallet τ bör vara så litet att signalen inte hinner förändras mycket mellan sampel. Detta intervall kallas ofta för tidssteget eller Nyquist-intervallet . Den minsta samplingsfrekvensen, det vill säga den reciproka av samplingstidssteget, bestäms av V. L. Kotelnikovs sats , enligt vilken samplingsfrekvensen ska vara två gånger den maximala frekvensen för ljudspektrumet. Inom telefoni är denna frekvens begränsad till 3,4 kHz. Därför måste samplingsfrekvensen vara minst 6800 per sekund, eller 6,8 kHz. Processen att ta prover kallas tidsprovtagning .
För den digitala utvärderingen av proverna används nivådiskretiseringsprocessen . Varje sampel kan representeras av ett nummer som motsvarar värdet på ljudspänningssamplet. Till exempel, om ljudspänningen mäts i millivolt, kommer antalet hela millivolt att vara räkningen, och 1 mV kommer att vara nivåsamplingssteget. Förhållandet mellan ljudspänningens maximala amplitud och kvantiseringssteget ger det maximala antal som behöver erhållas vid avläsningar. Den bestämmer det dynamiska området för den överförda signalen. För att överföra tal med tillfredsställande kvalitet räcker det med ett dynamiskt område på 30-35 dB, vilket motsvarar antalet kvantiseringssteg på 30 under samplingar. I det här fallet räcker det med bitar för att överföra ett sampel i binär kod . För högkvalitativ musiköverföring måste antalet kvantiseringar vara minst 10 000, vilket motsvarar ett dynamiskt område på 80 dB. I detta fall krävs bitar för att sända ett sampel .
Övergången till digital överföring förbättrar kvaliteten på kommunikationen avsevärt. Men inte för ingenting. Utvärdera informationsflödet under ett telefonsamtal.
Om vi antar att ljudbandbredden är lika med 3,4 kHz som ovan och samplingsfrekvensen 6,8 kHz får vi 6800 sampel per sekund. Med 30 nivåer av kvantiseringssteg upptar varje sampel 5 bitar. Därför sänds 34 000 bitar, eller bitar av information, per sekund. Informationsöverföringshastigheten, mätt i bitar/s, kan uttryckas med formeln , där F är den maximala frekvensen för ljudspektrumet, N är antalet kvantiseringsnivåer. För att sända en digital signal med en hastighet av 34 Kbps behöver du ett frekvensband som passerar kommunikationskanalen på minst 34 kHz.
Således, när man bytte till en digital signal, var det så att säga ett utbyte av frekvensbandet för signal-brusförhållandet , men utbytet är ganska lönsamt. Genom att utöka bandbredden med 10 gånger i övergången till digital överföring, minskar vi kraftigt det tillåtna signal-brus- eller signal-brusförhållandet i kommunikationskanalen, och detta är med en övergripande betydande förbättring av överföringskvaliteten.
Låt oss avslutningsvis göra en anmärkning. För A /D- omvandlare samplas insignalen med regelbundna intervall och sedan sänds en digital "approximation". Det finns ett annat sätt att överföra information. Om till exempel insignalen är en sinusform med en frekvens f , så kan vi istället för att skicka en digital approximation helt enkelt berätta för mottagaren om parametrarna för sinusoiden och bjuda in honom att själv bygga en sådan signal. Denna princip ligger i hjärtat av enheterna, som kallas vocoders respektive lipredors . Med hjälp av sådana enheter syntetiseras digitala talsystem med en låghastighetsutgång (1,2 - 4,8 Kbps).