Informationsteori

Informationsteori  är en gren av tillämpad matematik , radioteknik ( signalbehandlingsteori ) och datavetenskap , som relaterar till mätning av mängden information , dess egenskaper och upprättande av begränsande relationer för dataöverföringssystem . Liksom alla matematiska teorier arbetar teorin med matematiska modeller och inte med verkliga fysiska objekt (källor och kommunikationskanaler ). Använder främst den matematiska apparaten sannolikhetsteorin och matematisk statistik .

Huvudgrenarna av informationsteori är källkodning ( komprimerande kodning ) och kanalkodning ( bruskorrigerande ). Informationsteori är nära relaterad till informationsentropi , kommunikationssystem, kryptografi och andra relaterade discipliner.

Fältet är i skärningspunkten mellan matematik , statistik , datavetenskap , fysik , neurovetenskap , informationsteknik och elektroteknik . Teorin har också funnit tillämpningar inom andra områden, inklusive statistisk inferens , naturlig språkbehandling , kryptografi , neurovetenskap [1] , mänsklig syn [2] , evolution [3] och funktionen [4] av molekylära koder ( bioinformatik ), statistisk modell urval [5] , termisk fysik [6] , kvantberäkning , lingvistik , plagiatdetektering [7] , mönsterigenkänning och anomalidetektering [8] . Viktiga underområden för informationsteori inkluderar datakomprimering , kanalkodning , algoritmisk komplexitetsteori , algoritmisk informationsteori , informationsteoretisk säkerhet, Grays relationsanalys och informationsmätning.

Introduktion

Uppkomsten av informationsteorin är förknippad med publiceringen av Claude Shannon av verket " Mathematical Theory of Communication " 1948 . Från Shannons synvinkel är informationsteori en gren av den matematiska teorin om kommunikation. Informationsteori sätter huvudgränserna för möjligheterna för informationsöverföringssystem, sätter de första principerna för deras utveckling och praktiska genomförande. Utbudet av problem med informationsteori presenteras med hjälp av ett blockschema, ett typiskt system för att överföra eller lagra information.

I schemat är en källa ett objekt i universum som genererar meddelanden som måste flyttas i rum och tid . Oavsett den ursprungliga fysiska naturen omvandlas vanligtvis alla meddelanden som ska sändas till formen av elektriska signaler , sådana signaler betraktas som utgången från källan. Källkodaren representerar informationen i den mest kompakta formen. Kanalkodaren bearbetar informationen för att skydda meddelanden från störningar under överföring över kommunikationskanalen eller möjliga förvrängningar under informationslagring. Modulatorn omvandlar meddelandena som genereras av kanalkodaren till signaler som överensstämmer med den fysiska naturen hos kommunikationskanalen eller informationslagringsmediet. Informationsspridningsmediet ( kommunikationskanalen ) introducerar slumpmässigt brus i informationsöverföringsprocessen, vilket förvränger meddelandet och därmed gör det svårt att läsa. Blocken på mottagningssidan utför de omvända operationerna och ger mottagaren information i en form som är lätt att förstå .

Historik

Informationsteorins födelse förknippas ofta med placeringen i juli-oktober 1948 av Claude Shannon av ett arbete i tidskriften för det amerikanska telefonbolaget Bell System under titeln "Mathematical Theory of Communication". Men det är värt att nämna att bidraget till utformningen och konstruktionen av informationsteorin också gjordes av många andra framstående vetenskapsmän. Shannon själv skrev i början av sin artikel "Några av de viktigaste bestämmelserna i denna teori finns i de viktiga verken av Nyquist och Hartley . För närvarande har teorin utökats till att omfatta ett antal nya faktorer, i synnerhet påverkan av brus i kanalen.

I grund och botten utvecklade Shannon riktningen för Hartleys arbete, med hjälp av begreppet "information", men termen i sig förklarar inte, den stipulerar bara att meddelanden kan ha någon form av "mening", det vill säga hänvisa till ett system som har sin egen fysisk eller spekulativ essens ( cybernetiskt system). Shannons teori betraktades från början som ett exakt formulerat matematiskt problem och gjorde det möjligt att bestämma genomströmningen av en bullrig kommunikationskanal.

Datakodning

Kodning är processen att överföra ett meddelande vid ingången av en kommunikationskanal till en meddelandekod vid utgången, medan informationsvärdet för meddelandet måste förbli oförändrat. I informationsteori kan följande avsnitt särskiljas:

1. Kodning av diskreta källor (förlustfri datakodningsmodell).

2. Datakodning som säkerställer deras felfria överföring över en bullrig kanal.

En kod är unikt avkodningsbar om någon sekvens av tecken från kodens alfabet (och oftast 0:or och 1:or) delas upp i separata ord. Om inget av kodorden är början på ett annat, kallas koden en prefixkod och den är unikt avkodningsbar. Därför är prefix ett tillräckligt men inte nödvändigt villkor för unik avkodbarhet. Prefixkravet begränsar uppsättningen av längder på kodord och gör det inte möjligt att välja kodord som är för korta. En nödvändig och tillräcklig förutsättning för att det ska finnas en prefixvolymkod med kodordslängder är uppfyllandet av Krafts ojämlikhet:

Det är också nödvändigt att överväga Shannon-Fano-koden  - en algoritm för prefix oenhetlig kodning. Denna kodningsmetod använder redundansen för meddelandet, som ligger i den olikformiga frekvensfördelningen av tecknen i dess alfabet, det vill säga den ersätter koderna för mer frekventa tecken med korta binära sekvenser och koderna för sällsynta tecken med längre binära sekvenser. Tänk på en källa som väljer bokstäver från en uppsättning med sannolikheter . Vi antar att bokstäverna är ordnade i fallande ordning av sannolikheter ( ). Kodordet för Shannon-koden för ett meddelande med ett nummer är en binär sekvens, som är de första siffrorna efter decimaltecknet i numrets binära notation :

3. Datakodning för system med många användare beskriver den optimala interaktionen mellan abonnenter som använder en gemensam resurs, till exempel en kommunikationskanal.

Se även

Anteckningar

  1. F. Rieke; D. Warland; R Ruyter van Steveninck; W Bialek. Spikes: Exploring the Neural Code  (obestämd tid) . - The MIT press, 1997. - ISBN 978-0262681087 .
  2. Delgado-Bonal, Alfonso; Martin-Torres, Javier. Människans syn bestäms utifrån informationsteori  // Vetenskapliga  rapporter. - 2016. - 3 november ( vol. 6 , nr 1 ). — ISSN 2045-2322 . - doi : 10.1038/srep36038 . - . Arkiverad från originalet den 24 februari 2021.
  3. jfr; Huelsenbeck, JP; Ronquist, F.; Nielsen, R.; Bollback, JP Bayesiansk slutledning av fylogeni och dess inverkan på evolutionär biologi  (engelska)  // Science : journal. - 2001. - Vol. 294 , nr. 5550 . - P. 2310-2314 . - doi : 10.1126/science.1065889 . - .
  4. Allikmets, Rando; Wasserman, Wyeth W.; Hutchinson, Amy; Smallwood, Philip; Nathans, Jeremy; Rogan, Peter K. Thomas D. Schneider , Michael Dean (1998) Organisation av ABCR-genen: analys av promotor- och splitsningsövergångssekvenser  ]  // Gene : journal. - Elsevier , 1998. - Vol. 215 , nr. 1 . - S. 111-122 . - doi : 10.1016/s0378-1119(98)00269-8 . Arkiverad från originalet den 21 augusti 2008.
  5. Burnham, KP och Anderson DR (2002) Modellurval och multimodellinferens: A Practical Information-Theoretic Approach, andra upplagan (Springer Science, New York) ISBN 978-0-387-95364-9 .
  6. Jaynes, ET Informationsteori och statistisk mekanik   // Phys . Varv.  : journal. - 1957. - Vol. 106 , nr. 4 . — S. 620 . - doi : 10.1103/physrev.106.620 . - . Arkiverad från originalet den 30 augusti 2011.
  7. Bennett, Charles H.; Li, Ming; Mamma, Bin. Chain Letters and Evolutionary Histories  (engelska)  // Scientific American . - Springer Nature , 2003. - Vol. 288 , nr. 6 . - S. 76-81 . - doi : 10.1038/scientificamerican0603-76 . — . — PMID 12764940 . Arkiverad från originalet den 7 oktober 2007.
  8. David R. Anderson. Lite bakgrund om varför personer inom de empiriska vetenskaperna kanske vill bättre förstå de informationsteoretiska metoderna (pdf) (1 november 2003). Hämtad 23 juni 2010. Arkiverad från originalet 23 juli 2011.

Litteratur

Länkar