Nätverksvetenskap är ett vetenskapligt område som studerar komplexa nätverk , såsom kommunikations- , dator- , biologiska , kognitiva och semantiska nätverk , såväl som sociala nätverk , och tar hänsyn till de olika elementen eller deltagarna i processen, representerade av noder (eller hörn ), och kopplingarna mellan element eller deltagare, representerade av länkar (eller kanter ). Detta vetenskapliga fält lånar teorier och metoder från grafteori , statistisk mekanik , datautvinning och informationsvisualisering från datavetenskap , slutledningsmodellering från statistik och social struktur från sociologi. US National Research Council definierar nätverksvetenskap som "studiet av nätverksrepresentationer av fysiska, biologiska och sociala fenomen som leder till prediktiva modeller av dessa fenomen." [ett]
Studiet av nätverk har påträffats inom olika discipliner och använde denna modell som ett sätt att analysera komplexa och sammankopplade data. Den tidigaste artikeln i detta område är den berömda artikeln om de sju Königsberg-broarna , skriven av Leonhard Euler 1736. Eulers matematiska beskrivning av hörn och kanter blev grunden för grafteorin, en gren av matematiken som studerar egenskaperna hos parvisa kopplingar i en nätverksstruktur. Grafteori utvecklade och hittade tillämpning inom kemi [2] .
Denes König , en ungersk professor i matematik, skrev den första boken om grafteori 1936, med titeln The Theory of Finite and Infinite Graphs [3] .
På 1930 -talet anlände Jacob Levi Moreno , en psykolog som arbetar i traditionen av gestaltpsykologi , till USA. Han utvecklade ett sociogram och presenterade det för allmänheten i april 1933 vid läkarstudenternas konvent. Moreno hävdade att "före uppfinningen av sociometri visste ingen exakt hur den interpersonella strukturen i en grupp såg ut" [4] . Ett sociogram var en representation av den sociala strukturen hos en grupp grundskoleelever. Pojkar var kompisar med pojkar och flickor var kompisar med andra tjejer, med bara ett undantag: en av pojkarna sa att han gillade en tjej, men känslan var inte ömsesidig. Nätverksrepresentationen av den sociala strukturen gjorde ett så starkt intryck att det skrevs om i The New York Times [5] . Sociogrammet har hittat många tillämpningar; på grundval av det har metoder för analys av sociala nätverk formulerats .
Tillämpningen av sannolikhetsteori på nätverksvetenskap utvecklades som en utlöpare av grafteorin i form av Pal Erdős och Alfred Rényis åtta berömda artiklar om slumpmässiga grafer . För sociala nätverk är den exponentiella slumpmässiga grafmodellen eller p* ett utmärkt ramverk som används för att representera utrymmet för probabilistiska kopplingar som förekommer i ett socialt nätverk . Ett alternativt tillvägagångssätt till probabilistiska nätverksstrukturer är nätverkssannolikhetsmatrisen , som modellerar sannolikheten för att kanter uppstår i ett nätverk baserat på den historiska närvaron eller frånvaron av en kant i framväxande nätverk.
1998 introducerade David Crackhard och Kathleen Carley idén om en metanet med PCANS-modellen. De föreslog att "alla organisationer är strukturerade i tre riktningar, individer, uppgifter och resurser". Deras artikel introducerade konceptet att nätverk uppstår från olika håll och därför är sammanlänkade. Detta område har vuxit till ett annat underområde av nätverksvetenskap som kallas dynamisk nätverksanalys .
På senare tid har andra vetenskapliga ansträngningar fokuserat på den matematiska beskrivningen av olika nätverkstopologier . Duncan Watts kombinerade data på nätverken med en matematisk representation som beskriver "Small World"-grafen . Albert-Laszlo Barabashi och Reka Albert utvecklade ett skalinvariant nätverk , som i allmänna termer definierar en nätverkstopologi som innehåller nodvertices (hubbar) med många anslutningar, vars antal växer, och håller ett konstant förhållande mellan antalet anslutningar i förhållande till antalet av alla noder . Även om många nätverk, såsom Internet, verkar bevara detta förhållande, har andra nätverk långa svansar av nodfördelningar som endast ungefärligen bevarar skalinvarians.
Den amerikanska militären var den första (1996) som blev intresserad av nätverkscentrerad krigföring som ett krigföringsbegrepp baserat på nätverksvetenskap. John A. Parmentola, USA :s arméchef för forskning och laboratorieledning , förklarade vid arméns styrelse för vetenskap och teknik (BAST ) den 1 december 2003 att nätverksvetenskap håller på att bli ett nytt forskningsområde inom militären. BAST, avdelningen för teknik och fysikaliska vetenskaper vid National Research Council (NRC ) vid State Academy of Sciences, har befogenhet att organisera diskussioner om vetenskapliga och tekniska pressande frågor för armén och utöva tillsyn över oberoende armérelaterade studier som utförs av vetenskapsakademin. BAST undersöker om inramning och finansiering av ett nytt fält, nätverksvetenskap, kan bidra till att minska klyftan mellan behovet av nätverkscentrerad verksamhet och det nuvarande primitiva tillståndet för grundläggande nätverkskunskap.
Som ett resultat släppte BAST 2005 ett forskningsdokument från NRC med titeln "Network Science", som definierar ett nytt kärnforskningsområde inom nätverksvetenskap för militären. Baserat på resultaten och rekommendationerna från detta arbete, och på den efterföljande NRC-rapporten från 2007 med titeln "Strategy for the Army Network Science, Technology and Experimental Centers", har stora arméforskningsresurser omdirigerats för att initiera nya stora forskningsprogram inom nätverksvetenskap. För att bygga nya teoretiska grunder för komplexa nätverk, stöds några nya nyckelpunkter inom nätverksvetenskaplig forskning riktad till armélaboratorier:
Introducerad 2004 av Frederick I. Moxley och med stöd av David S. Alberts, hjälpte försvarsdepartementet till att etablera det första nätverksvetenskapscentret med USA:s militärakademi ( USMA ) i den amerikanska armén . Under ledning av Moxley och USMA-personal skapades en tvärvetenskaplig grundutbildning i nätverksvetenskap för West Point -kadetter . För att bättre implementera grunderna för nätverksvetenskap bland framtida ledare, grundade USMA också en fem-disciplinkurs.
2006 bildade den amerikanska armén och Storbritannien (UK) International Technology Alliance ( eng. International Technology Alliance ) for Network and Information Science ( eng. the Network and Information Science ), ett gemensamt partnerskap mellan Army Research Laboratory, UK Department of Defense och en konsortiumindustri och universitet i USA och Storbritannien. Syftet med alliansen är att bedriva forskning till stöd för nätverkscentrerade verksamheter till gagn för båda nationerna.
2009 bildade den amerikanska armén Network Science Technology Cooperative Alliance , en forskningsallians mellan Army Research Laboratory , CERDEC och ett konsortium av 30 amerikanska industriforskningscentra. Målet med alliansen är att utveckla en djup förståelse för gemensamma drag för sammanflätade sociala/kognitiva, informations- och kommunikationsnätverk, och som ett resultat förbättra vår förmåga att analysera, förutsäga, designa och påverka komplexa sammanflätade nätverkssystem av många slag.
Sedan, som ett resultat av dessa ansträngningar, sponsrade det amerikanska försvarsdepartementet åtskilliga forskningsprojekt som stödde nätverksvetenskap.
Ofta har nätverk vissa attribut som kan beräknas för att analysera nätverkets egenskaper och egenskaper. Beteendet hos dessa nätverksegenskaper bestäms ofta av nätverksmodeller och kan användas för att analysera hur en modell skiljer sig från en annan. Många definitioner för andra termer som används inom nätverksvetenskap finns i artikeln Glossary of Graph Theory .
Nätverkets storlek kan förstås som antalet noder eller, mer sällan, antalet kanter , som (för anslutna grafer utan flera kanter) kan variera från (träd) till ( komplett graf ). I fallet med en enkel graf (ett nätverk där det finns högst en (oriktad) kant mellan ett par av hörn och där ingen av hörnen är ansluten till sig själv), har vi . För riktade grafer (inga loopar) . För riktade grafer med tillåtna loopar . För fallet med en graf där flera kanter mellan ett par hörn är tillåtna .
Tätheten för ett nätverk med noder definieras som förhållandet mellan antalet kanter och antalet möjliga kanter i nätverket och ges (vid enkla grafer) av binomialkoefficienten , vilket ger
En annan möjlig ekvation är där bindningarna inte är orienterade [6] [7] . Detta ger en bättre förståelse av nätverkstätheten eftersom oriktade länkar kan mätas.
Tätheten för ett nätverk utan kantkorsningar definieras som förhållandet mellan antalet kanter och det maximala antalet kanter i ett nätverk med noder utan korsande kanter , vilket ger
Graden av en nod är antalet kanter som är associerade med den. Nära relaterad till nätverkstätheten är medeldensiteten, (eller, i fallet med riktade grafer, . Faktorn 2 i föregående ekvation kommer från det faktum att varje kant i en oriktad graf bidrar till potenserna av två olika hörn). I Erdős-Rényi slumpmässiga grafmodell ( ), kan vi beräkna det förväntade värdet (lika med det förväntade värdet av en godtycklig vertex) - en slumpmässig vertex har möjliga andra hörn med en anslutningssannolikhet . Sedan .
Medellängden för den kortaste vägen beräknas genom att hitta den kortaste vägen mellan alla par av noder och beräkna medellängden över alla banor (längden är antalet kanter som finns i vägen, dvs. avståndet mellan två hörn i grafen) . Detta visar oss, i genomsnitt, antalet steg att ta från en värd till en annan. Beteendet för medellängden för den kortaste vägen som en funktion av antalet hörn i en slumpmässig nätverksmodell avgör om modellen speglar effekten av den lilla världen . Om den beter sig som , genererar modellen en modell av små världsnätverk. Med tillväxt större än den logaritmiska modellen ger inte en "liten värld". Ett speciellt fall av tillväxt är känt som ultrasmall world effect.
Som ett annat sätt att mäta nätverksgrafer kan vi definiera nätverksdiametern som den längsta beräknade kortaste vägen i nätverket. Detta är det kortaste avståndet mellan de två mest avlägsna noderna i nätverket. Med andra ord, efter att längden på den kortaste vägen från varje nod till alla andra noder har beräknats, är diametern den längsta av alla beräknade väglängder. Diametern är en representation av nätverkets linjära storlek.
Klustringskoefficienten är ett mått på egenskapen "alla mina vänner känner varandra". Detta beskrivs ibland som "min väns vänner är mina vänner". Mer exakt är klustringskoefficienten för en nod lika med förhållandet mellan de existerande länkarna som förbinder nodens grannar med varandra, till det maximala antalet sådana länkar. Klustringskoefficienten för hela nätverket är lika med genomsnittet av klustringskoefficienterna för alla noder. En hög klustringskoefficient för ett nätverk är ytterligare ett tecken på en stram värld .
Klustringskoefficienten för den -th noden är lika med
där är lika med antalet grannar till i -noden, och är lika med antalet anslutningar mellan dessa grannar. Det maximala antalet möjliga förbindelser mellan grannar är då,
Ur sannolikhetsteorinsynpunkt är den förväntade lokala klustringskoefficienten lika med sannolikheten för förekomsten av en förbindelse mellan två godtyckligt valda grannar till samma nod.
Sättet nätverket är uppkopplat på spelar en stor roll i analysen och tolkningen av nätverket. Nätverk delas in i fyra kategorier:
Centralitetspoäng genererar en rankning som försöker identifiera de viktigaste noderna i nätverksmodellen. Olika mått på centralitet kodar för olika sammanhang för ordet "viktighet". Graden av förmedling , till exempel, anser att en nod är mycket viktig om den bildar broar mellan många andra noder. Kraftfullhet , däremot, anser att en nod är mycket viktig om många andra mycket viktiga noder är associerade med den. Hundratals sådana freder har föreslagits i litteraturen.
Tecknen på centralitet är endast korrekta för att avslöja de mest centrala noderna. Dessa åtgärder är sällan, om någonsin, meningsfulla för andra noder i nätverket [8] [9] . Indikatorer är också korrekta endast när de används i sammanhang med nodviktighet och tenderar att "få fel" i andra sammanhang [10] . Föreställ dig till exempel två samhällen som endast är förbundna med en kant mellan de yngsta medlemmarna i varje gemenskap. Eftersom övergången från en gemenskap till en annan måste gå igenom denna kant kommer de två juniormedlemmarna att ha en hög grad av medling. Men eftersom de är unga (uppenbarligen) har de få kopplingar till "viktiga" noder i det egna samhället, vilket gör att deras inflytandegrad kommer att vara ganska låg.
Begreppet centralitet i samband med statiska nätverk har utvidgats baserat på empiriska och teoretiska studier till dynamisk centralitet [11] i samband med tidsberoende och transienta nätverk [12] [13] [14] .
Begränsningarna av centralitetsåtgärder har lett till utveckling av mer generella åtgärder. Två exempel är nåbarhet , som använder längdspridningen av slumpmässiga vägar för att mäta hur nåbar resten av nätverket är från en vald startnod [15] , och förväntad styrka , som är derivatan av det förväntade värdet av infektionsstyrkan genererad av noden [8] . Båda dessa mått kan på ett meningsfullt sätt endast beräknas utifrån nätverkets struktur.
Nätverksmodeller används som grund för att förstå sambanden inom empiriska komplexa nätverk. Olika modeller för slumpgenerering av grafer bildar nätverksstrukturer som kan användas i jämförelse med verkliga komplexa nätverk.
Erdős-Rényi-modellen , uppkallad efter Pal Erdős och Alfred Rényi , används för att generera slumpmässiga grafer där kanter bildas mellan noder med lika sannolikhet. Modellen kan användas i en probabilistisk metod för att bevisa förekomsten av grafer med olika egenskaper, eller för att ge en rigorös definition av vilka egenskaper som gäller för nästan alla grafer.
För att generera Erdős-Rényi-modellen måste två parametrar ges - det totala antalet noder n och sannolikheten p med vilken ett godtyckligt par av noder har en anslutningskant.
Eftersom modellen genereras utan att det påverkar vissa noder, är fördelningen av noder med antalet anslutningar binomial - för en slumpmässigt vald nod ,
I denna modell är klustringskoefficienten nästan säkert 0 . Beteende kan delas upp i tre områden.
Subkritisk : Alla komponenter är enkla och mycket små, den största komponenten är av storlek ;
Kritisk : ;
Superkritisk : var är den positiva lösningen av ekvationen .
Den största uppkopplade komponenten har hög komplexitet. Alla andra komponenter är enkla och små .
För konfigurationsmodellen väljs en sekvens av vertexgrader [16] [17] eller en fördelning av vertexgrader [18] [19] (som sedan används för att generera en sekvens av hörn) som indata och en slumpmässigt kopplad graf är skapad med bevarande av alla vertexgrader i sekvensen. Detta innebär att för ett givet val av gradsekvens väljs grafen enhetligt från uppsättningen av alla grafer som har en sådan sekvens av vertexgrader. Graden av en slumpmässigt vald vertex är en oberoende och jämnt fördelad slumpvariabel med heltalsvärden. När konfigurationsdiagrammet innehåller en gigantisk ansluten komponent , som har en obegränsad storlek [17] . Resten av komponenterna har ändliga storlekar som kan kvantifieras med hjälp av en storleksfördelning. Sannolikheten att en slumpmässigt vald nod är associerad med en storlekskomponent ges av graden av faltning av gradfördelningen [20]
w ( n ) = { E [ k ] n − ett u ett ∗ n ( n − 2 ) , n > ett , u ( 0 ) n = ett , {\displaystyle w(n)={\begin{cases}{\frac {\mathbb {E} [k]}{n-1}}u_{1}^{*n}(n-2),&n> 1,\\u(0)&n=1,\end{cases}}}där betyder fördelningen av noder med antalet länkar och . En gigantisk komponent kan förstöras genom att slumpmässigt ta bort en kritisk del av alla hörn. Denna process kallas perkolation (läckage) på slumpmässiga nätverk . Om det andra momentet av fördelningsgraden är finit, det vill säga , ges denna kritiska kantfraktion av likheten [21]
och det genomsnittliga avståndet mellan hörn i den gigantiska komponenten är logaritmiskt proportionell mot den totala storleken på nätverket [18] .
I den orienterade konfigurationsmodellen ges graden av en nod av två tal, ingångssemidegree och output semidegree , och följaktligen kommer fördelningarna av vertexgrader att vara bivarianta. Det förväntade antalet inkommande och utgående kanter är detsamma, så . En orienterad konfigurationsmodell innehåller en gigantisk komponent om och endast om [22]
2 E [ k i ] E [ k i k ut ] − E [ k i ] E [ k ut 2 ] − E [ k i ] E [ k i 2 ] + E [ k i 2 ] E [ k ut 2 ] − E [ k i k ut ] 2 > 0. {\displaystyle 2\mathbb {E} [k_{\text{i}}]\mathbb {E} [k_{\text{in}}k_{\text{out}}]-\mathbb {E} [k_ {\text{i}}]\mathbb {E} [k_{\text{ut}}^{2}]-\mathbb {E} [k_{\text{i}}]\mathbb {E} [k_ {\text{in}}^{2}]+\mathbb {E} [k_{\text{in}}^{2}]\mathbb {E} [k_{\text{out}}^{2} ]-\mathbb {E} [k_{\text{in}}k_{\text{out}}]^{2}>0.}Observera att och är lika, och därför är utbytbara i den sista olikheten. Sannolikheten att en slumpmässigt vald vertex tillhör en storlekskomponent ges av formeln [23]
h i ( n ) = E [ k i n ] n − ett u ~ i ∗ n ( n − 2 ) , n > ett , u ~ i = k i + ett E [ k i ] ∑ k ut ≥ 0 u ( k i + ett , k ut ) , {\displaystyle h_{\text{i}}(n)={\frac {\mathbb {E} [k_{in}]}{n-1}}{\tilde {u}}_{\text{in }}^{*n}(n-2),\;n>1,\;{\tilde {u}}_{\text{i}}={\frac {k_{\text{i}}+ 1}{\mathbb {E} [k_{\text{i}]}}\summa \limits _{k_{\text{out}}\geq 0}u(k_{\text{in}}+1 ,k_{\text{ut)))}för inkommande komponenter, och
för utgående komponenter.
Watts-Strogatz-modellen är en slumpmässig grafgenereringsmodell som producerar grafer med "small world"-egenskaper .
För att generera Watts-Strogatz-modellen används den initiala gitterstrukturen. Varje nod i nätverket är initialt associerad med sina närmaste grannar. En annan parameter anger sannolikheten för omkoppling. Varje kant har en sannolikhet att den kommer att kopplas om till grafen som en slumpmässig kant. Det förväntade antalet omkopplade anslutningar i modellen är .
Eftersom Watts-Strogatz-modellen börjar som en icke-slumpmässig gitterstruktur, har den en mycket hög klustringsfaktor tillsammans med en hög genomsnittlig väglängd. Varje omkoppling kommer sannolikt att skapa en genväg mellan starkt anslutna kluster. När sannolikheten för omkoppling ökar, minskar klustringskoefficienten långsammare än den genomsnittliga väglängden. Som ett resultat tillåter detta att den genomsnittliga nätverksväglängden minskar avsevärt med en liten minskning av klustringskoefficienten. Höga värden på p resulterar i mer kantledning, vilket gör Watts-Strogatz-modellen till ett slumpmässigt nätverk som ett resultat.
Barabasi-Albert- modellen är en slumpmässig nätverksmodell som används för att demonstrera preferensbifogningar eller effekten av de rika blir rikare. I denna modell är det mest sannolikt att en kant kopplas till noder med de högsta graderna. Nätverket börjar med ett nätverk med m 0 noder, där , och graden av varje nod i det initiala nätverket måste vara minst 1, annars kommer noden för alltid att förbli frånkopplad från resten av nätverket.
I Barabasi-Albert-modellen läggs nya noder till i nätverket en i taget. Varje ny nod ansluter till befintliga noder med en sannolikhet som är proportionell mot antalet redan existerande noder. Formellt är sannolikheten att en ny nod kopplas till nod i [24]
där k i är graden av nod i . De mest anslutna noderna ("hubbar") tenderar att snabbt ackumulera ännu fler anslutningar, medan noder med färre anslutningar sannolikt inte kommer att väljas som en ny anslutning. Nya noder har "fördelen" att ansluta sig till de redan starkast anslutna noderna.
Fördelningen av noder med antalet länkar som erhålls från BA-modellen är skalinvariant , i synnerhet är det en maktlag av formen
Hub visar en hög grad av medling, vilket tillåter korta vägar mellan noder. Som ett resultat tenderar BA-modellen att ha mycket korta genomsnittliga väglängder. Klusteringskoefficienten för denna modell tenderar också till 0. Medan diametern D för många modeller, inklusive Erdős-Rényi slumpmässiga grafmodell och vissa tight-world- nätverk , är proportionell mot log N, visar BA-modellen D~loglogN (ultra- stram värld) [26] .
Mellanliggande bilaga modellI den medlingsdrivna anknytningsmodellen ( medlingsdriven attachment , MDA) kommer en ny nod med kanter , för vilka en befintlig ansluten nod väljs slumpmässigt och den nya noden är ansluten inte bara till denna slumpmässigt valda nod, utan även till sina grannar, också slumpmässigt utvalda. Sannolikheten att en grannod till en befintlig nod väljs är
Multiplikatorn är lika med det reciproka av det harmoniska medelvärdet (OSG) av styrkorna för nodens grannar . En omfattande numerisk studie tyder på att medelvärdet av GRG i stort tenderar att vara en konstant, vilket betyder att . Det följer att ju fler anslutningar (grad) en nod har, desto större är chansen att få fler anslutningar, eftersom de kan erhållas på ett stort antal sätt genom mellanhänder, vilket i huvudsak förkroppsligar den intuitiva idén om "de rika blir rikare " (eller regeln om företrädesrättsliga anknytning Barabashi-Albert-modeller). Därför lyder MDA-nätverk, som man kan förstå, PA-regeln, men i en implicit form [27] .
Men när vi får mekanismen "vinnaren tar allt", eftersom nästan det totala antalet noder har en grad av en, och en nod blir superrik. När värdet ökar, minskar disproportionen mellan de superrika och de fattiga, och vid , observerar vi en övergång från mekanismen "rik blir superrik" till mekanismen "rik blir rikare".
En annan modell, där hörnets natur är nyckelingrediensen, föreslogs av Caldarelli et al [28] . Här skapas en länk mellan två hörn med en sannolikhet som ges av länkfunktionen i mappningsmodellen [ av de inblandade hörnen. Graden av ett vertex i ges av formeln [29]
Om är en reversibel ökande funktion av , då ges sannolikhetsfördelningen av formeln
Som ett resultat, om korrespondensen fördelas enligt en maktlag, så är det också graderna av noder.
Mindre uppenbart med en snabbt minskande sannolikhetsfördelning tillsammans med en länkfunktion av formuläret
med en konstant och en Heaviside funktion att vi får skalinvarianta nätverk.
En sådan modell har framgångsrikt använts för att beskriva handel mellan nationer med BNP som ett passande mått för olika noder och en länkfunktion av formen [30] [31]
Social nätverksanalys utforskar strukturen av relationer mellan sociala aktörer [6] . Dessa enheter är ofta människor, men kan också vara grupper , organisationer , nationalstater , webbplatser , vetenskapliga publikationer .
Sedan 1970-talet har den empiriska studien av nätverk spelat en central roll inom samhällsvetenskapen och många av de matematiska och statistiska verktyg som används för att studera nätverk har utvecklats inom sociologin [32] . Bland många andra applikationer används sociala nätverksanalyser för att förstå spridningen av innovation , nyheter och rykten. Likaså kan den användas för att studera både spridning av sjukdomar och hälsorelaterat beteende . Det har också tillämpats på marknadsundersökningar , där det har använts för att testa tillitens roll i varu-pengarrelationer och sociala mekanismer i prisbildningen. På liknande sätt har det använts för att studera engagemang i politiska rörelser och sociala organisationer. Det har också använts för att förstå vetenskapliga kontroverser och akademiskt rykte. Nyligen har nätverksanalys (och dess närmaste släkting, trafikanalys ) använts flitigt inom militär intelligens för att avslöja sociala nätverk av motstånd som är både hierarkiska och ledarlösa till sin natur [33] [34] .
Dynamisk nätverksanalys utforskar förändringen i strukturen av kopplingar mellan olika klasser av objekt i komplexa sociotekniska system och speglar social stabilitet och förändringar, såsom uppkomsten av nya grupper, diskussioner och ledare [11] [12] [ 13] [14] [35] . Dynamisk nätverksanalys fokuserar på metanätverk som består av noder av många olika slag (objekt) och flera typer av länkar . Dessa föremål kan variera kraftigt [11] . Exempel inkluderar människor, organisationer, teman, resurser, uppgifter, händelser, platser och övertygelser.
Dynamiska nätverkstekniker är särskilt användbara för att utvärdera trender i ett nätverk över tid, identifiera nya ledare och utforska samutvecklingen av människor och idéer.
Med den senaste explosionen av offentligt tillgängliga biologiska data har analysen av molekylära nätverk fått stort intresse. Analys under dessa förhållanden är nära relaterat till sociala nätverksanalyser, men fokuserar ofta på lokala mönster i nätverket. Nätverksmotiv är till exempel små subgrafer som är överrepresenterade i nätverket. Aktivitetsmotiv är som överrepresenterade mönster i egenskaperna hos noder och kanter i ett nätverk som är överrepresenterade i nätverksstrukturen. Analysen av biologiska nätverk har lett till utvecklingen av nätverksmedicin , som tar hänsyn till effekten av sjukdomar i interaktomen [36] .
Länkanalys är en delmängd av nätverksanalys som undersöker associationer mellan objekt. Ett exempel skulle vara att titta på adresserna till misstänkta och offer, telefonnummer de ringde, de finansiella transaktioner de var inblandade i under den aktuella tidsperioden och förhållandet mellan dessa enheter som en del av en polisutredning. Länkanalys ger här kritiska relationer och associationer mellan ett mycket stort antal objekt av olika slag som inte är uppenbara när man betraktar informationsbitar isolerat. Automatiserad länkanalys utnyttjas i allt högre grad av banker och försäkringsbyråer för att upptäcka bedrägerier , telekomoperatörer för att analysera kommunikationsnätverk, medicinska forskare inom epidemiologi och farmakologi , brottsbekämpande myndigheter för utredningar , sökmotorer för betygsrelevans ( och vice versa, av spammare för spamdexning och företagsägare ), för sökmotoroptimering ), såväl som överallt där relationer mellan ett stort antal objekt analyseras.
NätverksförmågaStrukturell stabilitet hos nätverk [37] studeras med hjälp av perkolationsteori . När en kritisk andel av noder tas bort från nätverket delas nätverket upp i små kluster. Detta fenomen kallas perkolation [38] och representerar en typ av "order-störning" fasövergång med ett kritiskt index .
PandemianalysSIR-modellen inom epidemiologi är en av de mest välkända algoritmerna för att förutsäga spridningen av globala pandemier i en infekterad befolkning.
Från ett tillstånd av mottaglighet till infektionFormeln ovan beskriver infektionens "styrka" för varje mottaglig enhet i en infekterad population, där den är ekvivalent med sjukdomens spridningshastighet.
Så här spårar du förändringar i denna mottagliga enhet i en infekterad population:
Från infektion till återhämtningÖver tid beror antalet sådana infektioner på målhastigheten för återhämtning, representerad av antalet , men över den genomsnittliga infektionsperioden , på antalet infekterade individer och på antalet förändringar över tiden .
Smittsam periodHuruvida en befolkning påverkas av en pandemi, ur SIR-modellens synvinkel, beror på värdet eller "genomsnittligt antal infekterade personer från andra människor."
WeblänkanalysFlera sökmotorrankningsalgoritmer använder länkbaserade mått på centralitet, inklusive (i uppträdandeordning) Marchioris Hyper Search , Googles PageRank , Kleinbergs HITS , Länkanalys kan utföras i informationsteori för att förstå och extrahera information från en uppsättning webbsidor. Det kan till exempel vara en analys av länkar mellan hemsidor eller politikers bloggar.
PageRankPageRank fungerar genom att slumpmässigt välja en "webbplats" eller internetsajt och "slumpmässigt hoppa" till andra webbplatser med viss sannolikhet. Slumpmässiga träffar på dessa andra noder tillåter PageRank-uppskattningen att helt kringgå nätverket, eftersom vissa sidor ligger i nätverkets periferi och inte enkelt kan bedömas.
Varje nod har en PageRank, definierad som summan, för sidor, av det reciproka antalet sidor som är associerade med noden genom utgående bågar, eller nodens "outcome semidegree" gånger nodens "viktighet " eller PageRank .
Slumpmässiga övergångarSom förklarats ovan utför PageRank slumpmässiga övergångar i ett försök att tilldela en PageRank till varje sida på Internet. Dessa slumpmässiga navigeringar hittar webbplatser som inte kan hittas som ett resultat av vanliga sökmetoder som bredd - först-sökning och djup -först-sökning .
En förbättring av ovanstående formel för att bestämma PageRank inkluderar komponenterna i dessa slumpmässiga övergångar. Utan slumpmässiga övergångar kommer vissa sidor att få PageRank lika med 0, vilket inte är bra.
Den första komponenten är , eller sannolikheten att en slumpmässig övergång inträffar. Motsatsen är "dämpningsfaktor", eller .
En annan vinkel på detta:
Information om den relativa betydelsen av noder och kanter i grafer kan erhållas genom centralitetsmått , som ofta används inom discipliner som sociologi . Centralitetsåtgärder behövs när nätverksanalys inte svarar på frågor som: "Vilka noder i nätverket ska användas för att säkerställa att ett meddelande eller information sprids till alla eller de flesta noder i nätverket?" eller, omvänt, "Vilka noder bör påverkas för att stoppa spridningen av sjukdomen?". De formellt definierade måtten på centralitet är graden av anknytning , graden av närhet , graden av förmedling , graden av inflytande och Katz centralitet . Målet med nätverksanalys bestämmer vanligtvis vilken typ av centralitetsmått som används [6] .
Innehåll i ett komplext nätverk kan distribueras på två huvudsakliga sätt: beständig distribution och icke-beständig distribution [40] . Med beständig distribution förblir den totala mängden innehåll som kommer in i komplexa nätverk konstant när det passerar genom nätverket. Den bestående distributionsmodellen kan bäst representeras av en burk som innehåller en viss mängd vatten, som hälls i en serie avlopp som är förbundna med rör. Här representerar kannan källan och vattnet representerar innehållet som ska distribueras. Tankar och anslutningsrör representerar noder respektive nodanslutningar. När vatten passerar från en behållare till en annan försvinner vattnet från källbehållaren. I icke-beständig distribution ändras mängden innehåll när det passerar genom komplexa nätverk. Den icke-konserverande förökningsmodellen representeras bäst av en kontinuerlig ström från en kran som sprids över avlopp som är förbundna med rör. Här är mängden vatten från den ursprungliga källan inte begränsad. Dessutom fortsätter alla avlopp som vatten har nått att ta emot vatten, även om det går till andra avlopp. Icke-konserverade modeller är mest lämpade för att förklara överföringen av de flesta infektioner .
1927 skapade W. O. Kermack och A. G. McKendrick en modell där de betraktar en fast population med endast tre tillstånd - mottagliga, , infekterade, och botade, . De kategorier som används i denna modell består av tre klasser:
Flödet av denna modell kan ses på följande sätt:
Med hjälp av en fast population härledde Kermack och McKendrick följande ekvationer:
Vissa antaganden gjordes för att formulera dessa ekvationer. För den första ekvationen måste en enskild medlem av befolkningen anses ha samma sannolikhet för infektion som vilken annan medlem som helst, med en hastighet på , vilket anses vara den hastighet med vilken infektionen eller sjukdomen sprids. Därför, när en infekterad representant kommer i kontakt och kan överföra sjukdomen till andra representanter per tidsenhet, är andelen kontakter av infekterade representanter med mottagliga lika med . Antalet nya infektioner per tidsenhet per smittad person är då lika med , vilket sätter antalet nya infektioner s (eller de som lämnar den mottagliga kategorin) till [41] . För den andra och tredje ekvationen antas det att populationen lämnar den mottagliga klassen i samma takt som den går in i den infekterade klassen. Antalet är dock lika med andelen ( representerar den genomsnittliga återhämtningsgraden och representerar den genomsnittliga sjukdomstiden) av smittade personer som lämnar denna klass per tidsenhet och flyttar in i klassen tillfrisknade. Dessa samtidiga processer hänvisas till som massaktionens lag , den allmänt accepterade idén att kontakthastigheten mellan två grupper i en befolkning är proportionell mot storleken på var och en av de två grupperna i fråga [42] . Slutligen antas det att infektions- och återhämtningshastigheten är mycket större än födelse och död, och därför tas inte hänsyn till dessa faktorer i modellen.
Du kan läsa mer om denna modell på sidan Epidemic Model .
Huvudekvationen kan uttrycka beteendet hos ett oriktat växande nätverk, i vilket vid varje steg en ny nod läggs till kopplad till en gammal nod (slumpmässigt vald och utan preferenser). Det initiala nätverket består av två noder och två anslutningar mellan dem vid tillfället . En sådan konfiguration är bara nödvändig för att förenkla ytterligare beräkningar, så att nätverket vid den tidpunkten har noder och länkar.
Den huvudsakliga kinetiska ekvationen för detta nätverk
där är sannolikheten att ha en nod med grad vid tidpunkten , och är den tidpunkt då noden lades till nätverket. Observera att det bara finns två sätt för den gamla noden att ha anslutningar åt gången :
Efter att ha förenklat denna modell kommer fördelningen av noder med antalet länkar att vara lika med [43] .
Baserat på detta växande nätverk utvecklas epidemimodellen enligt följande enkla regel: Varje gång en ny nod läggs till, och efter att ha valt vilken nod som ska anslutas till, avgörs om denna nod ska infekteras eller inte. Den grundläggande ekvationen för denna epidemimodell är
där definierar infektion ( ) eller frånvaro av infektion ( ). Efter att ha löst denna grundläggande ekvation får vi följande lösning: [44] .
Ett ömsesidigt beroende nätverk är ett system av sammankopplade nätverk där noderna i ett eller flera nätverk är beroende av noderna i andra nätverk. Sådana beroenden förlängs av utvecklingen inom modern teknik. Beroenden kan orsaka kaskadskador mellan nätverk och relativt små skador kan leda till katastrofala systemfel. Strömavbrott är en förtjusande demonstration av betydelsen av den roll som nätanslutningar spelar. Nyligen har konceptet att studera kaskadstörningar i ett system av ömsesidigt beroende nätverk utvecklats [45] [46] .
Flerskiktsnätverk är nätverk med flera typer av länkar [47] [48] [49] [50] [51] [52] . Allt mer sofistikerade försök att modellera verkliga system i takt med att multipla anslutna nätverk har gett värdefull kunskap inom analys av sociala nätverk [48] [49] [53] [54] [55] [56] , ekonomi, historia [57] , urban och internationell transport [58 ] [59] [60] [61] , ekologi [62] [63] [64] [65] , psykologi [66] , medicin, biologi [67] , handel, klimatologi, fysik [68] [69] , neuroinformatik [70] [71] [72] Finansiell verksamhetsledning.
Nätverksproblem som använder sökningen efter den optimala vägen för alla ändamål studeras under namnet kombinatorisk optimering . Exempel inkluderar nätverksflöden , kortaste vägproblem , transportproblem , transportproblem objektplaceringsproblem , matchningsproblem , tilldelningsproblem , packningsproblem , routingproblem , kritisk vägmetod och PERT -projekt ( Evaluation and Analysis Method).