Social graf

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 4 januari 2021; kontroller kräver 2 redigeringar .

En social graf är en graf vars noder representeras av sociala objekt, såsom användarprofiler med olika attribut (till exempel: namn, födelsedag, hemstad), gemenskaper , mediainnehåll och så vidare, och kanterna är sociala länkar mellan dem [ 1] [2] .

En implicit social graf är en graf som kan genereras (härledas, beräknas) baserat på användarinteraktioner med deras "vänner" och grupper av "vänner" i ett socialt nätverk. I denna graf, till skillnad från den vanliga sociala grafen, finns det ingen explicit indikation på "vänner", det vill säga det finns inga uppenbara sociala kopplingar [3] .

Funktioner i en social graf kännetecknas av sådana mått som: relationsmått , anslutningsmått och segmenteringsmått . För att lösa problem på en social graf används speciella modeller som kan användas för att ersätta "riktiga" grafer . Med hjälp av sociala grafer löser de sådana problem som: användaridentifiering ; social sökning ; generering av rekommendationer om val av "vänner", mediainnehåll, nyheter och liknande ; avslöja "riktiga" samband eller samla in öppen information för grafmodellering. Bearbetningen av sociala grafdata är förknippad med ett antal problem , såsom skillnader i sociala nätverk , närhet till sociala data .

Mätvärden

I uppgifter på en social graf används begreppet mått - indikatorer som numeriskt visar egenskaperna hos sociala objekt, segment, grupper av objekt och deras relationer. Dessa mätvärden används vid analys av sociala nätverk .

Relationer

Relationsmått återspeglar karaktären av förhållandet mellan ett socialt objekt och andra sociala objekt.

Homofili [4] är i vilken utsträckning en användare bildar kopplingar till liknande personer. Likhet kan bestämmas av kön, ålder, social status, utbildningsnivå och så vidare [5] .

Multiplicity - antalet "flera" relationer där användare är [6] . Till exempel kommer två användare som är vänner och arbetar tillsammans att ha en "mångfald" på 2 [7] . "Multiple" förknippas med "anslutningens styrka".

Ömsesidighet - graden i vilken användare interagerar med varandra, återger varandras handlingar [8] . Nätverksintegritet är i vilken utsträckning en användares vänner är vänner med varandra. Det kallas också "ett mått på fullständigheten av relationstriader ". Antagandet att användaren är i nätverksstängning kallas transitivitet . [9] . Grannskap - användarnas tendens att ha ett stort antal kontakter med geografiskt nära användare [8] .

Länkar

Länkmått återspeglar egenskaperna hos länkar, både för enskilda sociala objekt och för grafen som helhet.

En brygga är en användare vars svaga länkar fyller "strukturella hål", vilket ger en enda anslutning mellan andra användare eller kluster (grupper av användare). Dessutom kommer den kortaste rutten att passera genom den [10] .

Centralitet - en grad som visar "viktigheten" eller "inflytandet" av en viss användare (kluster av användare) i grafen [11] [12] . Standardmetoderna för att mäta centralitet är mediationscentralitet , proximity centrality , egenvektorcentralitet , alfacentralitet och gradcentralitet [13] .

Densitet är andelen direktanslutningar i nätet i förhållande till det totala antalet möjliga [14] [15] . Avstånd är det minsta antal länkar som krävs för att upprätta en relation mellan två distinkta användare. Strukturella hål är bristen på anslutningar mellan två delar av nätverket.

Förbindelsens styrka bestäms av en linjär kombination av tid, närhet och ömsesidighet [10] , ju större värdet på styrkan i sambandet är, desto starkare är den. Starka band definieras av "homofili", "angränsning" eller "transitivitet", medan svaga band definieras av "broar".

Segmentering

Segmenteringsmått återspeglar egenskaperna hos en social graf uppdelad i segment som har utmärkande egenskaper.

En klick är en grupp där alla användare har "direkta" kopplingar (hörn är anslutna (anslutna) med en kant) till varandra [16] . En umgängeskrets är en grupp där "direkta" kopplingar mellan användare inte krävs [17] .

Klustringskoefficienten är graden av sannolikhet att två olika användare associerade med en viss individ också är associerade. En hög klustringskoefficient indikerar en hög gruppslutning, med andra ord kan gruppen vara en "klick".

Sammanhållning är den grad i vilken användare är sammanlänkade genom ett gemensamt band, vilket bildar social sammanhållning . Strukturell sammanhållning - indikerar en sådan enskild struktur i gruppen att avlägsnandet av ett litet antal användare leder till ett avbrott i gruppen [16] .

Modeller

Vissa välkända grafmodeller kan ersätta "riktiga" sociala grafer [18] .

Funktionellt drivna modeller syftar till att reproducera de statistiska egenskaperna hos en graf, såsom kraftlagsfördelning och dynamiska förändringar i grafdensitet, såsom Barabasi-Albert- modellen och den brinnande skogsmodellen .

Avsiktligt kontrollerade modeller är fokuserade på att emulera processen att skapa den ursprungliga grafen, denna klass av modeller inkluderar slumpmässig genomgång och slumpmässiga promenader, den närmaste grannmodellen.

Strukturdrivna modeller fångar statistiska data från strukturen av en graf, vilket gör att motsvarande generator kan reproducera slumpmässiga grafer med samma strukturella begränsningar, sådana modeller inkluderar Kronecker-grafer , dK-grafer .

Uppgifter

Användaridentifiering - upptäckt av profiler som tillhör en person i flera sociala nätverk [19] . Genom att lösa detta problem kan en mer komplett social graf erhållas, vilket kan vara användbart i många uppgifter som social sökning och rekommendationsgenerering .

Sök efter sociala objekt (användare, deras data, deras register och så vidare), baserat på analysen av en uppsättning länkar som innehåller de önskade objekten [20] .

En viktig uppgift är att hitta korrekta algoritmer för att generera rekommendationer och erbjudanden till användare, vilket också används för att skapa en intressegraf baserad på en social graf. Det kan vara rekommendationer från vänner (användare delar sällan in sina kontakter i sociala grupper, men ändå delar de implicit in dessa kontakter i kluster genom sina interaktioner inom det sociala nätverket [21] ), innehållsrekommendationer (rekommendationer av medieinnehåll, gemenskaper, nyheter, etc.) .) vidare [22] [ specificera länk ] ). Det finns traditionella tillvägagångssätt i rekommendatorsystem [23] [ specificera länk ] :

kollaborativ filtrering [24] - består i bildandet av en lista med rekommenderade objekt baserat på åsikter från användare som beter sig på ett liknande sätt;
innehållsfiltrering - baserat på ämnets egenskaper och information som är känd om det.
sociala förhållningssätt - utgå från användarnas sociala kopplingar.

En separat utmaning är att tillämpa " open source intelligence "-metoden för att identifiera verkliga kopplingar mellan användare, dvs riktiga vänner, släktingar och så vidare [25] .

Samla information

Konstruktion av en social graf baserad på data som erhållits som ett resultat av att analysera webbtjänster från leverantörer av sociala nätverk.

Följande kriterier är satta för att utvärdera uppgiften [26] :

effektivitet: hur snabbt noder och länkar upptäcks som ett resultat av skanning,
känslighet: hur olika sociala nätverk och antalet skyddade och slutna användare ("svart hål") påverkar genomsökning,
avvikelse: hur mycket de statistiska egenskaperna för subgraferna som erhålls under genomgången skiljer sig från egenskaperna hos den ursprungliga grafen.

Valet av noder spelar en viktig roll vid traversering: noder är startpunkten för genomgången, det är viktigt att välja rätt noder och korsningsköordning för att undvika dålig sidkvalitet. Nodvalsalgoritmer bestämmer vilken nod som ska väljas härnäst, bland de algoritmer som används är bredd-först sökning , en grupp giriga algoritmer .

På grund av närheten till sociala data kan du hoppa över det mesta av den sociala grafen, olika bypass-algoritmer påverkar sådana användare på olika sätt. Dessutom har olika sociala nätverk olika unika egenskaper, även om de tillhandahåller liknande tjänster, vilket också försvårar uppgiften att samla in information.

Problem

För problemet med användaridentifiering är det största problemet skillnaderna i sociala nätverk. Semantiken för relationer mellan sociala objekt och sociala grafer för olika topologier [27] [ specificera länk ] spelar huvudsakligen en roll .

Huvudproblemet med att generera rekommendationer är problemet med kallstart - beräkning av rekommendationer för nya sociala objekt (användare, inlägg, mediainnehåll och så vidare) [28] [ specificera länk ] .

Det största problemet med att samla in data för den sociala grafen är närheten till sociala nätverk [29] . För det första är det svårt att få en social graf från "leverantörer" [30] på grund av sociala datas värde och rättsliga skydd . För det andra är den stora svårigheten insamlingen av miljontals kontaktlistor, profiler, foton, videor och liknande innehåll av skrapor . Många "leverantörer" av sociala medier använder en enkelsidesmodell eller många dynamiska sidor som innehåller Ajax och DHTML , vilket också skapar en hel del problem för att skapa en flexibel parser.

Anteckningar

↑ Uppgiften att identifiera användare i sociala nätverk, 2012 , s. 3.
↑ Social search, 2010 , s. 199.
↑ Föreslå vänner, 2010 , s. 2.
↑ The concept of homophilia, 2012 , s. 168-169.
↑ Homophilia, 2001 , s. 415-444.
↑ Plurality, 1997 , s. 673-693.
↑ Ett exempel på pluralitet, 2003 .
↑ 1 2 Understanding Social Graphs, 2012 .
↑ Transitivity, 2010 , s. 855-869.
↑ 1 2 The power of connections, 1973 , s. 1360-1380.
↑ Centrality, 2010 , sid. 32.
↑ Metrics for Basic Network Analysis, 2011 , pp. 364-367.
↑ Vertex centrality, 2010 , s. 245.
↑ Analys av sociala nätverk, 2006 , s. B-11-B-12.
↑ Sociala nätverk: tekniker och tillämpningar, 2010 , s. 25.
↑ 1 2 Klicka i analysen av sociala nätverk, 2011 , s. 149.
↑ Metrics for Basic Network Analysis, 2011 , pp. 346-347.
↑ 1 2 Social Graph Models, 2010 , s. 3-4.
↑ Uppgiften att identifiera användare i sociala nätverk, 2012 , s. 2-4.
↑ Social search, 2010 , s. 431.
↑ Föreslå vänner, 2010 , s. 2-7.
↑ Spåra rekommendationer på sociala nätverk, 2012 , sid. 34.
↑ Approaches to recommendations, 2012 , s. 8-13.
↑ Rekommendationssystem baserade på kollaborativ filtrering, 2002 , sid. 187.
↑ OSINT, 2012 , s. 21-39.
↑ Crawling OSN, 2010 , s. 1-7.
↑ Problems of the user identification task, 2012 , s. 13-17.
↑ Kallstartsproblem, 2012 , s. 5-11.
↑ Crawling OSN, 2010 , s. ett.
↑ Crawling OSN, 2010 , s. 3.

Litteratur

M. Granovetter . Styrkan i svaga band (engelska) . — American Journal of Sociology, 1973.
Melville P., Mooney R., Nagarajan R. Content-Boosted Collaborative Filtering for Improved Recommendations // University of Texas, USA: Proceedings of Conf. / AAAI-02, Austin, TX, USA, 2002. - 2002. - P. 187-192 .
JM Podolny, JN Baron. Resurser och relationer: Sociala nätverk och mobilitet på arbetsplatsen (engelska) . - American Sociological Review, 1997. (otillgänglig länk)
N. McPherson, L. Smith-Lovin, J.M. Cook. Fåglar av en fjäder: Homofili i sociala nätverk (engelska) . — Annual Review, Annual Review of Sociology, 2001.
M. Kilduff, W. Tsai. Sociala nätverk och organisationer (engelska) . - Sage Publications, 2003. - S. 172 .
C. Kadushin. Analys av sociala nätverk . - Högkvarter, Department of the Army, Washington, DC, 2006. - ISBN 978-1-84787-395-8 .
A.-K. Pietiläinen, E. Oliver, J. LeBrun. MobiClique: Mellanprogram för mobila sociala nätverk . — WOSN'09, 17 augusti 2009, Barcelona, Spanien, 2009. (länk ej tillgänglig)
Xu, Guandong et al. Web Mining och sociala nätverk: Tekniker och applikationer . - Springer, 2010. - ISBN 978-1-4419-7734-2 .

D. Hansen, B. Shneiderman, M. A. Smith. Analysera sociala medienätverk med NodeXL . - Morgan Kaufmann, 2010. - S. 283. - ISBN 978-0-12-382229-1 .

Shaozhi Ye, Juan Lang, Felix Wu. Genomsöka sociala grafer online . — APWEB'12, 6-8 april 2010, Busan, Korea, 2010. (länk ej tillgänglig)

C. McCarthy. Facebook: en social graf som styr dem alla? (engelska) . — CBS Interactive Inc., 2010.
T. Opsahl, F. Agneessens, J. Skvoretz. Nodens centralitet i viktade nätverk: Generalisering av grad och kortaste vägar . - Sociala nätverk, 2010. Arkiverad från originalet den 26 februari 2018.

M. Roth, A. Ben-David, D. Deutscher. Föreslå vänner med hjälp av den implicita sociala grafen . — KDD'10, 25–28 juli 2010, Washington, DC, USA, 2010. (länk ej tillgänglig)

A. Sala, L. Cao, C. Wilson, R. Zablit, H. Zheng, AV Zhao. Mätkalibrerade grafmodeller för sociala nätverksexperiment . — WWW 2010, 26–30 april 2010, Raleigh, North Carolina, USA, 2010.

D. Horowitz, Sepandar D. Kamvar. Anatomin hos en storskalig social sökmotor . — WWW 2010, 26–30 april 2010, Raleigh, North Carolina, USA., 2010.
FJ Flynn, RE Reagans, L. Guillory. Känner ni två varandra? Transitivitet, homofili och behovet av (nätverks)stängning. (engelska) . - Journal of Personality and Social Psychology, 2010. Arkiverad från originalet den 4 mars 2016.
J. Ugander, B. Karrer, L. Backström, C. Marlow. Anatomin i Facebook Social Graph . — Cornell University Library, 2011.
Min T. Thai, Panos M. Pardalos. Handbok för optimering i komplexa nätverk: kommunikation och sociala nätverk . - Springer, 2011. - P. 541. - ISBN 978-1-4614-0856-7 .
PJ Carrington, J. Scott. The Sage Handbook of Social Network Analysis . - SAGE, 2011. - S. 640. - ISBN 978-1-84787-395-8 .

D. Schioberg, F. Schneider, H. Schioberg, S. Schmid, S. Uhlig, Anja Feldmann. Spåra födelsen av ett OSN: Graf- och profilanalys i Google+ . — WebSci 2012, 22–24 juni 2012, Evanston, Illinois, USA, 2012.
MP Zilman. Sociala nätverk online . — Virtuellt privat bibliotek, 2012.
BR Holland. Aktivera Open Source Intelligence (OSINT) i privata sociala nätverk (engelska) : Masters's dessertation. - Iowa State University, Ames, Iowa, 2012. (inte tillgänglig länk)
C. Kadushin. Förstå sociala nätverk: Teorier, begrepp och rön . - Oxford: Oxford University Press, 2012. - S. 288.
V. M. SAZANOV Sociala nätverk som en ny offentlig sfär. Systemanalys och prognos. . - M. : SVM Laboratory, 2010. - S. 180.
S. Bartunov, A. Korsjunov. Identifiering av användare av sociala nätverk på Internet baserat på sociala anslutningar . - Institute for System Programming of the Russian Academy of Sciences, 2012. Arkiverad den 22 januari 2016. (ryska)
N. V. Bogatyr. Embedded and Beyond: The Impact of Networks . — Internationell konferens "Embeddedness and Beyond: Do Sociological Theories Explain Economic Reality?" 25–28 oktober 2012, Moskva, Ryssland, 2012. — S. 168–169 . Arkiverad från originalet den 26 februari 2013. (ryska)