Citeringsanalys

Citationsanalys  är studiet av frekvens, mönster och scheman för citeringar i dokument. Den använder citatmönstret, länkar från ett dokument till ett annat dokument, för att upptäcka dokumentens egenskaper. Ett typiskt mål är att identifiera de viktigaste dokumenten i en samling. Ett klassiskt exempel är att citera mellan akademiska uppsatser och böcker. [1] [2] Rättsliga beslut i det anglosaxiska rättssystemet hänvisar, för att bekräfta deras beslut, till beslut som fattats i tidigare fall, så analysen av citat i ett juridiskt sammanhang är viktig. Ett annat exempel är patent som innehåller tidigare uppfinningar, tidigare citerade patent som hänför sig till det aktuella patentkravet.

Dokument kan associeras med många andra funktioner förutom citat, såsom författare, förlag, tidskrifter, såväl som deras faktiska texter. Den allmänna analysen av samlingar av dokument kallas bibliometri , och citeringsanalys är en viktig del av denna riktning. Till exempel är bibliografisk koppling och delning associerade mätvärden baserade på citeringsanalys (delade citat eller delade citat). Citat i en samling av artiklar kan också presenteras i form av följande citeringsdiagram, vilket noterades av Derek de Solla Price  i 1965 års artikel "Networks of Scientific Papers". [3] Detta innebär att citeringsanalys bygger på aspekter av sociala nätverksanalyser och nätverksvetenskap.

Ett tidigt exempel på automatisk citeringsindexering var CiteSeer , som användes för citeringar i vetenskapliga rapporter, och Google Scholar är ett exempel på ett modernt system som omfattar mer än bara akademiska böcker och artiklar och återspeglar ett bredare utbud av informationskällor. Idag har automatiserad citeringsindexering [4] ändrat karaktären på citationsanalysforskning, vilket gör att miljontals citeringar kan analyseras för storskaliga modeller och kunskapsupptäckt. Citationsanalysverktyg kan användas av forskare för att beräkna olika grader av påverkan baserat på citeringsindexdata . [5] [6] [7] De har ansökningar som sträcker sig från att identifiera expertdomare till att granska dokument och anslagsförslag, till att tillhandahålla transparenta data för att stödja beslut om akademiska meriter, tjänstgöring och beslutsfattande. Denna konkurrens om begränsade resurser kan leda till etiskt tveksamt beteende för ökade citeringar. [8] [9]

Bruket att naivt använda citeringsanalys för att jämföra effekterna av olika vetenskapliga artiklar utan att ta hänsyn till andra faktorer som kan påverka citeringsmönster har kritiserats hårt. [10] Bland kritiken fokuserar man konsekvent på "industrioberoende", nämligen det faktum att citeringspraxis inom ett vetenskapsområde skiljer sig från praxis inom ett annat och till och med mellan forskningsgrenar inom en disciplin. [elva]

Översikt

Även om citeringsindex ursprungligen utvecklades för informationssökning , används de alltmer för bibliometriska  och andra studier som involverar forskningsutvärdering. Citeringsdata är också grunden för en populär tidskrifts inflytandekvot .

Det finns en stor mängd litteratur om citeringsanalys, ibland kallad scientometri , en term  som myntats av Vasily Nalimov , eller mer specifikt bibliometri . Branschen började blomstra med tillkomsten av Science Citation Index, som täcker litteratur publicerad sedan 1900. Branschens ledande tidskrifter är Scientometrics , Informatics och Journal of the Association for Information Science and Technology. Den senare organiserar också en elektronisk e-postlista som heter Sigmetrica på ATIT. [12] Den här metoden återupplivas genom utbredd användning av databaser, Web Science och Scopus-prenumerationer vid många universitet och offentliga gratis citeringsverktyg som CiteBase, CiteSeerX , Google Scholar och det tidigare Windows Live Academic-programmet (nu tillgängligt med ytterligare funktioner som t.ex. som Microsoft Academic Search). Forskningsmetoder för citationsanalys inkluderar kvalitativa, kvantitativa och beräkningsbaserade metoder. Huvudfokusen för sådana scientometriska studier har varit benchmarking av prestanda, institutionella forskningsrankningar, klassificering av tidskrifter [13] angående fastställande av prestationsfaktorer och ägandestandarder, [14] utvärdering av effekterna av toppvetenskapliga artiklar, [15] spårning av en vetenskaps bana eller teknologiindustrin [16] och utveckling av profiler för ledande författare och institutioner när det gäller forskningsresultat. [17]

Juridisk hänvisningsanalys är en hänvisningsanalysteknik för att analysera rättshandlingar som gör det lättare att förstå relaterade normativa handlingar genom att granska hänvisningar som kopplar en bestämmelse till andra bestämmelser i samma dokument eller mellan olika handlingar. Analys av juridiska hänvisningar använder en hänvisningsgraf hämtad från ett regulatoriskt dokument som kan komplettera elektronisk upptäckt, en process som påverkar teknisk innovation inom big data -analys . [18] [19] [20] [21]

Historik

I en artikel från 1965 beskrev Derek de Solla Price SCI:s inneboende bindande egenskap som "ett nätverk av vetenskapliga artiklar". Länkarna mellan citat och citerade artiklar blev dynamiska när SCI började publicera online. Social Science Citation Index var en av de första databaserna som installerades i Dialog-systemet [22] 1972. Med tillkomsten av CD-skivor har referenser blivit ännu enklare, vilket gör det möjligt att använda bibliografiska länkar för att hitta relaterade poster. 1973 publicerade Henry Small sitt klassiska arbete om samcitationsanalys, som blev  ett självorganiserat  klassificeringssystem som ledde till experiment med dokumentkluster och så småningom till Atlas of Science, som senare blev Research Reviews.

Den inneboende topologiska och grafiska karaktären hos den världsomspännande citeringswebben som är inneboende i vetenskaplig litteratur beskrevs av Ralph Garner (Drexel University) 1965. [23]

Användningen av citeringspoäng i rankade tidskrifter var en vanlig praxis under första hälften av 1800-talet, men den systematiska pågående mätningen av dessa poäng för vetenskapliga tidskrifter initierades av Eugene Garfield vid Institute for Scientific Information, som också blev den primära källan för att använda dessa poäng för att betygsätta författare och artiklar. I en landmärkestidning från 1965 visade han och Irving Sher sambandet mellan frekvens och citeringstillväxt, vilket visade att Nobelpristagare publicerade sina artiklar fem gånger i genomsnitt, medan deras artiklar citerades 30-50 gånger i genomsnitt. Garfield rapporterade om detta fenomen i en lång rad essäer om Nobelpriset och andra priser. Den vanliga slutpoängen är känd som inflytandekvot , antalet citeringar i tidskriften under de två föregående åren dividerat med antalet artiklar som publicerats under dessa år. Det används ofta för både vanliga och speciella ändamål, i synnerhet är dess användning för utvärdering av författare och dokument ganska kontroversiell .

I en tidig 1964 studie som använde citationsanalys för att skriva DNA- historia, visade Garfield och Sher potentialen att producera historiografi , topologiska kartor över viktiga steg i historien om vetenskapliga ämnen. Detta arbete automatiserades senare av E. Garfield, A. I. Pudovkin från Institute of Marine Biology vid National Academy of Sciences och V. S. Istomin vid Center for Teaching, Learning and Technology, Washington State University och ledde till skapandet av Histcite-mjukvaran [ 24] år 2002.

Automatisk citeringsindexering introducerades 1998 av Lee Giles, Steve Lawrence och Kurt Bollacker och tillät automatisk algoritmisk radering och gruppering av citat för alla digitala akademiska och vetenskapliga dokument. Där återkallande av citat var en manuell process, kan citeringsfrekvensen nu ökas och beräknas för vilken akademisk gren eller plats som helst, inte bara de som tilldelats av organisationer som ISI. Detta ledde till skapandet av nya system för att indexera offentliga och automatiska citeringar, varav det första var CiteSeer (numera CiteSeerX , som snart ärvdes av Cora-systemet, som främst fokuserade på datavetenskap och datavetenskap . Senare kom stora akademiska domännamnssystem som t.ex. som Google Scholar och Microsoft Academic. Denna offline-citeringsindexering har ännu inte fulländats i citeringsextraktion eller citeringsklustring med en felfrekvens som uppskattas till någonstans runt 10 %, även om noggrann statistisk sampling ännu inte har gjorts.Författare som Ann Arbor , Milton Keynes och Walton Hall har producerat en enorm mängd akademiska resultat.25 SCI hävdar att de skapar automatisk citeringsindexering genom rent programmatiska metoder. Även äldre poster har samma felmarginal.

Citeringsanalys för juridiska dokument

Citeringsanalys för juridiska dokument är ett tillvägagångssätt som hjälper till att förstå och analysera relaterade normativa dokument genom att granska hänvisningar som kopplar en bestämmelse till andra bestämmelser inom samma dokument och mellan olika dokument. Citationsanalys använder en citeringsgraf som härrör från ett normativt dokument som skulle kunna komplettera elektronisk upptäckt, en process som driver teknisk innovation inom big data-analys. [26]

Kritik

Elektroniska publikationer . På grund av den oöverträffade ökningen av tillgången på elektroniska resurser har en av de brännande frågorna som nu studeras blivit frågan "hur ofta citeras elektroniska resurser på Internet i min bransch?". [27] Till exempel har det hävdats att tillgång online till datavetenskaplig litteratur leder till högre citeringsfrekvens, [28] men humanistiska artiklar kan bli lidande om de inte finns i tryck.

Självcitat . Författarnas praxis att "leka" med systemet genom att samla citat, genom att övercitera sig själva [29] har kritiserats mycket . Samtidigt fann man till exempel att män citerar sig själva oftare än kvinnor.

Se även

Anteckningar

  1. Rubin, Richard. Grunder för biblioteks- och informationsvetenskap  (engelska) . — 3:a. - New York: Neal-Schuman Publishers, 2010. - ISBN 978-1-55570-690-6 .
  2. Garfield, E. Citation Indexing - dess teori och tillämpning i vetenskap, teknologi och humaniora Philadelphia: ISI Press, 1983. . Hämtad 29 augusti 2018. Arkiverad från originalet 9 mars 2018.
  3. Derek J. de Solla Price. Networks of Scientific Papers  (engelska)  // Science  : journal. - 1965. - 30 juli ( vol. 149 , nr 3683 ). - S. 510-515 . - doi : 10.1126/science.149.3683.510 . - . — PMID 14325149 .
  4. Giles, C. Lee; Bollacker, Kurt D. & Lawrence, Steve (1998), CiteSeer: an automatic citation indexing system. , Digital libraries 98 : the Third ACM Conference on Digital Libraries, 23–26 juni 1998, Pittsburgh, PA (New York: Association for Computing Machinery): 89–98, ISBN 0-89791-965-3 , doi : 10.1145/ 276675.276685 , < http://doi.acm.org/10.1145/276675.276685 > . Hämtad 7 juli 2011. 
  5. Exempel inkluderar prenumerationsbaserade verktyg baserade på proprietär data, såsom Web of Science och Scopus , och gratisverktyg baserade på öppna data, såsom Scholarometer Archived 18 April 2022 at the Wayback Machine av Filippo Menczer och hans team.
  6. Kaur, Jasleen. Scholarometer: A Social Framework for Analyzing Impact across Disciplines  (engelska)  // PLoS ONE  : journal. - 2012. - Vol. 7 , nr. 9 . - doi : 10.1371/journal.pone.0043235 . - . — PMID 22984414 .
  7. Hoang, D.; Kaur, J. & Menczer, F. (2010), Crowdsourcing Scholarly Data , Proceedings of the WebSci10: Extending the Frontiers of Society On-Line, 26-27 april 2010, Raleigh, NC: USA , < http:/ /journal .webscience.org/321/ > . Hämtad 29 augusti 2018. Arkiverad 17 april 2015 på Wayback Machine 
  8. Anderson, MS van.  De perversa effekterna av konkurrens på forskarnas arbete och relation  // Science and Engineering Ethics : journal. - 2007. - Vol. 4 , nr. 13 . - s. 437-461 . - doi : 10.1007/s11948-007-9042-5 .
  9. Wesel, M. van. Utvärdering genom citat: Trender i publiceringsbeteende, utvärderingskriterier och strävan efter publikationer med hög effekt   // Science and Engineering Ethics : journal. - 2016. - Vol. 22 , nr. 1 . - S. 199-225 . - doi : 10.1007/s11948-015-9638-0 . — PMID 25742806 .
  10. Vad mäter citaträkningar? En genomgång av studier om citerande beteende  //  Journal of Documentation : journal. - 2008. - Vol. 64 , nr. 1 . - S. 45-80 . - doi : 10.1108/00220410810844150 .
  11. Anauati, Maria Victoria och Galiani, Sebastian och Gálvez, Ramiro H., Quantifying the Life Cycle of Scholarly Articles Across Fields of Economic Research (11 november 2014). Tillgänglig på SSRN: http://ssrn.com/abstract=2523078 Arkiverad 17 november 2014.
  12. American Society for Information Science & Technology (otillgänglig länk) . Informationssamhället för informationsåldern . Hämtad 21 maj 2006. Arkiverad från originalet 3 oktober 2019. 
  13. Lowry, Paul Benjamin; Moody, Gregory D.; Gaskin, James; Galletta, Dennis F.; Humpherys, Sean; Barlow, Jordan B.; och Wilson, David W. (2013). " Evaluating journal quality and the Association for Information Systems (AIS) Senior Scholars' journal korg via bibliometriska mått: Tillför experttidskriftsbedömningar ett värde? Arkiverad 21 mars 2019 på Wayback Machine , MIS Quarterly (MISQ), vol. 37(4) , 993-1012. YouTube ser också videoberättelsen om detta dokument på: https://www.youtube.com/watch?v=LZQIDkA-ke0&feature=youtu.be Arkiverad 21 mars 2019 på Wayback Machine .
  14. Dean, Douglas L; Lowry, Paul Benjamin; och Humpherys, Sean (2011). Profilering av forskningsproduktiviteten hos en anställd informationssystemfakultet vid amerikanska institutioner Arkiverad 9 januari 2016 på Wayback Machine , MIS Quarterly (MISQ), vol . 35(1), sid. 1-15 ( ISSN 0276-7783 ).
  15. Karuga, Gilbert G.; Lowry, Paul Benjamin; och Richardson, Vernon J. (2007). Att bedöma effekten av förstklassig informationssystemforskning över tid, Communications of the Association for Information Systems, vol. 19(7), sid. 115-131 (http://aisel.aisnet.org/cais/vol19/iss1/7) Arkiverad 25 januari 2016 på Wayback Machine
  16. Liu, John S. En integrerad strategi för huvudvägsanalys: Utveckling av Hirsch-indexet som exempel  //  Journal of the American Society for Information Science and Technology : journal. - 2012. - 1 mars ( vol. 63 , nr 3 ). - s. 528-542 . — ISSN 1532-2890 . - doi : 10.1002/asi.21692 .
  17. Lowry, Paul Benjamin; Karuga, Gilbert G.; och Richardson, Vernon J. (2007). Bedömning av ledande institutioner, fakulteter och artiklar i främsta tidskrifter för informationssystemforskning, Communications of the Association for Information Systems, vol. 20(16), sid. 142-203 (http://aisel.aisnet.org/cais/vol20/iss1/16). Arkiverad 9 januari 2016 på Wayback Machine
  18. http://ieeexplore.ieee.org/search/wrapper.jsp?arnumber=5070630&tag=1  (nedlänk från 2018-08-29 [1517 dagar])
  19. Mohammad Hamdaqa och A. Hamou-Lhadj, "Citeringsanalys: En metod för att underlätta förståelsen och analysen av dokument om reglerande efterlevnad", i Proc. av den 6:e internationella konferensen om informationsteknologi, Las Vegas, USA
  20. ↑ Specialrapport för E-Discovery: Rising Tide of Nolinar Review . Hudson Global . Hämtad 1 juli 2012. Arkiverad från originalet 3 juli 2012. av Cat Casey och Alejandra Perez
  21. Vad teknologistödd elektronisk upptäckt lär oss om människans roll i teknologin - Återhumanisera teknikstödd granskning . Forbes . Hämtad 1 juli 2012. Arkiverad från originalet 18 juni 2012.
  22. Dialog, A Thomson Business . "Dialog uppfann informationstjänster online" . Hämtad 21 maj 2006. Arkiverad från originalet 13 januari 2004.
  23. Arkiverad kopia . Hämtad 29 augusti 2018. Arkiverad från originalet 9 september 2017.
  24. Eugene Garfield Algorithmic Citation-Linked Historiography—Mapping the Literature of Science . Presenterade ASIS&T 2002: Information, Connections and Community. 65:e årsmötet för ASIST i Philadelphia, PA. 18–21 november 2002 (2002). Hämtad 21 maj 2006. Arkiverad från originalet 20 oktober 2016.
  25. Postellon DC Hall och Keynes ansluter sig till Arbor i citationsindexen  // Nature  :  journal. - 2008. - Mars ( vol. 452 , nr 7185 ). - doi : 10.1038/452282b . — . — PMID 18354457 .
  26. Hamdaqa, M.; En Hamou-Lhadj. Citationsanalys: Ett tillvägagångssätt för att underlätta förståelsen och analysen av regulatoriska  överensstämmelsedokument . - Las Vegas, NV: Institute of Electrical and Electronics Engineers , 2009. - P. 278-283. - ISBN 978-1-4244-3770-2 . - doi : 10.1109/ITNG.2009.161 .
  27. Zhao, Lisa. "Hur bibliotekarien använde e-resurser - en analys av citat i CCQ." Cataloging & Classification Quarterly 42(1) (2006): 117-131.
  28. Lawrence, Steve. Gratis onlinetillgänglighet ökar avsevärt en tidnings inverkan. Nature volym 411 (nummer 6837) (2001): 521. Även online på http://citeseer.ist.psu.edu/online-nature01/ Arkiverad 9 juni 2010 på Wayback Machine
  29. Gálvez RH Bedömer självcitering av författare som en mekanism för spridning av relevant kunskap  //  Scientometrics : journal. - 2017. - Mars ( vol. 111 , nr 3 ). - S. 1801 . - doi : 10.1007/s11192-017-2330-1 .