Relevans (informationssökning)

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 10 maj 2018; kontroller kräver 11 redigeringar .

Relevans ( engelsk  relevans  - relevans, relevans ) vid informationssökning  - överensstämmelsen mellan avsikten (sökavsikten) som är inbäddad i begäran och sökmotorresultaten som erhålls som ett resultat av denna begäran. Användaren som anger en fråga i en sökmotor förväntar sig att resultaten kommer att matcha avsikten som han satte i frågan, med andra ord, han kommer att få en relevant utdata.

Det finns flera sätt att bedöma relevans. Innehållsrelevans är överensstämmelsen mellan svar på en informationsförfrågan, fastställd på ett informellt sätt [1] . Formell relevans är en korrespondens som bestäms genom att jämföra bilden av sökfrågan med sökbilden av svaret enligt en viss algoritm [1] .

En av de vanliga metoderna för att bedöma relevans är TF-IDF- metoden. Dess innebörd kokar ner till det faktum att ju större den lokala frekvensen av termen (frågan) är i dokumentet (TF) och ju större "sällsynthet" (det vill säga desto mindre ofta förekommer det i andra dokument) av termen i dokumentet. samling (IDF), desto högre vikt har detta svar i förhållande till termen - det vill säga svaret kommer att ges tidigare i sökresultaten för denna term. Metodens författare är Gerard Salton , vidareutvecklad  av Karen Spark Jones [2] .

Relevans ( lat.  pertineo - touch, relate ) - överensstämmelsen mellan de resultat som hittas av informationshämtningssystemet och användarens informationsbehov , oavsett hur fullständigt och hur exakt detta informationsbehov uttrycks i texten i informationsbegäran. Detta är med andra ord förhållandet mellan mängden användbar information och den totala mängden mottagen information [1] .

Faktorer som påverkar relevansen

Faktorer som påverkar relevans brukar delas in i externa och interna . De externa inkluderar referensmassan, de interna - de tekniska komponenterna och innehållet.

Länkvikt. Ju fler tematiska och kvalitetslänkar som leder till resursens sidor, desto mer sannolikt blir resursens värde för användaren.  

Tekniska komponenter. En stor grupp parametrar genom vilka sökmotorn utvärderar både webbplatsen som helhet och enskilda sidor (till exempel förekomsten av metataggar, frånvaron av fel i HTML-uppmärkning och så vidare).

Innehåll. Nyckelfaktorn som sidans relevans och konvertering beror på . Innehållet på webbplatsen måste vara unikt och "för människor".

Se även

Anteckningar

  1. 1 2 3 Dictionary of Cybernetics/Redigerad av akademikern V. S. Mikhalevich . - 2:a. - Kiev: Huvudupplagan av den ukrainska sovjetiska encyklopedin uppkallad efter M. P. Bazhan, 1989. - 751 s. - (C48). — 50 000 exemplar.  - ISBN 5-88500-008-5 .
  2. Jones KS En statistisk tolkning av termspecificitet och dess tillämpning vid hämtning  // Journal of Documentation: journal. - MCB University: MCB University Press, 2004. - V. 60 , nr 5 . - S. 493-502 .

Litteratur

Länkar