YaCy

Den aktuella versionen av sidan har ännu inte granskats av erfarna bidragsgivare och kan skilja sig väsentligt från versionen som granskades den 11 juli 2020; kontroller kräver 12 redigeringar .
YaCy
Sorts Överläggsnätverk , sökmotor
Utvecklaren YaCy Community
Skrivet i Java [1]
Operativ system Programvara för flera plattformar
Första upplagan 2004
Hårdvaruplattform Java Virtual Machine
senaste versionen 1 924 (9 februari 2021)
Licens GNU GPL 2+ [2]
Hemsida yacy.net
 Mediafiler på Wikimedia Commons

YaCy (från engelska  Yet another Cyberspace , Another Cyberspace ; konsonant med engelska.  Ya see ) är en fritt distribuerad decentraliserad sökmotor byggd på principen om ett peer-to- peer-nätverk (P2P). Det finns versioner för Windows, Linux, MacOSX. Den huvudsakliga mjukvarumodulen , skriven i Java , körs på flera tusen datorer (från och med 2011) av medlemmarna i YaCy-nätverket. Varje projektdeltagare utforskar Internet på egen hand, analyserar och indexerar de hittade sidorna och lägger till indexeringsresultaten i en gemensam databas (det så kallade indexet), som delas av alla YaCy-användare på P2P-basis.

Till skillnad från delvis distribuerade sökmotorer kännetecknas YaCy-nätverket av en decentraliserad arkitektur. Alla noder är likvärdiga och det finns ingen central server . Programmet kan fungera som en sökrobot eller som en lokal proxyserver , och indexerar de sidor som användaren besöker (medan det ignorerar sidor med tecken på personlig data - cookies, etc.).

Tillgång till sökfunktionalitet tillhandahålls av en lokalt körande webbserver som genererar en söksida med ett fält för att ange sökfrågor och returnerar sökresultat i samma format som andra populära sökmotorer.

Programmet distribueras under GPL-licensen . Projektet stöds av Free Software Foundation Europe (FSFE). [3]

YaCy - projektet grundades av Michael Christen 2003 . 

Fördelar och nackdelar

Fördelar

Nackdelar

Program

Sökmotorn skiljer sig från andra sökmotorer – den är inte en central server, utan ett peer-to-peer nätverksklientprogram som körs på många datorer samtidigt. Sökresultaten visas som en webbsida på den lokala webbplatsen , som också fungerar som ett webbgränssnitt för att anpassa sökmotorn efter användarens behov.

I kombination med ytterligare P2P- system används en proxy som automatiskt indexerar besökta sidor. Indexering utförs inte i de fall data överförs via GET eller POST, eller cookies (cookies) eller HTTP-autentisering används (till exempel sidor som ingår i en specifik lösenordsskyddad zon). [6] Detta säkerställer att endast offentligt tillgängliga data faktiskt indexeras.

Andra funktioner

Teknik

Programmet är baserat på en webbserver, som också är en caching- proxy . Webbserveranvändaren kan komma åt sökskalet och hantera sin egen värd. Proxyn har en gemensam kod med skannern, vilket innebär att alla sidor som besöks genom den, som inte är personliga, automatiskt registreras i indexet som standard. Dessutom tillhandahåller YaCy en egen domän i YaCy-nätverket, som är tillgänglig via en proxyserver. Solr och Lucene är integrerade för sökning i YaCy (för version 1.6 är detta version 4.3)

Distribuerat index

Till skillnad från fildelningstjänster måste P2P-sökresultat vara tillgängliga omedelbart. För att uppnå detta använder YaCy en distribuerad hashtabell (DHT). Detta innebär att alla webbadresser och ord som känns igen av programmet skickas till noder som är lämpliga för att lagra motsvarande kontrollsummor av ord, noder eller länkar. Vid sökning fungerar det tvärtom: sökningen sker bara på noder som är lämpliga för att lagra hash av URL:en för det ordet.

Således används endast en del av noderna för att få resultaten.

Nodtyper

YaCy-nätverket består av fyra olika typer av noder:

Nybörjare Dessa noder kan inte hittas eftersom nykomlingen inte har någon anslutning till nätverket. Således ser du bara dig själv om noden är ny. Jr Värden är bakom en brandvägg . Andra klassificerar honom som en junior eller potentiell nod, [7] de ser bara hans sista förfrågan och har inget sätt att avgöra om han fortfarande är online. Senior Den äldre kan nås från utsidan och är en fullvärdig medlem i YaCy-nätverket. I nätverksstatistik kallas äldre noder som för närvarande fungerar aktiva , inaktiva - passiva . [7] Main En äldre som dumpar en lista över frön som används för den initiala anslutningen till andra noder.

Protokoll

YaCy-protokollet består av textbaserade servlets som tillhandahålls av den inbyggda webbservern på /yacy/servletname.html. Andra värdar skickar data via GET-parametrar och får ett svar i klartext, det exakta formatet skiljer sig för servlets.

Bootstrap

Under bootstrapping försöker noden att kommunicera med andra noder i YaCy-nätverket. Först genomsöks listor med noder. Den första adressen i superseed.txt används för att ladda ner stabila YaCy-noder. seeds.txt är länkar till andra noder och tar därmed kontakt med YaCy-nätverket. Nästa gång du startar YaCy skapas gebootstrapt från värdar kända från föregående körning. Framöver kommer nodlistor bara att behövas när de flesta av de gamla länkarna inte längre är tillgängliga.

Se även

Anteckningar

  1. Yacy Open Source-projektet på Open Hub: Languages-sidan - 2006.
  2. GitHub  (engelska) - 2007.
  3. Webbsökning av folket, för folket: YaCy 1.0 . Datum för åtkomst: 14 december 2011. Arkiverad från originalet den 30 november 2011.
  4. 1 2 3 YaCy Bugfix Release 1.01 med nya bidrag från gemenskapen . Hämtad 6 mars 2012. Arkiverad från originalet 12 februari 2012.
  5. Kvantitetsstatistik: graf för 2011.
  6. Uk:Sekretess - YaCyWiki  (nedlänk)
  7. 1 2 /Network.html

Litteratur

Länkar