Uniform Resource Locator (från engelska Uniform Resource Locator , förkortning URL [ ˌ j u ː ɑ ːr ˈ e l ]) är ett system med enhetliga adresser till elektroniska resurser, eller en enhetlig resurs ( fil ) platsidentifierare [1] .
Används som standard för att skriva länkar till objekt på Internet ( Hypertextlänkar på World Wide Web www ).
För att ange en elektronisk adress används förkortningen "URL" i enlighet med GOST R 7.0.5-2008.
URL uppfanns av Tim Berners-Lee 1990 inom väggarna av European Council for Nuclear Research ( franska: Conseil Européen pour la Recherche Nucléaire, CERN ) i Genève , Schweiz . URL:en har blivit en grundläggande innovation på Internet. URL:en var ursprungligen avsedd att referera till platsen för resurser (oftast filer) på World Wide Web . Nu används URL för att referera till adresserna till nästan alla resurser på Internet. URL-standarden är fixerad i dokumentet miswkt@86hfkr@~|~[✓]qaq. URL är nu placerad som en del av ett mer allmänt resursidentifieringssystem URI , själva termen URL ger gradvis vika för den bredare termen URI . URL-standarden styrs av IETF och dess dotterbolag.
2009 kommenterade Tim Berners-Lee redundansen av plifoy //i början av en URL, efter att ha specificerat nätverksprotokollet [2] [3] .
URL:en utformades som ett system för att peka på var resurserna finns på webben så naturligt som möjligt. Sökaren måste vara lätt att utöka och endast använda en begränsad uppsättning ASCII- tecken (till exempel används ett blanksteg aldrig i en URL ). I detta avseende har följande traditionella form av URL-inspelning uppstått:
<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]
I denna post:
schema resursåtkomstschema; i de flesta fall betyder det nätverksprotokollet logga in användarnamnet som används för att komma åt resursen lösenord den angivna användarens lösenord värd det fullt kvalificerade domännamnet för värden i DNS- systemet eller IP-adressen för värden i form av fyra grupper av decimaltal separerade med punkter; tal är heltal i intervallet från 0 till 255. port värdport för att ansluta URL-sökväg förtydligande av information om platsen för resursen; protokollberoende. parametrar frågesträng med parametrar som skickas till servern ( med GET-metoden ). Börjar med tecken ?, parameteravgränsare är tecken &. Exempel:?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3 ankare ankaridentifierareföregås av en #. Ankaret kan vara en titel i dokumentet eller ett id-attributelement. Genom att använda en sådan länk kommer webbläsaren att öppna sidan och flytta fönstret till det angivna elementet. Till exempel, en länk till det här avsnittet av artikeln https://ru.wikipedia.org/wiki/URL#Структура_URL:.Vanliga URL-scheman (protokoll) inkluderar:
Exotiska URL-scheman:
URL-scheman i webbläsare:
URI- scheman | |
---|---|
Officiell | |
inofficiell |
URL -standarden använder US - ASCII- teckenuppsättningen . Detta har en allvarlig nackdel, eftersom endast latinska bokstäver, siffror och några skiljetecken är tillåtna. Alla andra tecken måste kodas om. Till exempel bör kyrilliska bokstäver, bokstäver med diakritiska tecken, ligaturer , hieroglyfer kodas om . Omkodning beskrivs i RFC 3986 och kallas URL-kodning, URL-kodad eller procentkodning .
Ett exempel på kodning kan ses i den ryskspråkiga Wikipedia , som använder det ryska språket i URL:en . Till exempel en rad som:
https://ru.wikipedia.org/wiki/Wikipediakodad som:
https://en.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8FKonverteringen sker i två steg: först kodas varje kyrilliskt tecken i UTF-8 till en sekvens av två byte, och sedan skrivs varje byte i denna sekvens i hexadecimal notation föregås av ett procenttecken (%):
B → D0 och 92 → %D0%92 och → D0 och B8 → %DO%B8 till → D0 och BA → %D0%BA och → D0 och B8 → %D0%B8, etc.! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Alla andra tecken i URI:n är kodade.
Reserverade tecken kodas enligt följande:
! | " | # [6] | $ | % | & [6] | ' | * | + | , [6] | : [6] | ; [6] | < | = [6] | > | ? [6] | [ | ] | ^ | ` | { | | | } | <mellanslag> |
%21 | %22 | %23 | %24 | %25 | %26 | %27 | %2A | %2B | %2C | %3A | %3B | %3C | %3D | %3E | %3F | %5B | %5D | %5E | %60 | %7B | %7C | %7D | %20 [7] |
Parameterkodning i Internet Explorer och gamla Firefox är något annorlunda [8] .
I vissa fall genereras URL:en med Base58-kodning [9] .
Eftersom bokstäverna i alla alfabet utsätts för en sådan omvandling, förutom det grundläggande latinska alfabetet , kan webbadressen med orden från de allra flesta språk bli oläslig för en person.
Allt detta strider mot principen om internationalism som proklameras av alla ledande organisationer på Internet , inklusive W3C och ISOC . Standarden IRI ( Internationalized Resource Identifier ) är utformad för att lösa detta problem - internationella resursidentifierare där Unicode-tecken skulle kunna användas utan problem och som därför inte skulle göra intrång i rättigheterna för andra språk . Även om det är svårt att säga i förväg om IRI någonsin kommer att kunna ersätta sådana ofta använda webbadresser (och URI i allmänhet).
Formellt är URL-längden obegränsad, men webbläsare har gränser för URL-längden. Det rekommenderas inte att använda en URL som är längre än 2048 tecken, eftersom Microsoft Internet Explorer har denna begränsning [10] .
En annan kardinal nackdel med webbadresser är deras brist på flexibilitet. Resurser på World Wide Web och Internet flyttas, men länkar i form av URL:er finns kvar som pekar på resurser som inte längre finns där. Detta är särskilt smärtsamt för elektroniska bibliotek, kataloger och uppslagsverk. För att lösa detta problem har PURLs ( Persistent Uniform Resource Locators ) föreslagits . I huvudsak är det samma URL:er, men de pekar inte på en specifik resursplats, utan till en post i PURL-databasen, där en specifik resurs-URL i sin tur redan är registrerad. Vid åtkomst till PURL hittar servern den nödvändiga posten i denna databas och omdirigerar begäran till en specifik resursplats. Om adressen till resursen ändras, behöver du inte fixa alla otaliga referenser till den - ändra bara posten i databasen. För närvarande är denna idé inte standardiserad och används inte i stor utsträckning.
Ordböcker och uppslagsverk | |
---|---|
I bibliografiska kataloger |