Веб адрес это что: адрес | это… Что такое Веб-адрес?

адрес | это… Что такое Веб-адрес?

Структура URL

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

<схема>://<логин>:<пароль>@<хост>:<порт>/<URL‐путь>

В этой записи:

схема 
схема обращения к ресурсу, в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль, ассоциированный с указанным именем пользователя
хост 
полностью прописанное доменное имя хоста в системе IP-адрес хоста в форме четырёх десятичных чисел, разделённых точками. Числа находятся в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса (зависит от протокола)

Схемы (протоколы) URL

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов гипертекста HTTP, использующая шифрование (как правило, TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet через протокол IRC
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию WAIS
  • xmpp — Протокол XMPP (часть файла
  • data — Непосредственные данные (Data: URL)

Экзотические схемы URL:

  • afs — Глобальное имя файла в файловой системе Andrew File System
  • cid — Идентификатор содержимого для частей
  • mailserver — Доступ к данным с почтовых серверов
  • nfs — Имя файла в сетевой файловой системе NFS
  • tn3270 — Эмуляция интерактивной сессии
  • z39. 50 — Доступ к службам ANSI Z39.50
  • skype — Протокол SMS в некоторых мобильных телефонах
  • ed2k — Файлообменная сеть eDonkey, построенная по принципу P2P

Кодирование URL

Появление адресов URL стало существенным нововведением в Интернете. Однако с момента его изобретения и по сей день стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нужные нам символы должны быть перекодированы особым образом.

В русскоязычной Википедии ежедневно приходится видеть пример кодирования URL, поскольку русский язык использует символы кириллицы. Например, строка вида:

http://ru.wikipedia.org/wiki/Микрокредит

кодируется в URL как:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82

Такое преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в Юникоде (шестнадцатеричном представлении:

М → D0 и 9C → %D0%9C
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
р → D0 и 80 → %D0%80, и т.    `   {   |   }  <пробел>
%22 %23 %25 %26 %27 %2a %2c %3a %3b %3c %3e %3f %5b %5e %60 %7b %7c %7d   +[3]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами на подавляющем большинстве языков (кроме английского, итальянского, латинского) может утратить способность восприниматься людьми.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и англ. International Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы URI в целом).

Инициатива PURL

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Примеры URL

http://ru.wikipedia.org/wiki/URL
http://en.wikipedia.org:80/wiki/Special:Search?search=train&go=Go 
ftp://myname:[email protected]:21/etc/motd
prospero://myhost.dom//pros/somename
file://vms.myhost.edu/disk$user/my/notes/note123.txt

См.

также

  • PURL
  • IRI — интернационализированный идентификатор ресурса
  • Длинные доменные имена
  • Человеку Понятный URL

Сноски

  1. RFC 2396 часть 2.
  2. 1 2 3 4 5 6 Символ допустим, но при указании прямым текстом несёт специальное синтаксическое значение
  3. Следует отметить, что поисковики заменяют пробел на символ «+».

Ссылки

  • RFC 1738
  • RFC 1630
  • Кодирование URL
  • URLEncode Code Chart — таблица кодирования символов URL

адрес | это… Что такое Веб-адрес?

Структура URL

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

<схема>://<логин>:<пароль>@<хост>:<порт>/<URL‐путь>

В этой записи:

схема 
схема обращения к ресурсу, в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль, ассоциированный с указанным именем пользователя
хост 
полностью прописанное доменное имя хоста в системе IP-адрес хоста в форме четырёх десятичных чисел, разделённых точками. Числа находятся в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса (зависит от протокола)

Схемы (протоколы) URL

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов гипертекста HTTP, использующая шифрование (как правило, TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet через протокол IRC
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию WAIS
  • xmpp — Протокол XMPP (часть файла
  • data — Непосредственные данные (Data: URL)

Экзотические схемы URL:

  • afs — Глобальное имя файла в файловой системе Andrew File System
  • cid — Идентификатор содержимого для частей
  • mailserver — Доступ к данным с почтовых серверов
  • nfs — Имя файла в сетевой файловой системе NFS
  • tn3270 — Эмуляция интерактивной сессии
  • z39. 50 — Доступ к службам ANSI Z39.50
  • skype — Протокол SMS в некоторых мобильных телефонах
  • ed2k — Файлообменная сеть eDonkey, построенная по принципу P2P

Кодирование URL

Появление адресов URL стало существенным нововведением в Интернете. Однако с момента его изобретения и по сей день стандарт URL обладает серьёзным недостатком — в нём можно использовать только ограниченный набор символов, даже меньший, нежели в кириллицы, или иероглифы, или, скажем, специфические символы французского языка, то нужные нам символы должны быть перекодированы особым образом.

В русскоязычной Википедии ежедневно приходится видеть пример кодирования URL, поскольку русский язык использует символы кириллицы. Например, строка вида:

http://ru.wikipedia.org/wiki/Микрокредит

кодируется в URL как:

http://ru.wikipedia.org/wiki/%D0%9C%D0%B8%D0%BA%D1%80%D0%BE%D0%BA%D1%80%D0%B5%D0%B4%D0%B8%D1%82

Такое преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в Юникоде (шестнадцатеричном представлении:

М → D0 и 9C → %D0%9C
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
р → D0 и 80 → %D0%80, и т.    `   {   |   }  <пробел>
%22 %23 %25 %26 %27 %2a %2c %3a %3b %3c %3e %3f %5b %5e %60 %7b %7c %7d   +[3]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами на подавляющем большинстве языков (кроме английского, итальянского, латинского) может утратить способность восприниматься людьми.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и англ. International Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы URI в целом).

Инициатива PURL

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Примеры URL

http://ru.wikipedia.org/wiki/URL
http://en.wikipedia.org:80/wiki/Special:Search?search=train&go=Go 
ftp://myname:[email protected]:21/etc/motd
prospero://myhost.dom//pros/somename
file://vms.myhost.edu/disk$user/my/notes/note123.txt

См.

также

  • PURL
  • IRI — интернационализированный идентификатор ресурса
  • Длинные доменные имена
  • Человеку Понятный URL

Сноски

  1. RFC 2396 часть 2.
  2. 1 2 3 4 5 6 Символ допустим, но при указании прямым текстом несёт специальное синтаксическое значение
  3. Следует отметить, что поисковики заменяют пробел на символ «+».

Ссылки

  • RFC 1738
  • RFC 1630
  • Кодирование URL
  • URLEncode Code Chart — таблица кодирования символов URL

Что такое веб-адрес?

Давайте обсудим каждую часть веб-адреса.

Схема

Схема указывает протокол — набор правил, регулирующих связь, которую браузеры должны использовать для доступа к ресурсам веб-сайта. Некоторые из популярных схем включают HTTPS, TCP, Mailto и FTP.

Субдомен

Субдомен — это часть веб-адреса, которая позволяет классифицировать и обеспечивать навигацию по различным разделам веб-сайта.

Доменное имя

Доменное имя — это имя веб-сайта и важная часть домена, которая помогает пользователям запоминать и получать доступ к веб-сайту.

Вы можете приобрести доменные имена у таких регистраторов, как Namecheap, Domain.com или Bluehost.

Примечание. Доменные имена иногда называют именами хостов или веб-сайтов.

Домен верхнего уровня

Домен верхнего уровня (TLD) помогает отнести веб-сайт к определенной категории в Интернете.

Например, в https://www.army.mil домен верхнего уровня mil классифицирует армейский веб-сайт как военный домен.

Аналогичным образом, в https://www.harvard.edu домен верхнего уровня edu классифицирует веб-сайт Гарварда как образовательный ресурс.

Порт

Порт — это технический шлюз на сервере веб-сайта, с которого браузеры могут получить доступ к ресурсам сайта.

Например, в https://www.codesweetly.com:80 , порт 80.

Другими словами, порт 80 — это шлюз, предназначенный для обслуживания ресурсов CodeSweetly.

Имейте в виду, что вы можете не указывать номер порта в URL-адресе, если сервер веб-сайта использует стандартный HTTP-порт для предоставления доступа к ресурсам сайта.

Например, предположим, что сервер сайта использует порт 80 для HTTP (или порт 443 для HTTPS). В таком случае вам не нужно указывать номер порта при вводе URL-адреса.

Однако, если сервер сайта использует какой-либо нестандартный порт для предоставления своего ресурса, необходимо указать номер порта.

Путь к файлу

Путь к файлу URL — это путь (маршрут) к ресурсу веб-сайта на веб-сервере.

Параметр

Параметр (строка запроса) позволяет отправлять определенные данные на сервер. Когда веб-сервер получает строку запроса, он может использовать значение строки для выполнения других действий перед отправкой запрошенного ресурса в ваш браузер.

Якорь

Якорь — это ссылка на определенную часть того же файла, на который ссылается URL-адрес.

Якорь похож на закладку, которая указывает браузерам отображать содержимое файла, расположенного в отмеченном месте.

  • Часть после символа решетки (#) якоря иногда называют идентификатором фрагмента.
  • Идентификатор фрагмента никогда не отправляется на сервер.

Краткий обзор

Предположим, веб-сайт — это книга. В этом случае вы можете описать анатомию URL следующим образом:

  • .

    Якорь: закладка в определенной части книги. Например, закладка заголовка страницы.

  • Параметр: Информация для хранителя книги. Например, вы можете использовать параметр, чтобы сообщить хранителю язык книги.

  • Путь к файлу: конкретная страница, которая вам нужна из книги; например, стр. 625.

  • Порт: Номер двери магазина, где можно получить доступ к книге; например, дверь 70.

  • Домен верхнего уровня: Жанр, к которому относится книга; например, Образовательный.

  • Доменное имя: Название книги; например, Библия.

  • Субдомен: конкретный раздел книги, к которому вы хотите получить доступ; например, Ветхий Завет.

  • Схема

    : набор правил, которые должен использовать ваш агент, чтобы получить книгу от хранителя; например, Любовь.

  • URL: полный веб-адрес нужного вам содержания книги; например,

 love://oldtestament.bible.educational:70/page625?lang=en#zophar-speaks
 

Основы Интернета: Понимание URL-адресов

Урок 9: Понимание URL-адресов

/en/internetbasics/using-search-engines/content/

Понимание URL-адресов

Каждый раз, когда вы щелкаете ссылку на веб-сайте или вводите веб-адрес в ваш браузер, это URL . URL означает унифицированный указатель ресурсов. Думайте об этом как об адресе, где каждая часть URL-адреса представляет собой разные части адреса, и каждая дает вам различную информацию. Давайте рассмотрим каждый компонент URL-адреса и то, что мы можем извлечь из него.

Посмотрите видео ниже, чтобы узнать о различных частях URL.

Схема

Каждый URL начинается с схемы . Это сообщает вашему браузеру, какой это тип адреса, чтобы браузер правильно подключался к нему. Существует много типов схем, но при обычном просмотре веб-страниц вы в основном увидите http и https . Ваш браузер обычно не отображает схему в адресной строке, и обычно вам не нужно вводить схему при вводе веб-адреса; вместо этого вы можете просто начать с доменное имя . Схема по-прежнему всегда является частью URL-адреса; просто не отображается.

Доменное имя

Доменное имя является наиболее заметной частью веб-адреса. Как правило, разные страницы одного и того же сайта продолжают использовать одно и то же доменное имя . Например, все страницы этого сайта имеют общее доменное имя GCFLearnFree.org .

Каждый сегмент доменного имени , разделенный точкой, называется домен . Домен справа называется доменом верхнего уровня , а домен слева от него называется доменом второго уровня , затем доменом третьего уровня и так далее.

Часто можно узнать что-то о сайте из доменов. Один из доменов обычно идентифицирует организацию, а домен верхнего уровня может дать вам более общую информацию о том, что это за сайт. Например, в доменном имени nc.gov .gov 9Домен 0008 означает, что это правительственный веб-сайт в Соединенных Штатах, домен nc идентифицирует его как веб-сайт Северной Каролины.

В большинстве URL домен www может быть опущен. Google.com и www.google.com ведут на одну и ту же страницу. Однако другие поддомены не могут быть опущены. Например, для всех страниц в разделе news.google.com в URL-адресе должен быть субдомен news .

Путь к файлу

Путь к файлу — часто называется просто путь — говорит вашему браузеру загрузить определенную страницу. Если вы не укажете путь и введете только доменное имя , ваш браузер по-прежнему загружает определенную страницу; это просто загрузка страницы по умолчанию, которая обычно помогает вам переходить на другие страницы.

URL-адреса, которые заканчиваются доменным именем без пути к файлу , обычно загружают домашнюю страницу или индексную страницу, предназначенную для облегчения перехода к определенным страницам сайта. Часто, если вы не можете вспомнить путь к файлу для определенной страницы, вы можете перейти на домашнюю страницу и выполнить поиск.

Параметры

Некоторые URL-адреса включают строку символов после пути, начинающуюся со знака вопроса, которая называется строкой параметра . Вы, наверное, заметили, что эта часть URL-адреса появляется в адресной строке после выполнения поиска в Google или YouTube. Строка параметра может быть понятной или запутанной для человека, но это важная информация для сервера.

Якорь

Также появляется после пути, якорь говорит вашему браузеру прокручивать или загружать определенную часть страницы. Обычно якорь начинается с хэштега и используется для направления вашего браузера к определенной части очень длинной страницы, как закладка. Разные анкоры не загружают разные страницы; они просто говорят браузеру отображать разные части страницы.

Целый URL-адрес

В сочетании эти элементы составляют URL-адрес, хотя не все URL-адреса состоят из всех пяти частей.

This entry was posted in Популярное