Что собой представляет URL и где же он всё-таки находится? Дать ответ на этот вопрос сразу не получится, сначала нужно абстрактно представить, что любой сайт в интернете принадлежит одному мегаполису, в котором любой ресурс имеет собственное жильё. Отдельная папка, находящаяся в глубине сайта, — это квартира. В свою очередь, файл – это жилец, поселившийся в ней.
Интернет – довольно масштабная система, поэтому условный город будет вмещать в себя обилие разнообразных улиц и кварталов.
Допустим, вы отыскали то, что давно было необходимо. В одной из квартир здания находилась картина с собаками. Теперь назревает вопрос, как просто и понятно объяснить подруге, куда ей нужно направляться, чтобы отыскать изображение.
Лучше всего изобрести определённый эталон, по которому адреса в городе будут получать свои наименования. В итоге получится короткая и несложная запись координат местоположения любого сооружения или предмета. Чтобы было комфортнее и удобнее, стоит разместить всё в порядке иерархии: сначала идёт квартал, далее улица, за ней дом и заканчивается всё квартирой.
Принцип работы URL подобен этому примеру. Посредством использования URL в адресном пространстве обозначаются единоличные позиции файлов в сети. Сейчас действует р\д определённых правил, по которым образовывается и пишется ссылка. Так было задумано для того, чтобы не запутаться в похожих адресах и избежать разночтений.
Устройство URL
Если есть желание узнать, как верно составлять URL адрес, стоит сначала ознакомиться с правилами его генерирования. Образец, по которому нужно составлять ссылки, имеет такой вид:
<протокол>://<логин>:<пароль>@<хост>:<порт>/<путь>
- <протокол> — это средство, по которому можно присоединиться к ресурсу. Существует несколько протоколов. Самый распространённый из них HTTP. Помимо него есть и другие, например, защищённый TLS – HTTPS и протокол, по которому можно передавать файлы, FTP.
- <логин>:<пароль> — эта строчка передает данные для входа, если это необходимо.
- <хост> — то есть, IP-адрес заключительного сервера. В наше время вписывать самостоятельно цифровые обозначения не нужно, так как существуют DNS-серверы. Через них мы можем записывать адрес сайта буквами с указанием его домена.
- <порт> — к серверу ресурса подключаются по установленному порту. Он всегда известен заранее.
- <путь> — направление к нужному файлу. Он создаётся по конкретному примеру путей в файловой системе компьютера. Папки указываются через символ косой линии в иерархическом порядке. Перечисление оканчивается названием необходимого файла и его расширением.
Также в URL есть такие составные части, как ?<параметры запроса>#<якорь>
- <параметры> — это формат, который перенаправляется на заведующие скрипты сервера. Допустим, с помощью HTML можно декламировать поступившие параметры, как данные метода GET.
- <якорь> — это выборочная строка для HTTP/HTTPS. Применяется, для того чтобы помечать необходимые места на сайте или же для работы JavaScript (как пример, это помогает ссылаться на необходимую часть статьи).
Итак, как определить URL адрес?
Узнать любой URL адрес можно несколькими разными способами. Вот они:
Способ №1
Запустите браузер и откройте необходимый портал.
- Сверху окна браузера вы можете увидеть адресную строку.
- Её нужно выделить курсором мыши.
- Затем всё скопируйте, нажав на клавиши Ctrl и C.
- После этого URL адрес помещается в буфер обмена.
Способ №2
С помощью изображения.
- По картинке кликните правой клавишей мыши.
- В меню есть пункт “Копировать адрес ссылки”. Нужно выбрать его.
- Текст помещается в кэш-память.
Способ №3
Гиперссылка.
- Правой кнопкой мыши нажмите на ссылку.
- Затем выберите пункт “Копировать ссылку”.
- Ссылка содержится в кэше.
Кодирование URL
URL может состоять лишь из конкретного набора символов: буквы латиницы, дефис, нижнее подчёркивание и цифры. Не входящие в этот набор символы, допустим, буквы кириллицы использовать можно, но, скорее всего, ссылка изменится.
Порядок, по которому обрабатывается URL адрес:
- Ссылка, состоящая из потенциально допустимых символов, кодируется в Юникод и создаётся адрес.
- Ссылка, в которой содержатся сторонние символы, также кодируется, но двухбайтовые последовательности интерпретируются в шестнадцатеричный код, отделяющийся знаком процента.
Воочию можно было увидеть верно зашифрованный URL в старых версиях браузеров. В наше время на экране показываются символы, которые легко прочитать, то есть кодируются они лишь для внутреннего обмена. Правда, копируя адрес из браузера в любой текстовый редактор, возникают некоторые проблемы, так как он не может трансформировать код. Переслать кому-либо изначально эстетичную ссылку не выйдет.
Укороченные URL
Иногда наблюдается такое, что появляются сокращённые, похожие ссылки, перенаправляющие на разные сайты. Это короткие URL адреса.
Чтобы их сгенерировать, нужно обратиться к сервисам особого назначения. Это удобно, когда есть необходимость дать короткий URL адрес. Сервис перенаправляет юзера по данному URL, тем самым он выступает как проводник с коротким наименованием.
В пример возьмём сервис Goo-gl, который лучше всего и главное надёжно сокращает ссылки. Его разработала компания Google, поэтому у него есть удобные в использовании аналитические инструменты.
Для конвертации необходимо только ввести адрес нужного сайта и Goo-gl самостоятельно предоставит укороченную ссылку.
Усовершенствование URL
Сервер может оптимизировать адрес, используя средства конфигурации. Это довольно важный момент.
Нужно обязательно подготовить веб-узел для ЧПУ ссылок — они выражают устройство сайта в правильном виде.
Если используется CMS, значит, модуль SEO-ссылок присутствует. В случае если проект был написан самостоятельно, то создать ЧПУ-шлюз вручную. Тут приходит на помощь связка .htaccess mod_rewrite rules + PHP.
- Ведущие фразы в адресе нужно вписывать с помощью латиницы. Чтобы это сделать, нужно взять слово или выражение, перетранслировать его в латиницу и затем использовать в качестве URL. Так делается SEO-оптимизация.
- GET параметры лучше не передавать, если от них зависит отдача статики. Стоит наладить сервер так, чтобы ЧПУ-шлюз обрабатывал и по возможности редактировал содержание по простому узнаваемому наименованию адреса, а не через GET-данные.
- Слова необходимо разделять конкретным символом под названием дефис. Это рекомендует сам Google.
- Хоть иерархия папок очень важна, но не стоит ими переполнять сайт. Если предоставляется такая возможность, то постарайтесь все статьи переадресовать в центральную директорию.
- Комбинировать заглавные и прописные буквы не нужно. Лучше всего писать ссылки маленькими буквами. Ибо велика вероятность возникновения повторов при поиске.
- От дубликатов можно избавиться с помощью robots.txt.
- Хорошо, когда для страниц применяется канонический URL. В этом случае исключается возможность повторения одинакового содержания.