Основные функции поисковых машин: Поисковая машина — компьютерная система для поиска информации

Поисковая машина — компьютерная система для поиска информации



А
Б
В
Г
Д
Е
Ё
Ж
З
И
Й
К
Л
М
Н
О
П
Р
С
Т
У
Ф
Х
Ц
Ч
Ш
Щ
Ъ
Ы
Ь
Э
Ю
Я



A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
0-9

П

Поисковая машина (движок) – это программная часть поисковой системы, которая используется для сбора, обработки и представления данных пользователю. Именно эта часть составляет основу поисковых систем, которая отличает одну систему от другой.

Составляющие элементы

Поисковая машина состоит из трех основных элементов, которые в совокупности с аппаратной частью и интерфейсом пользователя ПС делают возможной ее работу.

Поисковый робот. Также может называться ботом, пауком или краулером. Его задача – постоянно обходить все известные ему сайты в поисках ссылок на новые, еще неизвестные ему страницы. Проверяя таким образом Всемирную Паутину, робот выполняет две важнейшие функции: вносит в кеш поисковой системы вновь созданные веб-документы, а также регистрирует и переносит на сервера ПС изменения на уже известных ему страницах. Он фиксирует также элементы, необходимые для корректного ранжирования сайтов – в частности, обратные ссылки и ссылки внутри одного сайта. Существует разновидность паука, которую обычно называют «быстробот» – это робот, обходящий ограниченное количество быстро обновляющихся сайтов (к примеру новостных), чтобы поисковая система показывала в выдаче самые свежие документы.

Алгоритм ранжирования. Алгоритм ранжирования – это формула, которая учитывает огромное количество параметров запроса и известных поисковой системе сайтов с тем, чтобы формировать максимально полезную пользователю органическую выдачу в зависимости от его интересов. В современных поисковых машинах алгоритм является самообучающимся – то есть он способен учитывать изменяющиеся факторы и самостоятельно присваивать им больший или меньший вес.

Синонимы:
Поисковая система

Все термины на букву «П»


Все термины в глоссарии

(Голосов: 4, Рейтинг: 5)

Что такое поисковая машина?

Что такое поисковая машина?

Поисковая машина – это веб-сервер, основной задачей которого является пессимизация, осуществление поиска и индексации информации в Интернете релевантной запросу пользователя, задаваемого текстовой фразой или изображением.

Получая текстовый запрос, поисковая машина выдает список ссылок и документов с соответствующим контентом. До получения данного контента пользователем, поисковой робот индексирует страницы (например, по title, h2 и так далее) и ранжирует их в соответствии с релевантностью запросу пользователя.

Поисковой машиной или движком называют основу, программную часть любой поисковой системы, применяемую для сбора, обработки и передачи данных пользователю. Именно этой частью одна поисковая система отличается от другой.

Каждая поисковая машина имеет составляющие элементы, которые гарантируют ее бесперебойную и точную работу совместно с аппаратной частью и интерфейсом пользователя.

  • Поисковый робот или бот. Также его называют пауком или краулером. Задача бота — находить ссылки на новые, неизвестные страницы на запущенных сайтах. Робот выполняет две основные функции: вносит в кеш системы новые созданные веб-страницы; регистрирует и передает на сервер изменения на уже известных страницах. Поисковой робот корректно отражает элементы для правильного ранжирования сайтов. К примеру, именно боты работают с обратными ссылками и ссылками внутри сайта. Выделяют «быстроботы» или роботы, находящие ограниченное количество обновляющихся сайтов. Благодаря им поисковая система выдает самые актуальные новости и документы.
  • Алгоритм ранжирования не элемент, а формула. Она необходима поисковой системе для того, чтобы находить максимально корректную информацию на запрос пользователя. Формула учитывает огромное количество параметров запроса. Современные поисковые машины используют самообучающийся алгоритм, который способен учитывать факторы в динамике, самостоятельно присваивая им большое или меньшее значение.

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь
спрашивать, мы не кусаемся!

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь
спрашивать, мы не кусаемся!

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь
спрашивать, мы не кусаемся!

  • Беларусь

  • Россия

  • Другие

СПАСИБО, ЧТО ДОВЕРИЛИСЬ НАМ!

Мы вас не подведём! Наш менеджер перезвонит в течение часа, чтобы обсудить всё, что вам интересно. Не бойтесь
спрашивать, мы не кусаемся!

  • Беларусь

  • Россия

  • Другие

При нахождении на сайте Вы соглашаетесь с политикой обработки персональных данных.

Всё понятно!

Основные функции поисковых систем — Proth Search Software

Блог

Работа в Интернете — очень увлекательное занятие. Потому что вам никогда не будет скучно, когда вы смотрите на экран, полный интересного и качественного контента. Вы можете получить доступ ко всем видам информации в короткие сроки. Уникально то, что информация не устарела, даже несмотря на то, что она циркулировала до тех пор, пока не была заморожена в течение месяцев или лет.
Вы наверняка слышали термин поисковая система (Search Engine). Конечно, эти инструменты доступны на всех интернет-сайтах, но основным из них является Google. Что интересно, вы просто вводите ключевое слово (Keyword), позже появляются результаты, которые вы вводите. И тогда вы можете свободно выбирать, к какому контенту переходить на каждом сайте.

В последнее время многие пользователи сайта активно используют поисковые системы. Это потому, что функция машины очень сильно начинается с записи, индексации и регистрации его личного веб-сайта, чтобы он появился в библиотеке Google. Короче говоря, ниже мы просочили некоторые функции машины, в том числе;

  1. Индексирование веб-сайтов в Google
    Одной из наиболее важных функций поисковой системы является индексирование веб-сайта в Google. Сканеры и боты на этих машинах будут идентифицировать контент, адреса и домены, чтобы они отображались в библиотеке Google. Опытные игроки знают, как сделать свой сайт легко узнаваемым для Google и всех пользователей.
    В последнее время они оптимизируют использование поисковой оптимизации (SEO). Потому что таким образом их домен все равно будет транслироваться на первой странице. Те из вас, у кого есть блог или веб-сайт, но еще не проиндексированы, не расстраивайтесь. Потому что сейчас есть много туториалов, как быстро и бесплатно зарегистрировать сайт на странице Google.
  2. Облегчить пользователям поиск
    Вторая функция поисковой системы — упростить пользователям процесс поиска. Они постоянно ищут различный контент каждый день. До сих пор все страны делегируют работу по серфингу в Интернете. Каждую секунду выполняется не менее 50 тысяч поисковых запросов.
    Google — очень полезная машина для всех. Потому что до сих пор существует множество веб-сайтов, которые каждый день активно публикуют различный контент. Таким образом, вы никогда не исчерпаете информацию во время просмотра машины.
  3. Превратить Google в средство маркетинга
    Другая наиболее популярная функция — сделать Google средством маркетинга. Давайте просто скажем, что вы один из пользователей Интернета, которые ищут основные потребности, такие как одежда. Конечно, вам просто нужно ввести название предмета или категории, чтобы получить нужный предмет. Потому что пока онлайн бизнес более перспективен, чем обычный бизнес.
    На автомате предлагается не только одежда, но и все самое необходимое и не очень. Несколько производителей сотрудничают с дистрибьюторами и торговыми посредниками для продвижения своих новейших продуктов. Потому что в настоящее время пользователей Интернета становится больше с каждым днем. И это положительная сторона для собственника компании, потому что она приносит прибыль. Между тем потребителям легче достать товар.
    Такова основная функция поисковых систем, которую вы должны знать. В настоящее время количество пользователей поисковой системы Google увеличивается, потому что каждый день появляется много качественного контента и информации. Так что не удивляйтесь, если виртуальный мир интереснее реального.

Как работают поисковые системы?

Статья обновлена ​​Джоэлом Ли 10.10.2017

Для многих Google — это Интернет. Это отправная точка для поиска новых сайтов и, возможно, самое важное изобретение со времен самого Интернета. Без поисковых систем новый веб-контент был бы недоступен для широких масс.

Но знаете ли вы, как работают поисковые системы? Каждая поисковая система выполняет три основные функции: сканирование (для обнаружения контента), индексирование (для отслеживания и хранения контента) и извлечение (для извлечения релевантного контента, когда пользователи запрашивают поисковую систему).

Ползание

Сканирование — это то, с чего все начинается: сбор данных о веб-сайте.

Это включает в себя сканирование сайтов и сбор информации о каждой странице: заголовки, изображения, ключевые слова, другие связанные страницы и т.  д. Различные поисковые роботы также могут искать разные сведения, например макеты страниц, размещение рекламы, количество ссылок и т. д.

Но как сканируется веб-сайт? Автоматизированный бот (называемый «паук») посещает страницу за страницей как можно быстрее, используя ссылки на страницы, чтобы найти, куда идти дальше. Даже в первые дни пауки Google могли читать несколько сотен страниц в секунду. В наше время это тысячи.

Когда веб-сканер посещает страницу, он собирает все ссылки на странице и добавляет их в свой список следующих страниц для посещения. Он переходит к следующей странице в своем списке, собирает ссылки на эту страницу и повторяет. Поисковые роботы также время от времени пересматривают прошлые страницы, чтобы увидеть, произошли ли какие-либо изменения.

Это означает, что любой сайт, на который есть ссылка с проиндексированного сайта, в конечном итоге будет просканирован. Некоторые сайты сканируются чаще, а некоторые — более глубоко, но иногда сканер может сдаться, если иерархия страниц сайта слишком сложна.

Один из способов понять, как работает поисковый робот, — создать его самостоятельно. Мы написали руководство по созданию базового поискового робота на PHP, так что ознакомьтесь с ним, если у вас есть опыт программирования.

Обратите внимание, что страницы могут быть помечены как «noindex», что похоже на просьбу поисковых систем пропустить их индексацию. Неиндексируемые части Интернета известны как «глубокая сеть», а некоторые сайты, например, размещенные в сети TOR, не могут быть проиндексированы поисковыми системами. (Что такое TOR и луковая маршрутизация?)

Индексация

Индексирование — это обработка данных сканирования и помещение их в базу данных.

Представьте составляете список всех книг, которыми вы владеете, их издателей, авторов, жанров, количества страниц и т. д. Сканирование – это когда вы просматриваете каждую книгу, а индексирование – когда вы записываете их в свой список.

А теперь представьте, что это не просто комната, полная книг, а каждая библиотека в мире. Это небольшая версия того, что делает Google, который хранит все эти данные в огромных центрах обработки данных с дисками на тысячи петабайт.

Вот загляните внутрь одного из поисковых дата-центров Google:

Кредит изображения: Google

Поиск и ранжирование

Извлечение — это когда поисковая система обрабатывает ваш поисковый запрос и возвращает наиболее релевантные страницы, соответствующие вашему запросу.

Большинство поисковых систем отличаются друг от друга методами поиска: они используют разные критерии, чтобы выбирать, какие страницы лучше всего соответствуют тому, что вы хотите найти. Вот почему результаты поиска в Google и Bing различаются, и вот почему Wolfram Alpha так уникально полезен.

Алгоритмы ранжирования проверяют ваш поисковый запрос на миллиардах страниц, чтобы определить релевантность каждой из них. Компании охраняют свои алгоритмы ранжирования как запатентованные отраслевые секреты из-за их сложности. Лучший алгоритм означает лучший поиск.

Они также не хотят, чтобы создатели веб-сайтов играли с системой и несправедливо поднимались на вершины результатов поиска. Если бы внутренняя методология поисковой системы когда-нибудь стала известна, самые разные люди наверняка воспользовались бы этим знанием в ущерб таким поисковикам, как вы и я.

Кредит изображения: photovibes через Shutterstock

Эксплуатация поисковой системы , конечно, возможна, но это уже не так просто.

Первоначально поисковые системы ранжировали сайты по частоте появления ключевых слов на странице, что приводило к «заполнению ключевыми словами» — заполнению страниц ерундой с большим количеством ключевых слов.

Затем появилась концепция важности ссылок: поисковые системы ценили сайты с большим количеством входящих ссылок, потому что интерпретировали популярность сайта как релевантность. Но это привело к спаму ссылок по всему Интернету. В настоящее время поисковые системы взвешивают ссылки в зависимости от «авторитета» ссылающегося сайта. Поисковые системы придают большее значение ссылкам от государственных учреждений, чем ссылкам из каталога ссылок.

Сегодня алгоритмы ранжирования окутаны большей тайной, чем когда-либо прежде, и «поисковая оптимизация» не так важна. Хороший рейтинг в поисковых системах теперь зависит от высококачественного контента и отличного пользовательского опыта.

Что дальше для поисковых систем?

А, теперь интересный вопрос. Ответ — «семантика»: означает содержимого страницы. Вы можете прочитать больше об этом в нашем обзоре семантической разметки и ее влиянии на будущее.

Но вот суть.

Прямо сейчас вы можете выполнить поиск по запросу «безглютеновое печенье», но в результатах могут появиться рецепты безглютенового печенья. Вместо этого вы можете найти обычные рецепты печенья с надписью «Этот рецепт не содержит глютена». У него правильные ключевые слова, но неправильное значение.

С помощью семантики вы можете искать рецепты печенья, а затем удалять определенные ингредиенты: муку, орехи и т.

This entry was posted in Популярное