Mozilla/5.0 (compatible; YandexAccessibilityBot/3.0; +http://yandex.com/bots) | Скачивает страницы для проверки их доступности пользователям. Его максимальная частота обращений к сайту составляет 3 обращения в секунду. Робот игнорирует настройку в интерфейсе Яндекс Вебмастера. | Нет |
Mozilla/5.0 (compatible; YandexAdNet/1.0; +http://yandex.com/bots) | Робот Рекламной сети Яндекса. | Да |
Mozilla/5.0 (compatible; YandexBlogs/0.99; robot; +http://yandex.com/bots) | Робот поиска по блогам, индексирующий комментарии постов. | Да |
Mozilla/5. 0 (compatible; YandexBot/3.0; +http://yandex.com/bots) | Основной индексирующий робот. | Да |
Mozilla/5.0 (compatible; YandexBot/3.0; MirrorDetector; +http://yandex.com/bots) | Определяющий зеркала сайтов. | Да |
Mozilla/5.0 (compatible; YandexCalendar/1.0; +http://yandex.com/bots) | Робот Яндекс Календаря. Скачивает файлы календарей по инициативе пользователей, которые часто располагаются в запрещенных для индексации каталогах. | Нет |
Mozilla/5.0 (compatible; YandexDialogs/1.0; +http://yandex.com/bots) | Отправляет запросы в навыки Алисы. | Нет |
Mozilla/5. 0 (compatible; YandexDirect/3.0; +http://yandex.com/bots) | Скачивает информацию о контенте сайтов-партнеров Рекламной сети Яндекса, чтобы уточнить их тематику для подбора релевантной рекламы. | Нет |
Mozilla/5.0 (compatible; YandexDirectDyn/1.0; +http://yandex.com/bots | Генерирует динамические баннеры. | Нет |
Mozilla/5.0 (compatible; YandexFavicons/1.0; +http://yandex.com/bots) | Скачивает файл фавиконки сайта для отображения в результатах поиска. | Нет |
Mozilla/5.0 (compatible; YaDirectFetcher/1.0; Dyatel; +http://yandex.com/bots) | Скачивает целевые страницы рекламных объявлений для проверки их доступности и уточнения тематики. Это необходимо для размещения объявлений в поисковой выдаче и на сайтах-партнерах. | Нет. Робот не использует файл robots.txt, поэтому игнорирует директивы, установленные для него. |
Mozilla/5.0 (compatible; YandexForDomain/1.0; +http://yandex.com/bots) | Робот почты для домена, используется при проверке прав на владение доменом. | Да |
Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots) | Индексирует изображения для показа на Яндекс Картинках. | Да |
Mozilla/5.0 (compatible; YandexImageResizer/2.0; +http://yandex.com/bots) | Робот мобильных сервисов. | Да |
Mozilla/5. 0 (iPhone; CPU iPhone OS 8_1 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12B411 Safari/600.1.4 (compatible; YandexMobileBot/3.0; +http://yandex.com/bots) | Определяет страницы с версткой, подходящей под мобильные устройства. | Нет |
Mozilla/5.0 (compatible; YandexMarket/1.0; +http://yandex.com/bots) | Робот Яндекс Маркета. | Да |
Mozilla/5.0 (compatible; YandexMarket/2.0; +http://yandex.com/bots) | Нет | |
Mozilla/5.0 (compatible; YandexMedia/3.0; +http://yandex.com/bots) | Индексирует мультимедийные данные. | Да |
Mozilla/5. 0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots yabs01) | Скачивает страницы сайта для проверки их доступности, в том числе проверяет целевые страницы объявлений Яндекс Директа. | Нет. Робот не использует файл robots.txt, поэтому игнорирует директивы, установленные для него. |
Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots) | Робот Яндекс Метрики. | Нет |
Mozilla/5.0 (compatible; YandexMetrika/3.0; +http://yandex.com/bots) | Нет | |
Mozilla/5.0 (compatible; YandexMetrika/4.0; +http://yandex.com/bots) | Робот Яндекс Метрики. Скачивает и кэширует CSS-стили для воспроизведения страниц сайта в Вебвизоре. | Нет. Робот не использует файл robots.txt, поэтому игнорирует директивы, установленные для него. |
Mozilla/5.0 (compatible; YandexMobileScreenShotBot/1.0; +http://yandex.com/bots) | Делает снимок мобильной страницы. | Нет |
Mozilla/5.0 (compatible; YandexNews/4.0; +http://yandex.com/bots) | Робот Яндекс Новостей. | Да |
Mozilla/5.0 (compatible; YandexOntoDB/1.0; +http://yandex.com/bots) | Робот объектного ответа. | Да |
Mozilla/5.0 (compatible; YandexOntoDBAPI/1.0; +http://yandex.com/bots) | Робот объектного ответа, скачивающий динамические данные. | Нет |
Mozilla/5.0 (compatible; YandexPagechecker/1.0; +http://yandex.com/bots) | Обращается к странице при валидации микроразметки через форму Валидатор микроразметки. | Да |
Mozilla/5.0 (compatible; YandexPartner/3.0; +http://yandex.com/bots) | Скачивает информацию о контенте сайтов-партнеров Яндекса | Нет |
Mozilla/5.0 (compatible; YandexRCA/1.0; +http://yandex.com/bots) | Собирает данные для формирования превью. Например, для расширенного отображения сайта в поиске. | Нет |
Mozilla/5.0 (compatible; YandexRenderResourcesBot/1. 0; +http://yandex.com/bots) | Загружает ресурсы для рендеринга страницы с JavaScript. Игнорирует указания в robots.txt, если HTML-страница, на которой эти ресурсы размещены, доступна для робота Яндекса. Робот не обращается к ресурсам, если в robots.txt запрещены HTML-страницы, где эти ресурсы используются. | Нет |
Mozilla/5.0 (compatible; YandexSearchShop/1.0; +http://yandex.com/bots) | Скачивает YML-файлы каталогов товаров (по инициативе пользователей), которые часто располагаются в запрещенных для индексации каталогах. | Нет |
Mozilla/5.0 (compatible; YandexSitelinks; Dyatel; +http://yandex.com/bots) | Проверяет доступность страниц, которые используются в качестве быстрых ссылок. | Да |
Mozilla/5.0 (compatible; YandexSpravBot/1.0; +http://yandex.com/bots) | Робот Яндекс Бизнеса. | Да |
Mozilla/5.0 (compatible; YandexTracker/1.0; +http://yandex.com/bots) | Робот Яндекс Трекера. | Нет |
Mozilla/5.0 (compatible; YandexTurbo/1.0; +http://yandex.com/bots) | Обходит RSS-канал, созданный для формирования Турбо-страниц. Его максимальная частота обращений к сайту составляет 3 обращения в секунду. Робот игнорирует настройку в интерфейсе Яндекс Вебмастера и директиву Crawl-delay. | Да |
Mozilla/5. 0 (compatible; YandexUserproxy; robot; +http://yandex.com/bots) | Проксирует действия пользователей на сервисах Яндекса: отправляет запросы в ответ на нажатие кнопок, скачивает страницы для перевода онлайн и т. д. | Нет |
Mozilla/5.0 (compatible; YandexVertis/3.0; +http://yandex.com/bots) | Робот поисковых вертикалей. | Да |
Mozilla/5.0 (compatible; YandexVerticals/1.0; +http://yandex.com/bots) | Робот Яндекс Вертикалей: Авто.ру, Янекс.Недвижимость, Яндекс Работа, Яндекс Отзывы. | Да |
Mozilla/5.0 (compatible; YandexVideo/3.0; +http://yandex.com/bots) | Индексирует видео для показа в поиске Яндекса по видео. | Да |
Mozilla/5.0 (compatible; YandexVideoParser/1.0; +http://yandex.com/bots) | Индексирует видео для показа в поиске Яндекса по видео. | Нет |
Mozilla/5.0 (compatible; YandexWebmaster/2.0; +http://yandex.com/bots) | Робот Яндекс Вебмастера. | Да |
Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z* Safari/537.36 (compatible; YandexScreenshotBot/3.0; +http://yandex.com/bots) | Делает снимок страницы. | Нет |
ТОП 200 IP ботов Яндекса. Рейтинг YandexBot 2019
- Главная
- ТОП 200 IP ботов Яндекса
Для благих нужд (хотя смотря в чьих руках) необходимо знать IP адреса поисковых роботов, например для идентификации подлинности поискового робота (основного индексирующего робота), что его не «подделали» и запросы на сервер действительно выполняет робот Яндекса. Проверить IP адрес на принадлежность к поисковой системе можно в сервисе «Валидатор ботов».
Основываясь на данных логов сервера одного из сайтов я собрал IP адреса бота YandexBot за 19 месяцев
. Период актуальности: с 01.01.2019 по 31.07.2020
. В таблице не будет указываться кол-во запросов к серверу, так как для всех сайтов оно индивидуально и на мой взгляд в данном случае больше полезна оценка популярности одного по отношению к другому. Пояснение к колонкам:
- ТОП — ранжирование IP адресов по частоте запросов к серверу
- IP YandexBot — проверенный IP адрес, который принадлежит боту Яндекса и идентифицируется в логах сервера как «YandexBot»
- Доля активности — рассчитал исходя из общего кол-ва запросов к серверу всех IP адресов в таблице и индивидуального значения каждого. Тем самым, у какого IP больше процентное значение, тот больше всего производил запросов к серверу (так сказать самый «активный»).
Для наглядности в таблице выделен ТОП 10 самых часто используемых ботов Яндекса.
ТОП IP адресов YandexBot
ТОП | IP YandexBot | Доля активности |
---|---|---|
1 | 141.8.132.30 | 4,69% |
2 | 178.154.200.24 | 4,07% |
3 | 141.8.142.6 | 3,63% |
4 | 95.108.213.22 | 3,55% |
5 | 178.154.244.41 | 3,43% |
6 | 141.8.142.137 | 3,16% |
7 | 37.9.113.18 | 3,14% |
8 | 141.8.183.14 | 2,89% |
9 | 141.8.142.182 | 2,70% |
10 | 141.8.142.111 | 2,32% |
11 | 93.158.166.5 | 2,19% |
12 | 141.8.183.41 | 2,15% |
13 | 178.154.200.1 | 2,02% |
14 | 141.8.188.61 | 2,02% |
15 | 178. 154.200.130 | 1,94% |
16 | 5.45.207.60 | 1,86% |
17 | 178.154.200.10 | 1,63% |
18 | 141.8.188.67 | 1,60% |
19 | 141.8.183.8 | 1,59% |
20 | 178.154.200.245 | 1,57% |
21 | 141.8.188.41 | 1,52% |
22 | 141.8.142.130 | 1,52% |
23 | 213.180.203.118 | 1,47% |
24 | 213.180.203.78 | 1,41% |
25 | 178.154.171.156 | 1,41% |
26 | 93.158.166.11 | 1,35% |
27 | 178.154.200.59 | 1,30% |
28 | 178.154.200.60 | 1,23% |
29 | 141.8.189.2 | 1,19% |
30 | 87.250.224.92 | 1,10% |
31 | 95.108.213.60 | 1,04% |
32 | 178.154.200.8 | 1,04% |
33 | 213. 180.203.66 | 1,03% |
34 | 178.154.200.20 | 0,94% |
35 | 178.154.200.108 | 0,90% |
36 | 178.154.200.146 | 0,83% |
37 | 141.8.142.106 | 0,78% |
38 | 178.154.200.56 | 0,72% |
39 | 37.9.113.73 | 0,70% |
40 | 213.180.203.89 | 0,69% |
41 | 213.180.203.193 | 0,66% |
42 | 178.154.200.200 | 0,63% |
43 | 5.255.253.103 | 0,59% |
44 | 178.154.200.238 | 0,58% |
45 | 178.154.200.195 | 0,57% |
46 | 141.8.142.212 | 0,55% |
47 | 5.45.207.70 | 0,54% |
48 | 213.180.203.101 | 0,52% |
49 | 141.8.132.20 | 0,52% |
50 | 5.255.253.70 | 0,49% |
51 | 178. 154.200.75 | 0,49% |
52 | 87.250.224.67 | 0,47% |
53 | 178.154.200.62 | 0,46% |
54 | 213.180.203.60 | 0,44% |
55 | 213.180.203.61 | 0,44% |
56 | 213.180.203.6 | 0,40% |
57 | 5.45.207.103 | 0,38% |
58 | 178.154.200.58 | 0,38% |
59 | 178.154.200.217 | 0,37% |
60 | 5.45.207.16 | 0,37% |
61 | 178.154.200.45 | 0,36% |
62 | 213.180.203.39 | 0,34% |
63 | 95.108.181.43 | 0,33% |
64 | 141.8.142.162 | 0,33% |
65 | 213.180.203.72 | 0,32% |
66 | 178.154.200.216 | 0,29% |
67 | 178.154.200.116 | 0,29% |
68 | 178.154.200.30 | 0,29% |
69 | 178. 154.200.86 | 0,28% |
70 | 213.180.203.44 | 0,26% |
71 | 213.180.203.99 | 0,26% |
72 | 213.180.203.87 | 0,25% |
73 | 213.180.203.148 | 0,23% |
74 | 87.250.224.214 | 0,22% |
75 | 213.180.203.183 | 0,22% |
76 | 213.180.203.98 | 0,20% |
77 | 5.45.207.127 | 0,19% |
78 | 95.108.181.108 | 0,18% |
79 | 178.154.200.106 | 0,18% |
80 | 178.154.200.172 | 0,18% |
81 | 178.154.200.208 | 0,18% |
82 | 95.108.181.64 | 0,17% |
83 | 5.45.207.84 | 0,17% |
84 | 213.180.203.62 | 0,16% |
85 | 178.154.200.53 | 0,16% |
86 | 213.180.203.31 | 0,15% |
87 | 213. 180.203.68 | 0,14% |
88 | 213.180.203.76 | 0,14% |
89 | 178.154.200.2 | 0,14% |
90 | 178.154.200.203 | 0,14% |
91 | 178.154.200.26 | 0,13% |
92 | 213.180.203.110 | 0,12% |
93 | 87.250.224.212 | 0,12% |
94 | 213.180.203.189 | 0,12% |
95 | 213.180.203.97 | 0,12% |
96 | 141.8.142.44 | 0,11% |
97 | 178.154.200.109 | 0,10% |
98 | 213.180.203.176 | 0,10% |
99 | 213.180.203.57 | 0,10% |
100 | 213.180.203.192 | 0,10% |
101 | 178.154.200.99 | 0,10% |
102 | 178.154.200.160 | 0,10% |
103 | 178.154.200.114 | 0,09% |
104 | 178.154.200.87 | 0,09% |
105 | 178. 154.200.166 | 0,09% |
106 | 178.154.200.96 | 0,09% |
107 | 178.154.200.181 | 0,08% |
108 | 213.180.203.156 | 0,08% |
109 | 141.8.142.9 | 0,08% |
110 | 213.180.203.43 | 0,08% |
111 | 213.180.203.174 | 0,08% |
112 | 178.154.200.185 | 0,07% |
113 | 141.8.189.3 | 0,07% |
114 | 213.180.203.142 | 0,07% |
115 | 178.154.200.90 | 0,07% |
116 | 213.180.203.38 | 0,06% |
117 | 178.154.171.101 | 0,06% |
118 | 213.180.203.82 | 0,06% |
119 | 5.45.207.83 | 0,06% |
120 | 178.154.200.233 | 0,06% |
121 | 95.108.213.59 | 0,06% |
122 | 178.154.200.57 | 0,06% |
123 | 178. 154.200.84 | 0,06% |
124 | 178.154.200.144 | 0,06% |
125 | 213.180.203.79 | 0,06% |
126 | 213.180.203.94 | 0,06% |
127 | 213.180.203.200 | 0,06% |
128 | 37.9.113.141 | 0,06% |
129 | 93.158.166.17 | 0,06% |
130 | 213.180.203.121 | 0,06% |
131 | 178.154.200.25 | 0,06% |
132 | 213.180.203.30 | 0,06% |
133 | 5.45.207.66 | 0,06% |
134 | 213.180.203.151 | 0,06% |
135 | 87.250.224.74 | 0,06% |
136 | 213.180.203.122 | 0,06% |
137 | 37.9.113.66 | 0,05% |
138 | 178.154.200.79 | 0,05% |
139 | 178.154.200.4 | 0,05% |
140 | 213.180.203.29 | 0,05% |
141 | 178. 154.200.246 | 0,05% |
142 | 178.154.200.67 | 0,05% |
143 | 37.9.113.85 | 0,05% |
144 | 213.180.203.171 | 0,05% |
145 | 213.180.203.146 | 0,05% |
146 | 213.180.203.134 | 0,05% |
147 | 178.154.171.37 | 0,05% |
148 | 141.8.183.212 | 0,05% |
149 | 178.154.200.201 | 0,05% |
150 | 141.8.183.213 | 0,05% |
151 | 213.180.203.184 | 0,05% |
152 | 87.250.224.41 | 0,05% |
153 | 213.180.203.40 | 0,05% |
154 | 178.154.200.190 | 0,04% |
155 | 178.154.200.41 | 0,04% |
156 | 213.180.203.22 | 0,04% |
157 | 178.154.171.27 | 0,04% |
158 | 213.180.203.137 | 0,04% |
159 | 141. 8.142.214 | 0,04% |
160 | 213.180.203.45 | 0,04% |
161 | 178.154.200.118 | 0,04% |
162 | 213.180.203.167 | 0,04% |
163 | 93.158.166.10 | 0,04% |
164 | 37.9.113.100 | 0,04% |
165 | 213.180.203.36 | 0,04% |
166 | 178.154.244.67 | 0,04% |
167 | 213.180.203.90 | 0,04% |
168 | 141.8.183.214 | 0,04% |
169 | 178.154.200.153 | 0,04% |
170 | 213.180.203.145 | 0,04% |
171 | 213.180.203.11 | 0,04% |
172 | 178.154.200.188 | 0,04% |
173 | 141.8.142.25 | 0,04% |
174 | 213.180.203.117 | 0,04% |
175 | 178.154.200.7 | 0,04% |
176 | 95.108.213.20 | 0,04% |
177 | 141. 8.132.18 | 0,04% |
178 | 37.9.113.77 | 0,04% |
179 | 178.154.200.77 | 0,04% |
180 | 37.9.113.81 | 0,04% |
181 | 178.154.200.159 | 0,04% |
182 | 141.8.142.5 | 0,03% |
183 | 213.180.203.140 | 0,03% |
184 | 141.8.142.8 | 0,03% |
185 | 178.154.200.117 | 0,03% |
186 | 213.180.203.100 | 0,03% |
187 | 178.154.200.226 | 0,03% |
188 | 141.8.142.180 | 0,03% |
189 | 213.180.203.124 | 0,03% |
190 | 213.180.203.102 | 0,03% |
191 | 87.250.224.38 | 0,03% |
192 | 178.154.200.36 | 0,03% |
193 | 178.154.200.158 | 0,03% |
194 | 178.154.200.28 | 0,03% |
195 | 141. 8.183.16 | 0,03% |
196 | 178.154.200.65 | 0,03% |
197 | 213.180.203.108 | 0,03% |
198 | 178.154.171.51 | 0,03% |
199 | 178.154.200.47 | 0,03% |
200 | 178.154.200.16 | 0,03% |
В таблице указана доля активности запросов именно с User-Agent «YandexBot», но с этих же IP приходили и другие.
Разные User-Agent с одного IP
С этих же IP адресов могут поступать запросы от разных ботов, с разными User-Agent:
User-Agent | Частота вхождения |
---|---|
Mozilla/5.0 (compatible; YandexBot/3.0; +http://yandex.com/bots) | 94,55% |
Mozilla/5.0 (compatible; YandexImages/3.0; +http://yandex.com/bots) | 2,76% |
Mozilla/5.0 (compatible; YaDirectFetcher/1.0; +http://yandex.com/bots) | 1,72% |
Mozilla/5. 0 (compatible; YandexBot/3.0; +http://yandex.com/bots) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 | 0,430% |
Mozilla/5.0 (iPhone; CPU iPhone OS 8_1 like Mac OS X) AppleWebKit/600.1.4 (KHTML, like Gecko) Version/8.0 Mobile/12B411 Safari/600.1.4 (compatible; YandexMobileBot/3.0; +http://yandex.com/bots) | 0,326% |
Mozilla/5.0 (compatible; YandexDirectDyn/1.0; +http://yandex.com/bots) | 0,101% |
Mozilla/5.0 (compatible; YandexMetrika/2.0; +http://yandex.com/bots yabs01) | 0,078% |
Mozilla/5.0 (compatible; YandexTurbo/1.0; +http://yandex.com/bots) | 0,019% |
Mozilla/5.0 (compatible; YandexAccessibilityBot/3.0; +http://yandex.com/bots) | 0,010% |
Mozilla/5.0 (Windows NT 6.2; WOW64) AppleWebKit/536.5 (KHTML, like Gecko) YaBrowser/1.0.1084.5402 Chrome/19.0.1084.5409 Safari/536.5 | 0,002% |
Mozilla/5. 0 (compatible; YaDirectFetcher/1.0; Dyatel; +http://yandex.com/bots) | 0,0005% |
Mozilla/5.0 (compatible; YandexMetrika/3.0; +http://yandex.com/bots) | 0,0003% |
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.97 Safari/537.36 | 0,0002% |
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.106 Safari/537.36 | 0,000103% |
Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:37.0) Gecko/20100101 Firefox/37.0 | 0,000056% |
Mozilla/5.0 (Linux; Android 6.0.1; SM-G570F Build/MMB29K) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/59.0.3071.125 Mobile Safari/537.36 (compatible; YandexMetrika/3.0; +http://yandex.com/bots) | 0,000053% |
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.78 Safari/537.36 (compatible; YandexMetrika/3. 0; +http://yandex.com/bots) | 0,000050% |
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36 | 0,000048% |
Mozilla/5.0 (compatible; YandexMetrika/4.0; +http://yandex.com/bots) | 0,000036% |
Mozilla/5.0 (compatible; YandexBot/3.0; MirrorDetector; +http://yandex.com/bots) | 0,000031% |
Mozilla/5.0 (compatible; YandexRCA/1.0; +http://yandex.com/bots) | 0,000028% |
Mozilla/5.0 (compatible; YandexDirect/3.0; +http://yandex.com/bots) | 0,000013% |
Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.89 Safari/537.36 | 0,0000094% |
Mozilla/5.0 (compatible; YandexWebmaster/2.0; +http://yandex.com/bots) | 0,0000079% |
Mozilla/5.0 (compatible; YandexVideoParser/1.0; +http://yandex.com/bots) | 0,0000025% |
Mozilla/5. 0 (compatible; YandexPagechecker/2.0; +http://yandex.com/bots) | 0,0000010% |
Mozilla/5.0 (compatible; YandexMarket/2.0; +http://yandex.com/bots) | 0,0000005% |
Сюрприз для тех, кто дошел до конца страницы — скисок всех IP адресов YandexBot (1023 шт.), о которых мне было известно.
Mozilla/5.0 (совместимо; YandexAccessibilityBot/3.0; +http://yandex.com/bots) | YandexAccessibilityBot загружает страницы для проверки их доступности для пользователей. Отправляет до 3 запросов на сайт в секунду. Робот игнорирует настройку в интерфейсе Яндекс.Вебмастера. | Нет | |
Mozilla/5.0 (совместимо; YandexAdNet/1.0; +http://yandex.com/bots) | Робот рекламной сети Яндекса. | Да | |
Mozilla/5.0 (совместимый; YandexBlogs/0.99; robot; +http://yandex.com/bots) | Поисковый робот по блогам, который индексирует комментарии к сообщениям. | Да | |
Mozilla/5.0 (совместимо; YandexBot/3.0; +http://yandex.com/bots) | Основной робот-индексатор. | Да | |
Mozilla/5.0 (совместимый; YandexBot/3.0; MirrorDetector; +http://yandex.com/bots) | Обнаружение зеркал сайта. | Да | |
Mozilla/5.0 (совместимый; YandexCalendar/1.0; +http://yandex.com/bots) | Робот Яндекс. Календаря. Загружает файлы календаря по запросам пользователей. Эти файлы часто находятся в каталогах, индексация которых запрещена. | Нет | |
Mozilla/5.0 (совместимо; YandexDirect/3.0; +http://yandex.com/bots) | Загружает информацию о содержании сайтов-партнеров Рекламной сети Яндекса для определения их тематических категорий в соответствии с релевантной рекламой . | Нет | |
Mozilla/5.0 (совместимо; YandexDirectDyn/1.0; +http://yandex.com/bots | Генерирует динамические баннеры. +http://yandex.com/bots) | Загружает файл фавикона сайта для отображения в результатах поиска | Нет |
Mozilla/5. 0 (совместимо; YaDirectFetcher/1.0; Dyatel; +http://yandex. com/bots) | Загружает целевые страницы объявлений для проверки их наличия и тематики.Это необходимо для размещения объявлений в результатах поиска и на партнерских сайтах. | Нет. Робот не использует файл robots.txt и игнорирует заданные для него директивы. | |
Mozilla/5.0 (совместимый; YandexForDomain/1.0; +http://yandex.com/bots) | Робот Яндекс.Почты для домена, используемый для проверки прав владения доменом. | Да | |
Mozilla/5.0 (совместимо; YandexImages/3.0; +http://yandex.com/bots) | Индексирует изображения для отображения в Яндекс.Изображениях. | Да | |
Mozilla/5. 0 (совместимый; YandexImageResizer/2.0; +http://yandex.com/bots) | Робот мобильных устройств. | Да | |
Mozilla/5.0 (iPhone; ЦП iPhone OS 8_1, например Mac OS X) AppleWebKit/600.1.4 (KHTML, например Gecko) Версия/8.0 Mobile/12B411 Safari/600.1.4 (совместимый; YandexMobileBot/3.0 ; +http://yandex.com/bots) | Определяет страницы с макетом, подходящим для мобильных устройств. | Нет | |
Mozilla/5.0 (совместимо; ЯндексМаркет/1.0; +http://yandex.com/bots) | Робот Яндекс.Маркета. | Да | |
Mozilla/5.0 (совместимо; YandexMarket/2.0; +http://yandex.com/bots) | Нет | ||
Mozilla/5. 0 (совместимо; YandexMedia/3.0; +http:// yandex.com/bots) | Индексирует мультимедийные данные. | Да | |
Mozilla/5.0 (совместимо; ЯндексМетрика/2.0; +http://yandex.com/bots yabs01) | Загружает страницы сайта для проверки их доступности, в том числе целевые страницы объявлений Яндекс.Директа. | Нет. Робот не использует файл robots.txt и игнорирует заданные для него директивы. | |
Mozilla/5.0 (совместимо; ЯндексМетрика/2.0; +http://yandex.com/bots) | Робот Яндекс.Метрики. | № | |
Mozilla/5.0 (совместимо; ЯндексМетрика/3.0; +http://yandex.com/bots) | № | ||
Mozilla/5. 0 (совместимо; ЯндексМетрика/4.0; +http:// yandex.com/bots) | Робот Яндекс.Метрики. Загружает и кэширует стили CSS для отображения страниц сайта в Webvisor. | Нет. Робот не использует файл robots.txt и игнорирует заданные для него директивы. | |
Mozilla/5.0 (совместимо; YandexMobileScreenShotBot/1.0; +http://yandex.com/bots) | Делает скриншот мобильной страницы. | Нет | |
Mozilla/5.0 (совместимо; YandexNews/4.0; +http://yandex.com/bots) | Робот Яндекс.Новости. | Да | |
Mozilla/5.0 (совместимый; YandexOntoDB/1.0; +http://yandex.com/bots) | Робот реагирования объекта. | Да | |
Mozilla/5.0 (совместимый; YandexOntoDBAPI/1.0; +http://yandex.com/bots) | Объектно-ответный робот, загружающий динамические данные. | Нет | |
Mozilla/5.0 (совместимо; YandexPagechecker/1.0; +http://yandex.com/bots) | Доступ к странице для проверки микроразметки через валидатор структурированных данных. | Да | |
Mozilla/5.0 (совместимо; YandexPartner/3.0; +http://yandex.com/bots) | Загружает информацию о содержании сайтов-партнеров Яндекса. | Нет | |
Mozilla/5.0 (совместимо; YandexRCA/1. 0; +http://yandex.com/bots) | Собирает данные для создания превью. Например, предварительный просмотр мастера. | Нет | |
Mozilla/5.0 (совместимо; YandexSearchShop/1.0; +http://yandex.com/bots) | Загружает каталоги товаров в YML-файлах по запросам пользователей. Эти файлы часто размещаются в каталогах, запрещенных для индексации. | Нет | |
Mozilla/5.0 (совместимо; YandexSitelinks; Дятел; +http://yandex.com/bots) | Проверяет наличие страниц, используемых в качестве быстрых ссылок. | Да | |
Mozilla/5.0 (совместимо; ЯндексСправБот/1.0; +http://yandex.com/bots) | Робот Яндекс. Бизнес. | Да | |
Mozilla/5.0 (совместимо; ЯндексТрекер/1.0; +http://yandex.com/bots) | Робот Яндекс.Трекер. | Нет | |
Mozilla/5.0 (совместимо; YandexTurbo/1.0; +http://yandex.com/bots) | Сканирует RSS-канал, созданный для создания Турбо-страниц. Он отправляет до 3 запросов на сайт в секунду. Робот игнорирует настройки в интерфейсе Яндекс.Вебмастера и директиву Crawl-delay. | Да | |
Mozilla/5.0 (совместимо; YandexVertis/3.0; +http://yandex.com/bots) | Поисковый робот по вертикали. | Да | |
Mozilla/5. 0 (совместимо; ЯндексВертикали/1.0; +http://yandex.com/bots) | Робот Яндекс.Вертикали: Авто.ру, Янекс.Недвижимость, Яндекс.Работа, Яндекс.Отзывы. | Да | |
Mozilla/5.0 (совместимый; ЯндексВидео/3.0; +http://yandex.com/bots) | Индексирует видеоклипы для отображения в Яндекс.Видео. | Да | |
Mozilla/5.0 (совместимый; YandexVideoParser/1.0; +http://yandex.com/bots) | Индексирует видеоклипы для отображения в Яндекс.Видео. | Нет | |
Mozilla/5.0 (совместимый; YandexWebmaster/2.0; +http://yandex.com/bots) | Робот Яндекс.Вебмастер. | Да | |
Mozilla/5. 0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, как Gecko) Chrome/W.X.Y.Z* Safari/537.36 (совместимый; YandexScreenshotBot/3.0; +http://yandex.com/bots) | Делает скриншот страницы. | Нет |
веб-приложение — Нужно ли блокировать Яндекс Бота?
спросил
Изменено
3 года, 2 месяца назад
Просмотрено
45 тысяч раз
У меня есть веб-приложение, к которому паук Яндекса пытается получить доступ несколько раз. После этих поисков пауков осталось несколько российских IP-адресов, которые также пытались получить доступ к серверной части, и им не удалось получить доступ.
Заблокировать Яндекс или предпринять другие действия?
Обновление:
Паук Яндекса посещает внутренний URL примерно раз в 2-3 дня. Мы не выпускали какие-либо внутренние URL-адреса во внешнем интерфейсе.
« back-end » означает:
интерфейс веб-приложения позволяет нашему администратору управлять приложением
- веб-приложение
- бот
8
Стоит ли заблокировать яндекс
Почему?
Во-первых, если бот является законным ботом поисковой системы (и ничем иным), вас не взломают. Если нет, блокировка агента пользователя не поможет, они просто будут использовать другой.
Если ваш пароль правильный, fail2ban настроен, программное обеспечение обновлено и т. д., просто дайте им попробовать. Если нет, вам нужно это исправить, независимо от ботов Яндекса.
Чтобы убедиться, что проблема действительно в Яндексе, попробуйте запретить его в robots.txt и посмотреть, остановится ли он.
Нет => не Яндекс.
(Несколько недель назад настроил новый веб-сервер. Через час после выхода в сеть, у которого еще не было даже домена, «гуглбот» начал пробовать SQL-инъекции для несуществующего WordPress. никаких других HTTP-запросов, но я не блокировал Google из-за этого.)
4
Наряду с согласием с ответом @deviantfan и конкретно с этим пунктом
Во-первых, если бот является законным ботом поисковой системы (и ничем иным), они вас не взломают. Если нет, блокировка агента пользователя не поможет, они просто будут использовать другой.
Я хотел бы отметить, что как Яндекс
, так и другие боты поисковых систем в целом могут намеренно не хотеть получить доступ к вашему серверу. Помните, что боты сканируют сайты, переходя по ссылкам, так что представьте, если бы злоумышленники поместили некоторые URL-адреса вашего бэкэнда на страницы какого-то другого веб-сайта, а поисковая система просто проиндексировала бы эти страницы и теперь пытается перейти по ссылкам оттуда. Таким образом, это будет выглядеть так, как будто поисковая система пытается получить доступ к вашему бэкенду, но она просто сканирует сеть: она не знает, что это ваш бэкэнд.
Подобное может произойти случайно. Допустим, пользователь, не разбирающийся в технологиях, разместил URL-адрес на каком-то форуме, который доступен только тогда, когда вы вошли в систему — при сканировании поисковая система попытается перейти по этим ссылкам, и вы в конечном итоге увидите журналы, как я предполагаю, что вы это сделали.
ОБНОВЛЕНИЕ: Я думаю, вы можете установить в своем правиле robots.txt, чтобы запретить yandex доступ к определенным URL-адресам. Кстати, вам лучше определить конкретное правило его именем, я не уверен, но может случиться так, что яндексбот может игнорировать User-agent: *
, так что вы можете сделать что-то вроде этого (в соответствии с вашими бэкенд-адресами)
User-agent: Яндекс Запретить: /admin/*
Таким образом, вы запретите ему пытаться получить доступ к внутренним URL-адресам, соответствующим этому шаблону, но в то же время он (yandexbot) сможет свободно сканировать другие страницы вашего сайта.
0
Не стоит блокировать легитимного бота Яндекса, но вы можете убедиться, что это действительно легитимный бот, а не кто-то, кто просто использует User-Agent Яндекса.
From: https://yandex.com/support/webmaster/robot-workings/check-yandex-robots.xml
- Определите IP-адрес рассматриваемого агента пользователя, используя журналы вашего сервера. Все роботы Яндекса представлены заданным агентом пользователя.
- Используйте обратный поиск DNS полученного IP-адреса, чтобы определить имя домена хоста.
- Определив имя хоста, вы можете проверить, принадлежит ли оно Яндексу. Все роботы Яндекса имеют имена, оканчивающиеся на «yandex.ru», «yandex.net» или «yandex.com». Если имя хоста имеет другое окончание, робот не принадлежит Яндексу.
- Наконец, убедитесь, что имя указано правильно. Используйте прямой поиск DNS, чтобы получить IP-адрес, соответствующий имени хоста. Он должен совпадать с IP-адресом, используемым при обратном поиске DNS. Если IP-адреса не совпадают, это означает, что имя хоста является поддельным.
Практически все крупные поисковые системы предоставляют аналогичные способы проверки User-Agent. Это работает потому, что кто-то может подделать обратный поиск DNS, но не прямой DNS этого поддельного адреса.
Хотя я согласен с ответом @deviantfan, я хотел бы добавить, что — поскольку ваш первоначальный вопрос звучит как путь в ад, я видел, как кто-то падал несколько лет назад — даже если вы попытаетесь полностью заблокировать паука, а не просто сказав, чтобы он ушел через robots.txt (что вы, вероятно, должны сделать для частей администратора в любом случае), вы закончите бесконечной игрой в придурки, в которой вы не сможете выиграть.
Несколько лет назад кто-то на другом сайте, о котором я читал, разглагольствовал о том, что Google/Microsoft/Yandex/и т. д. все «DDoSing» его веб-сайт. Судя по всему, сайт был «частным, и только несколько его друзей должны иметь доступ, и он не должен отображаться ни в каких поисковых системах». Однако очевидно, что по крайней мере один из его пользователей размещал ссылки на внутренние местоположения, которые находили различные веб-пауки. (В отличие от того, что они просто знают о www.whatever.tld из записей DNS.)
Человек, запустивший его, решил, что иметь файл robots.txt, чтобы поисковые роботы, которые находили ссылки на него, просто читали файл и уходили, было неприемлемо. Им нужно было навсегда игнорировать его сайт и никогда больше к нему не прикасаться ни при каких обстоятельствах. (Он так и не дал разумного объяснения, почему это был единственный приемлемый вариант. Очевидно, что-то делали с теми, кто размещал ссылки на внутренние местоположения на его сайте, которые находили пауки, или просто требовал аутентификации, чтобы боты просто сбрасывались на страница входа без содержания.)
Вместо этого он просто начал заносить в черный список все IP-адреса веб-пауков, чтобы любые попытки запроса, которые они делали, истекали без ответа. Сделав это, он обнаружил, что вместо того, чтобы перейти по одной ссылке, чтобы получить файл robots.