Все словоформы: Как получить все словоформы слова? — Хабр Q&A

Как собрать все словоформы поисковых запросов (фразы с разными окончаниями и падежами) для расширенного семантического ядра?

Данный вопрос — приоритетный!

Антон:

Здравствуйте!

У меня вопрос по поводу ответа на вопрос https://pixelplus.ru/samostoyatelno/otvety-na-voprosy/semanticheskoe-yadro/257117.html.

Если мы снимаем KeyCollector’ом шлейф запросов по фразе [строительство домов], вне зависимости от региона, то в результате будет найден запрос [строительство загородных домов под ключ], однако не будет запроса [строительство загороднОГО домА под ключ].

То есть мы не получим подобные словоформы по запросам.

Как быть?

Приветствую, Антон.

В данном случае, на практике оказывается эффективным следующий подход к решению данной задачи:

  • Для начала работ собирается основная семантика, то есть это, как правило, лишь одна форма запроса: фиксированный порядок слов, фиксированные окончания у слов из фразы, лишь один вариант предлога и т. д.

  • Производится поисковая оптимизация так, как будто вообще существует только этот порядок слов и этот вариант окончаний у фразы и т.п.

  • Далее (по прошествии 2-4 месяцев работы) по статистике заходов на сайт (Метрика и Аналитика) или по статистике показов в результатах выдачи (панель Вебмастера) выявляются дополнительные варианты окончаний и порядка слов в запросе.

    Новые варианты написания фразы (другие окончания, порядок слов) добавляются к семантике и мониторингу.

Данный подход во многом оправдан, так как позволяет удобней работать с семантикой и, как правило, находит именно основной вариант окончания фразы и порядка слов в ней.

Перевес от одного варианта написания к другому, может меняться в зависимости от подсказок в поисковой системе и других факторов, но в большом числе случаев основная фраза будет иметь доминирующий характер.

Да и правильное продвижение по основной фразе, почти всегда приводит к выводу в ТОП-10 и второстепенных вариантов написания.

На вашем примере данное соотношение частот составляет 5.6 к 1:

  • [строительство загороднОГО домА под ключ] — 236 показов в месяц
  • [строительство загороднЫХ домОВ под ключ] — 1 315 показов в месяц

Для ВЧ запросов

Для самых-самых основных ВЧ запросов, можно провести дополнительный анализ, как по другому порядку слов в запросе, так и по другим вариантам окончаний. Для анализа окончаний (словоформ) в WordStat используются операторы фиксации окончания у слова [!домами] и оператор фиксации списка слов в запросе [«загородный дом»].

А для анализа соотношения показов по прямому и обратному порядку слов, скажем [построить дом] и [дом построить] подходит панель Вебмастера и Планировщик ключевых слов от Google: https://adwords.google.com/ko/KeywordPlanner/Home. В Планировщике можно проверить как соотносятся частоты запросов одного порядка слов к другому.

Тут, конечно, важно осознавать, что соотношение частота по Google и по Яндекс могут сильно отличаться!

Анализ подсказок

Изучите также поисковые подсказки по основному варианту написания и по дополнительному. Часто оказывается так, что поисковая система сама предлагает поменять окончания и тогда частота второстепенного написания оказывается пренебрежимо малой и может не приниматься во внимание.

Удачи в сборе оптимальной расширенной семантики и всех работающих словоформ!

Дата ответа:
Автор ответа:
Дмитрий Севальнев

Говорим и пишем правильно — ЖЖ

 

Словоформы. 7 ноя, 2005 @ 20:20

Прошу прощения за невежественные вопросы.

Подскажите пожалуйста, чем отличается морфологическая форма слова (если таковой термин вообще существует) и грамматическая форма слова?

И что представляет из себя слово «пригородный», по отношению к слову «город»?

(Дело в том, что мне как то нужно объяснить, почему для задач автоматической классификации текста все словоформы можно привести к одной форме, образующейся после отсечения окончаний и предлогов и при этом результат не пострадает, т.к. под различными словаформами подрузамевается (если утрировать) один смысл. )

From:derring
Date:Ноябрь, 7, 2005 18:30 (UTC)
(Link)

Не знаю, как в русской, но в «зарубежной» обработке текста различают:
lemmatizing: морфологическая нормализация (пригородного -> пригородный)
stemming: сведение однокоренных слов к чему-нибудь одному, например, к какому-нибудь варианту корня (нёс, принесли, несун -> нес).
Советую заглянуть на http://www.aot.ru , там и специалисты по русскому найдутся, и анализаторы, вроде, можно скачать.

Насчёт «можно привести» — совсем не факт. Самое безопасное, наверное, — сохранять исходную форму (принесли), но добавлять основную (принести) и корень (нес).

Пригородный и город, насколько я понимаю, — однокоренные слова.

From:rusl
Date:Ноябрь, 7, 2005 18:58 (UTC)
(Link)

Так как правильно: морфологическая форма слова или грамматическая форма слова?

From:derring
Date:Ноябрь, 7, 2005 19:06 (UTC)
(Link)

Могут быть «морфологические формы» одного слова (яку, якам, яком). Из них одна — основная (як).
Кроме того, может быть корень, необязательно совпадающий с основной формой.
«Грамматические формы» — не знаю, что бы это могло значить.

From:rusl
Date:Ноябрь, 7, 2005 19:11 (UTC)
(Link)

Хорошо. А слово «принесли» будет являться морфологической формой слова «нес»?

From:derring
Date:Ноябрь, 7, 2005 19:23 (UTC)
(Link)

Нет. Это однокоренные слова, но они не являются формами друг друга, в отличие от несла-несёт или несущая-несущего.

From:rusl
Date:Ноябрь, 7, 2005 19:37 (UTC)
(Link)

А возможно описать процесс морфологической нормализации только правилами? Или имеется множество исключений?

From:derring
Date:Ноябрь, 7, 2005 19:46 (UTC)
(Link)

Конечно, нельзя. Куча правил с исключениями, у исключений есть свои правила, из которых есть свои исключения и т.д.
На http://www.aot.ru/download.shtml можно скачать морфологические словари и поглядеть.
Есть приближения погрубее: http://snowball.tartarus.org/algorithms/russian/stemmer.html
Stemming — это самый простой способ нормализации слов (как раз с помощью перечня правил), но не слишком аккуратный.

From:rusl
Date:Ноябрь, 7, 2005 20:05 (UTC)
(Link)

Огромное спасибо. Вы разрешили мое недопонимание этого вопроса 🙂

From:ex_ex_zhuzh
Date:Ноябрь, 7, 2005 18:41 (UTC)
(Link)

Ну, я бы не сказал, что у «принести» и «унести» один смысл…

From:hacker. klever.net
Date:Ноябрь, 7, 2005 19:35 (UTC)
(Link)

А отсекать автор предлагал пока что окончания и предлоги (не знаю от чего именно отсекать предлоги).

From:ex_ex_zhuzh
Date:Ноябрь, 7, 2005 19:50 (UTC)
(Link)

Я думаю, он имел в виду приставки.

From:rusl
Date:Ноябрь, 7, 2005 20:08 (UTC)
(Link)

да, приставки конечно

From:hacker. klever.net
Date:Ноябрь, 7, 2005 20:11 (UTC)
(Link)

Ну тогда совсем другой коленкор.

From:tigris_traum
Date:Ноябрь, 7, 2005 18:51 (UTC)
(Link)

это Вы путаете словообразование и словоизменение. сломоизменение — склонение по падежам, лицам (для глаголов) итд, там смысл действительно, по сути, один.
а словообразование — это исходный корень+новый смысл, выраженный приставкой, иди суффиксом, или еще чем. и зачем же многообразие приставочных глаголов сводить к корневому? тут как раз потеря смысла, да еще какая! к слову сказать, насчет числа у существительных неясно: некоторые ученые считают, что это словоизменение, некоторые — что словообразование.

теперь далее насчет вашего «пригородный». с точки зрения морфологии, это, конечно, словообразование. но! словообразование тоже системный процесс, идущий в большинстве случаев по некоторому шаблону, поэтому для ряда случаев можно задать формулу, ну например: «глагол+суффикс «-тель» = существительное со значением агенса производимого действия»: писать — писатель.

поэтому Вам просто надо подумать и сообразить, как так формально можно задать описание для слова «пригородный». я бы сказала нечто вроде «относящийся к области исходного существительного».
но вообще-то — оч.рекомендую книгу Мельчука и еще кого-то (ой, позор на мои седины!!)»Модель Смысл-Текст», посмотреть лексические функции Апресяна (книгу не помню), ну и если уж совсем захотите подробностей — учебник Мельчука «Общая морфология».
🙂

From:tigris_traum
Date:Ноябрь, 7, 2005 18:56 (UTC)
(Link)

не обращайте внимания на очепятки, пожалуйста. руки дрожат после переноса колесиков 🙂

пока меня не побили господа лингвисты: нельзя, конечно, говорить, что у существительного в разных падежах и у глагола в разных лицах одинаковый смысл. он одинаковый семантически (в смысле корня), но морфологически, конечно же, нет! это большая разница — я таскаю колеса на 5 этаж или дяденьки мне их таскают!

From:rusl
Date:Ноябрь, 7, 2005 19:01 (UTC)
(Link)

То есть слова город и пригородный имеют одинаковый семантический смысл?

From:tigris_traum
Date:Ноябрь, 7, 2005 19:05 (UTC)
(Link)

да нет же.
я же говорю — «пригородный» — это словообразование. это уже НОВОЕ слово, со своим смыслом, которое лишь ЧАСТИЧНО пересекается с исходным словом «город». просто можно найти формулу, чтобы описать смысл этого самого «пригородный» через слово «город».

Top of PageРазработано LiveJournal.com

Домашняя страница — USC Dornsife

Устойчивое развитие: человеческий фактор

ОБЗОР ИССЛЕДОВАНИЙ

Доступна эффективная технология, позволяющая добиться устойчивого развития. Задача состоит в том, чтобы внедрить эти решения быстро и масштабно.

Вот почему USC Dornsife думает по-другому. Наши исследователи изучают, как преодолеть экономические, политические и психологические проблемы, стоящие на пути к устойчивому будущему.

Новости USC Дорнсайф

Обязательство по подарку в размере 50 миллионов долларов учреждает Инициативу Рональда и Лесли Шервинов по защите окружающей среды в USC Dornsife.


Новаторская инициатива направлена ​​на объединение различных академических дисциплин для сохранения экосистем.

Начало

Поздравляем выпускников 2023 года

Узнайте все, что вам нужно знать о церемонии открытия 12 мая.

Подробнее >

Новости USC Dornsife

Любопытство на работе

Выделяйтесь вместе

В USC Dornsife вы будете изучать то, что любите больше всего. Вы исследуете идеи, о которых никогда раньше не задумывались. Вы научитесь смотреть на мир со всех сторон. И, как часть нашего сообщества, вы поможете определить динамичную академическую среду, направленную на улучшение жизни и мира вокруг нас.

Познакомьтесь со студентами

Учащиеся USC Dornsife демонстрируют впечатляющее сочетание успехов в учебе, успеваемости, творчества и трудолюбия. Каждый студент отбирается вручную, потому что он привносит что-то особенное и уникальное в наше сообщество.

Светлое будущее
Изабелла Пангилинан,
Специальность «Экология»

Сила «И»
Джошуа Старший,
Специальность «Биологические науки», дополнительная специальность «Языки и культуры Восточной Азии»

Семейство троянов, не похожее ни на какое другое
Виктория Куон-Чоу,
Специальность «Биология человека», дополнительная специальность «Питание и укрепление здоровья»

Светлое будущее

Изабелла Пангилинан,

Специальность «Экологические исследования»

Студентка USC Dornsife Изабелла Пангилинан увлечена поиском решений некоторых из самых насущных проблем нашего мира, таких как изменение климата и социальное и экономическое неравенство. Многопрофильные курсы, предлагаемые по ее специальности, готовят ее к карьере в области экологического права.

Сила «И»

Джошуа Старший,

Специальность «Биологические науки», дополнительная специальность «Языки и культуры Восточной Азии»

Студент USC Dornsife Джошуа Старший учится на нейрохирурга. Он объясняет, как его гуманитарное образование в USC Dornsife готовит его к карьерным целям и к жизни.

Семейство троянов, не похожее ни на какое другое

Виктория Куон-Чоу,

Специальность «Биология человека», дополнительная специальность «Питание и укрепление здоровья»

Виктория Куон-Чоу, студентка Университета Южной Калифорнии в Дорнсайфе, пользуется поддержкой семьи Троян, готовясь стать врачом.

Абонентская станция

Беспрецедентный доступ к академическим знаниям

Public Exchange ускоряет сотрудничество между академическими исследователями и государственным и частным секторами для определения, анализа и решения сложных проблем, с которыми сталкиваются организации.

This entry was posted in Ключевые слова