Поиск неявных дублей

Неявными дублями называются любые 2 фразы, состоящие из одного набора слов, расположенных в разном порядке.

Например, «цветная капуста» и «капуста цветная» — неявные дубли, а «цветная капуста» и «капуста цветная свежая» — нет.

Инструмент поиска неявных дублей среди фраз в проекте расположен на вкладке «Данные».

Поиск поддерживается в формозависимом или формонезависимом режимах.

Точный анализ (формозависимый режим) позволяет находить перестановки слов в точном вхождении: купить колбасу, колбасу купить.

Можно указать список исключений (слов, которые будут пропускаться при сравнении фраз), список синонимов (слова или словосочетания, которые будут считаться эквивалентными), а также некоторые другие параметры.

image

Окно поиска неявных дублей

После завершения поиска отобразятся результаты:

  1. На главной рабочей области появится новая вкладка «Неявные дубли».
  2. Внутри этой вкладки отобразится таблица с результатами поиска. В ней будут продублированы все видимые колонки из основной таблицы данных, а также добавлена колонка принадлежности фраз к родительской группе.
  3. В панели состояния появится блок счетчиков, относящихся к таблице в п.2: кол-во найденных неявных дублей, кол-во отмеченных фраз в таблице и кол-во выделенных фраз.
  4. В ленте инструментов добавится контекстная вкладка «Неявные дубли - Результаты» с инструментами обработки результатов поиска.

Здесь вы можете просмотреть найденные дубли. При работе с большими списками можно пользоваться фильтрами, а также настраивать внешний вид таблицы.

Далее вы можете отметить неудачные варианты написания фраз и удалить их. Для массовой отметки фраз предусмотрена функция «Умной отметки».

Все функции в ленте инструментов кроме функций контекстной вкладки «Неявные дубли» выполняются над основной таблицей данных на вкладке «Ключевые запросы». Будьте внимательны при работе с инструментов и следите за активной вкладкой.

Умная отметка

Функция позволяет выполнить автоматическую отметку фраз в группах неявных дублей на основе заданного списка правил. Для открытия окна настроек нажмите кнопку в блоке «Анализ».

Поддерживаются несколько режимов работы функции, и каждый из них может применяться либо ко всем фразам в блоке дублей, либо для каждой подгруппы фраз в блоке дублей по признаку родительской группы.

  • Случайный выбор

    Отметить все фразы кроме одной в каждой подгруппе (случайный выбор)

    В каждой подгруппе найденных неявных дублей будут отмечены все фразы кроме одной, случайным образом выбранной.

    Фраза Результат
    рецепты творожного пирога Снять отметку (случайный выбор фразы)
    творожный пирог рецепт Отметить
    рецепты пирога творожного Отметить

    Этот режим может использоваться в случаях, если для вас не важно, какой из вариантов вы бы хотели оставить.

  • Случайный выбор в подгруппах значений

    Отметить все фразы кроме одной для каждой подгруппы с одинаковым числовым значением (случайный выбор)

    Фразы в каждой подгруппе найденных неявных дублей группируются по приоритетному значению выбранной колонки-источника. Далее в каждой такой подгруппе по значению отмечаются все фразы кроме одной, случайным образом выбранной.

    Фраза Выбранное значение Результат
    рецепты творожного пирога 3500 Снять отметку (случайный выбор фразы)
    творожный пирог рецепт 2400 Отметить
    рецепты пирога творожного 3500 Отметить
    творожный рецепт пирог 2400 Снять отметку (случайный выбор фразы)

    Основным отличием этого режима от предыдущего является то, что он работает только для равных по выбранному значению колонки-источника фраз.

  • Выбор минимальных значений

    Отметить все фразы кроме имеющих максимальное числовое значение

    Отмечаются все фразы в каждой подгруппе найденных неявных дублей кроме тех, которые имеют максимальное приоритетное значение по выбранной колонке-источнику.

    Фраза Выбранное значение Результат
    рецепты творожного пирога 3500 Снять отметку (макс. значение)
    творожный пирог рецепт 2400 Отметить
    рецепты пирога творожного 3500 Снять отметку (макс. значение)
    творожный рецепт пирог 2400 Отметить

    Режим используется в случае, когда нужно удалить наиболее «слабые» варианты фраз и оставить только самые «сильные».

Применение изменений

После выполнения отметки и удаления фраз необходимо зафиксировать изменения в проекте.

До тех пор пока вы не нажмете кнопку «Применить изменения», выставленный статус отметки для фраз не запишется в проект, а удаленные фразы не удалятся из реальных групп в проекте.

Анализ групп

Пришло время познакомиться с мощным инструментом анализа групп, который позволяет автоматически сгруппировать фразы и создать структуру.

Узнать больше