Минус-слова

Инструмент «Минус-слова» расположен на вкладке «Данные».

Он позволяет выполнять поиск поиск вхождений отдельных слов, их наборов или фраз целиком среди добавленных в таблицу запросов. Также поддерживается функция кросс-минусации фраз.

Вообще говоря, инструмент выполняет универсальный поиск заданных слов или фраз. Нет требования, чтобы они являлись минус-словами или минус-фразами, и потом браковались. Однако для удобства повествования в дальнейшем мы будем упоминать искомые выражения как «минус-слова».

Окно поиска содержит таблицу минус-слов, панель настроек выбранного режима поиска, а также панель инструментов со вспомогательными функциями.

Программа поддерживает несколько режимов поиска:

  • независимый от словоформы
    • быстрый
    • улучшенный
  • зависимый от словоформы
    • полное вхождение
    • частичное вхождение
    • полное соответствие целиком

Заданные минус-слова хранятся в файле проекта.

image

Окно поиска минус-слов

Группы минус-слов

Перед началом поиска необходимо определить список искомых минус-слов. Для удобства работы инструмент поддерживает ведение независимых групп минус-слов.

Группы могут быть глобальными (доступны для использования из любого проекта) и локальными (доступны только в том проекте, где они определены; по умолчанию в каждом проекте создаются 2 локальные группы минус-слов).

Для выбора текущей группы воспользуйтесь выпадающем списком в верхнем левом углу окна.

Для редактирования списка групп нажмите кнопку справа от выпадающего списка выбора групп.


Здесь вы можете создавать, упорядочивать и переименовывать группы.

Список групп вместе с минус-словами можно выгрузить во внешний файл, а потом импортировать обратно (выбрать формат выгрузки можно в панели настроек).

Из соображений безопасности функция удаления групп удаляет только предварительно скрытые группы. Поэтому для удаления группы необходимо отметить ее, нажать кнопку «Скрыть», а лишь потом — «Удалить».

image

Редактор групп минус-слов


Здесь также можно включить режим «Только чтение», который будет блокировать функцию добавления и удаления минус-слов из группы. Для его активации нажмите напротив заголовка группы.

Составление списка минус-слов

Теперь можно поговорить о процессе наполнения списков для минусации.

Первым способом является непосредственный ввода данных в таблицу минус-слов с клавиатуры или из файлов (импортирование из произвольных или ранее выгруженных списком минус-слов).

Вторым способом является отправка фраз из основной таблицы с данными в окно инструмента минус-слов. Для этого выделите или отметьте фразы и выберите «Отправить выделенные/отмеченные фразы в минус-слова» в контекстном меню таблицы. Удобно пользоваться горячей клавишей F11.

Для точечной отправки отдельных слов в настройках можно включить отображение кнопки отправки фразы в минус-слова.

Третьим способом является точечная отправка предварительно помеченных слов или фраз. Этот режим удобнее предыдущего, т.к. вы можете пометить только нужные слова («как», «куда», «можно» в пред. примере) и упростить работу на следующем шаге.

Для пометки слов зажмите клавишу W и начинайте кликать мышкой по нужным словам. Помеченные слова окрашиваются в альтернативный цвет.

Речь идет о пометке отдельных слов: каждый клик включает или отключает пометку для конкретного слова.

Если по каким-то причинам вы не хотите удерживать клавишу W, режим пометки отдельных слов можно зафиксировать, нажав на кнопку в панели статуса.

В контекстном меню этой кнопки можно включить или выключить формонезависимую подсветку помеченных слов в таблице.

Если формонезависимый режим подсветки включен, то после пометки слова «колбасы», визуально в таблице поменяют цвет в том числе все варианты написания этого слова: «колбаса», «колбасу» и т.д.

Если требуется пометить наборную фразу, а не отдельные слова, зажмите и удерживайте Ctrl+W, а затем начинайте кликать по составным словам нужной фразы. При пометке наборных слов они не будут визуально выделяться до тех пор пока вы не отпустите и снова не зажмете Ctrl+W.

После завершения пометки отдельных слов или наборных фраз для отправки помеченных элементов в минус-слова выберите «Отправить помеченные слова в минус-слова» в контекстном меню таблицы. Удобно пользоваться горячей клавишей F12.

Четвертым способом составлять списки минус-слов является работа с инструментом анализа групп.

Отправка в минус-слова

  1. Выберите режим: отправка фраз целиком (в том виде, в котором они были отправлены) или отправка отдельных слов (отправленные фразы разбиваются на уникальные слова).
  2. Отметьте нужные элементы в таблице.
  3. Последняя колонка отвечает за нормализацию текста ячейки в таблице. Если включить опцию для строки в таблице, фраза или слово примут начальную форму (единственное число, именительный падеж).
  4. Укажите целевую группу, куда добавить отмеченные в п.2 элементы (этот пункт можно пропустить; элементы можно не добавлять, а просто выполнить экспресс-поиск).
  5. При условии выполнения п.4 нажмите «Добавить», чтобы добавить элементы в указанную группу.
  6. Для выполнения поиска по отмеченным в п.2 элементам (только по ним) нажмите «Показать найденные фразы».
  7. Перед запуском поиска в п.6 необходимо задать его параметры.
image

Отправка в минуса-слова

Режимы поиска

Программа поддерживает несколько видов поиска.

 
  • Независимый от словоформы: быстрый

    Поиск выполняется в формонезависимом режиме: искомые слова и слова исследуемых фраз приводятся к начальной форме и сравниваются.

    Например, во фразе «копченые колбасы» будет найдено слово «колбаса».

  • Независимый от словоформы: улучшенный

    Поиск выполняется в формонезависимом режиме: искомые слова и слова исследуемых фраз приводятся к начальной форме и сравниваются.

    В отличие от быстрого улучшенного поиска, в этом случае анализ выполняется точнее, с меньшими погрешностями. Это занимает чуть больше времени, но разницу можно почувствовать только на миллионных проектах.

    Например, во фразе «копченые колбасы» будет найдено слово «колбаса».

  • Зависимый от словоформы: полное вхождение

    Исследуемая фраза разбивается на отдельные слова, и поиск выполняется среди ее составных частей (слов) в полном вхождении.

    Режим подходит при поиске сложных слов или в условиях поиска точных вариантов написания слов.

    Например, в фразе «купить авто б/у» будет найдено слово «купить», но не будет найдено «купил».

  • Зависимый от словоформы: частичное вхождение

    Выполняется частичный поиск указанных искомых частей в исследуемых фразах.

    Например, во фразе «купить ноутбук E102AC» будет найдена часть «102», чего не произошло бы в режиме полного вхождения.

  • Зависимый от словоформы: полное вхождение фразы целиком

    Выполняется поиск минус-слова/минус-фразы целиком от начала до конца среди фраз в исследуемых группах.

    Например, минус-фраза «купить авто недорого» будет найдена только для такой же фразы «купить авто недорого» (все символы с точностью до знака совпадают). При этом фраза «купить авто» не будет считаться подходящей (отсутствуют некоторые слова).

В базовой варианте мы рекомендуем использовать улучшенный формонезависимый режим.

  • Он обеспечивает приемлемую гибкость поиска, не требует дублирования одних и тех слов в списке минусации. Достаточно указать один вариант «колбаса» вместо перечисления всех склонений: «колбасы», «колбасу» и т.д. как в случае с полным вхождением.
  • Минус-слова можно задавать в естественном виде целиком: «колбаса» вместо «колбас» в случае поиска в частичном вхождении.

Борьба с погрешностями и операторы поиска

К сожалению, при работе в формонезависимых режимах возможны погрешности. Иногда программа считает близкие по смыслу слова одинаковыми, а иногда наоборот не улавливает связи между одним и тем же словом в разных склонениях.

Специальными операторы поиска позволяются исправить ошибки или уточнить его критерии.

Фиксация словоформы (точный поиск)

Если программа ошибочно принимает какое-то слово за искомое, вы можете зафиксировать проблемное минус-слово оператором !

  • !Киев
  • !кий
  • !как
  • !тянули !репку

Например, «Киев» и «кий» в упрощенном быстром режиме могут считаться равными, т.к. их неизменяемая часть «ки» совпадает в обоих словах. Или же «как» и «почему» может быть приняты за равнозначные слова в улучшенном режиме.

Для фиксации минус-фразы необходимо использовать оператор ! перед каждым словом фразы. Фиксировать отдельные слова минус-фразы не допускается.

Фиксация фразы (фразовый поиск)

При поиске минус-фраз, состоящих из нескольких слов, по умолчанию программа разрешает присутствие посторонних слов между словами искомой фразы. Оператор " " локально запрещает эту возможность.

  • "заказать торт"
  • "в банке"

Например, минус-фраза заказать торт (без кавычек) будет найдена в запросе «заказать свадебный бисквитный торт с кремом». Если добавить оператор " ", то минус-фраза будет найдена только в запросах вида «заказать торт на праздник» (слова искомой фразы не разделены посторонними словами).

Фиксация порядка слов

  • заказать торт
  • в банке

Например, минус-фраза заказать торт (без кавычек) будет найдена в запросе «торт на праздник заказать». Если добавить оператор , то минус-фраза будет найдена только в запросах вида «заказать праздничный торт» (слова искомой фразы следуют строго в заданном порядке).

Композиция операторов

Допускается использование различных операторов сразу, однако важен порядок их применения.

  1. Фразовая фиксация " "
  2. Точная фиксация !
  • "заказать торт"
  • !вкусные !пельмени
  • "!чайник !бош"

Выполнение поиска и работа с результатами

Итак, после выбора группы минус-слов, формирования списка минусации и установки настроек вы можете выполнить поиск.

По завершении поиска открывается временная мультигруппа с результатами.

В ленте инструментов при этом будет добавлена контекстная вкладка «Предпросмотр», которая позволит управлять временной мультигруппой.

Таблица результатов содержит колонку подсветки, где отображается подсказка по найденному минус-слову в исходной фразе, а само найденное минус-слово отображается в колонке «Минус-слово».

Вы можете работать с результатами поиска в мультигруппе как с обычной мультигруппой: сортировать данные, применять фильтры, отмечать и удалять строки, запускать парсинг и т.д.

В колонке «Группа» отображается название целевой группы, где была найдена фраза из указанных групп-источников. Вы можете перейти внутрь этой целевой группы, зажав клавишу Ctrl и кликнув по ее названию.

Для возврата к результатам поиска воспользуйтесь кнопкой «Показать временную группу» в «Предпросмотр» или пунктом «Назад» контекстным меню в панели управления групп.

Комментарии

Оставляйте заметки к запросам, используйте их при дальнейшей обработке данных. Это возможно при помощи модуля комментариев.

Узнать больше