?

Log in

No account? Create an account

Previous Entry | Next Entry

Назначение модуля


Во всех современных поисковиках, включая Яндекс и Google, и во всех встроенных в сайты поисках в настоящее время:

• в запросах нельзя определить для ключевых слов максимальное допустимое расстоя-ние между ними, их нахождение в одном предложении или абзаце;

• нигде не поддерживается скобочная структура запроса;

• перестают поддерживаться некоторые другие возможности языков запросов.

В настоящей публикации описан способ, применяя который можно частично преодолеть или сгладить перечисленные выше недостатки.


Доступно, начиная с Site Sputnik версии 9.5.2 от 21.11.2017 г.


§1. Запрос + Пост-запрос


Сначала несколько демонстрационных примеров.

ПРИМЕР 1. Открываем пункт меню (смотрите по красной стрелочке):



и вводим запрос: Алексей /1 Мыльников /3 программист

Его назначение: найти те и только те ссылки, в содержании которых есть стоящие на расстоянии 1 пробела (то есть рядом) словоформы от слов Алексей и Мыльников и есть ещё словоформа от слова программист, стоящая на расстоянии не более 3 пробелов от первых двух словоформ.



На картинке выше кроме запроса мы ещё указали источник, на котором он будет выполнен (это поисковик Google) и глубину поиска, равную 7-ми поисковым страницам.

Нажимаем на кнопку «Поиск+». СайтСпутник сделает следующее:

1) выполнит в Google запрос: Алексей Мыльников программист, - на глубину 7 страниц
(обратите внимание, что символы “/1”и “/3” отсутствуют в запросе (они Гуглю ни о чём не говорят));

2) скачает все найденные по этому запросу ссылки;

3) проанализирует их содержание (контент) и поместит в специально созданный список “Пост-запрос+” ссылки, содержание которых удовлетворяет указанным выше целям.

Ниже список “Пост-запрос+” будем называть выдачей.

Фрагмент из выдачи по этому запросу таков:



Красные стрелочки указывают на элементарные правила, которым удовлетворяет содержание найденных ссылок (именно содержание ссылок, а не содержание сниппетов, которые Вы видите сейчас на картинке справа).



ПРИМЕР 2. Открываем окно для ввода запроса и вводим следующий запрос:

Алексей /1 Мыльников & ( СайтСпутник | Sitesputnik | Борисович)

Его назначение: найти те и только те страницы, в содержании которых есть стоящие рядом словоформы от слов Алексей и Мыльников и ещё, чтобы в одном предложении с ними была хотя бы одна словоформа из следующих трёх: СайтСпутник, Sitesputnik или Борисович.



Здесь мы прописали поиск на Яндексе на глубину 10 страниц.

Нажимаем на кнопку «Поиск+». СайтСпутник сделает следующее:

1) Выполнит в Яндексе поиск по трём запросам:

a. Алексей Мыльников СайтСпутник, - на глубину 10 страниц
b. Алексей Мыльников SiteSputnik, - на глубину 10 страниц
c. Алексей Мыльников Борисович, - на глубину 10 страниц

(обратите внимание, что символы “/1” и “&” отсутствуют (они Яндексу уже ни о чем не говорят), а скобки раскрыты (Яндекс уже их не воспримимает));

2) Объединит три результата поиска, отбросив дубли ссылок и оставив только уникальные ссылки;

3) Скачает все уникальные ссылки;

4) Проанализирует их содержание (контент) и поместит в выдачу ссылки, содержание которых удовлетворяет указанным выше целям.

Фрагмент из выдачи по этому запросу таков:



Красные стрелочки указывают на элементарные правила, которым удовлетворяют содержания найденных ссылок (именно ссылок, а не сниппетов, как уже подчеркивалось выше).




ПРИМЕР 3. Ещё один чисто демонстрационный запрос посложнее.



Выше на картинке показано как по запросу, отправленному на источник, называемый Метапоиск, можно получить ссылки, содержащие информацию о чемпионате мира по футболу, проводимому в России. Причем на этих ссылках не должно быть словоформы от слова Мутко или стоящих рядом словоформ от слов Строительство и Стадион (не должно быть ни одной из этих двух конструкций).

Действия СайтСпутника подобны его действиям, выполненным в предыдущем примере. Он выполнит упрощенные запросы на источниках, скачает найденные уникальные ссылки, проверит и оставит в выдаче те и только те из них, содержание которых удовлетворяет сложному запросу (Пост-запросу).





§2. Пакет + Пост-запрос

Можно задать не только один запрос, но и Пакет запросов.

Обращение к Пакету - из меню (смотрите на самой первой картинке по зеленой стрелочке).

ПРИМЕР 4. На картинке ниже показан простой, чисто демонстрационный, пакет запросов:



После выполнения поиска по каждому запросу и скачивания всех найденных уникальных ссылок для их содержания будет выполнен следующий Пост-запрос:

(Олег /2 Табаков) | (Табакерка /5 (Театр | Студия))

Соответственно, в выдачу попадут те и только те ссылки, в содержании которых есть стоящие не далее, чем на расстоянии 2-х пробелов друг от друга словоформы от слов Олег и Табаков или Табакерка, на расстоянии не более 5 пробелов от которой стоит Театр или Студия.

В данном Пакете одним из источников является поиск в Твиттере.




Заключительные замечания

• Язык Пост-запросов СайтСпутника практически эквивалентен Языку Рубрик СайтСпутника:
o примеры простых запросов - на ссылке (смотрите абзац «Элементарные правила),
o подробнее – на ссылке Рубрики в Сайт Спутнике;
o обсуждение - на форуме СПКР.

• если Вы повторите любой запрос или пакет запросов через какой-то промежуток времени, то увидите в выдаче те и только те ссылки, которые Вы ранее не находили и не просматривали ни разу, независимо от того, когда Вы до этого выполняли поиск: сегодня или год назад, - естественно, что Вы сможете ознакомиться и со всеми найденными ссылками;

• в качестве Источников могут быть использованы самые разные поисковики, встроенные в сайты поиски, RSS-потоки и другие подключенные источники информации, начиная от Яндекса, в котором описанные возможности уже не поддерживаются, включая Google, в котором их никогда не было, заканчивая самым обычным встроенным в сайт поиском или потоком;

• если использованы несколько источников, то дубли ссылок, найденные ими, будут отбрасываться.


Доступно, начиная с Site Sputnik версии 9.5.2 от 21.11.2017 г.

Подробнее - на ссылке SiteSputnik: Запрос + Пост-запрос.

Latest Month

December 2017
S M T W T F S
     12
3456789
10111213141516
17181920212223
24252627282930
31      
Powered by LiveJournal.com
Designed by Tiffany Chow