Вы здесь: Современные автоматизированные системы и технологии безопасности » Оптимизация » Парсер выдачи сайтов Яндекс / Yandex

Поиск по сайту
Полезная информация
Статистика

28-08-2010, 12:40
Задача была выдрать урлы сайтов которые идут в поисковой выдаче Яндекса. Думал думал. Решил проблему разрешать на локальной машине. Для этого воспользовался дополнением к FireFox – Greasemonkey. Он умеет запускать javascript код про правилам, т.е. можно исполнить хоть на какой странице. Например: yandex.ru.

Вот собственно код для скрипта к Greasemonkey:

// ==UserScript==
// @name Yandex
// @namespace yandex.ru/
// @include http://yandex.ru/yandsearch*
// ==/UserScript==

var elems = document.getElementsByClassName("agp");
var str = '';
var html = '';

for (var i = 0; i < elems.length; i++)
{
str = elems[i].href;
str = str.split("http://").join('');
str = str.split('/');
str = str[0];
if (str !== 'yabs.yandex.ru') html += str + "\r\n";
}

var layer = document.createElement('pre');
layer.setAttribute("style", "font-size: 11px;position:absolute; top: 100px; right: 0;border:2px solid #000000; background:

gray;color: #fff;width:200px; height:200px;overflow: auto;");
sometext = document.createTextNode(html);
layer.appendChild(sometext);
document.body.appendChild(layer);

 
Просмотров:
© 2009–2021 Автоматизированные системы безопасности AstLimited.ru
При полном или частичном копировании публикаций ссылка на автоматизированные системы, электроника и безопасность AstLimited.ru обязательна.