Вы здесь: Современные автоматизированные системы и технологии безопасности » Оптимизация » Парсер выдачи сайтов Яндекс / Yandex |
Задача была выдрать урлы сайтов которые идут в поисковой выдаче Яндекса. Думал думал. Решил проблему разрешать на локальной машине. Для этого воспользовался дополнением к FireFox – Greasemonkey. Он умеет запускать javascript код про правилам, т.е. можно исполнить хоть на какой странице. Например: yandex.ru.
Вот собственно код для скрипта к Greasemonkey: // ==UserScript== // @name Yandex // @namespace yandex.ru/ // @include http://yandex.ru/yandsearch* // ==/UserScript== var elems = document.getElementsByClassName("agp"); var str = ''; var html = ''; for (var i = 0; i < elems.length; i++) { str = elems[i].href; str = str.split("http://").join(''); str = str.split('/'); str = str[0]; if (str !== 'yabs.yandex.ru') html += str + "\r\n"; } var layer = document.createElement('pre'); layer.setAttribute("style", "font-size: 11px;position:absolute; top: 100px; right: 0;border:2px solid #000000; background: gray;color: #fff;width:200px; height:200px;overflow: auto;"); sometext = document.createTextNode(html); layer.appendChild(sometext); document.body.appendChild(layer); |
7786
Просмотров: |