Sunday, 4 December 2011

simple html dom - крутая библиотека для парсинга

Стояла задача спарсить видео с сайтов, банальными регулярками не хотелось делать решил испробовать Xpath.
simple html dom позволяет делать jQuery подобные запросы к ДОМу и получать необходимые данные работает достаточно быстро сервак не грузит хотя краштест не проводил интересная штука.

Примеры кода.

Данный кусок кода позволяет получить все ссылки в блоке
$html = file_get_html("http://www.fasthighlights.com/video/category/england/premier-league");
$query = $html->find('h4 a');

foreach($query as $item)
{
echo $item->innertext. '
';
}



А этот взять необходимый мне видос
$html = file_get_html("http://www.fasthighlights.com/video/aston-villa-manchester-united-10579.htm");
$query = $html->find('div[id=content] div object', 0);

echo $query->innertext. '
';

Планирую напедалить класс для Кохана 3.1.4 и сделать перспективный по моему мнению сервис под адсенс.

No comments:

Post a Comment