QueryList,PHP采集,爬虫,今天向一个高手请教了QL采集方法
今天向一个高手请教了QL采集方法,得到一段代码:
['.list_itme2 a','text'],
'link' => ['.list_itme2 a','href'],
'date' => ['.list_itme2 time','text'],
];
$res = [];
for($i=1;$i<=20;$i++){
$data = QueryList::Query('https://xxx/list_'.$i.'.html',$rules);
$res = array_merge($res,$data->data);
}
file_put_contents('list', json_encode($res) );
由于不会用compose,没有autoload.php,【把USE 那一行,放到 require 下面。】
改成下面也可以:
//require_once './vendor/autoload.php';
require './func_collect/phpQuery.php';
require './func_collect/QueryList.php';
use QLQueryList;
(HAHA 150101761)
但实在不明白他怎么定义的规则,只取合适的。
http://www.querylist.cc/docs/guide/v4/modify-dom
http://www.querylist.cc/docs/guide/v4/scraper-single
这个有介绍这个规则的。这个东西需要花点时间学才行。
【版權聲明】
本文爲原創,遵循CC 4.0 BY-SA版權協議!轉載時請附上原文鏈接及本聲明。
原文鏈接:https://tdlib.com/am.php?t=zl6vjhkg6yyy Tag: QueryList PHP采集 爬虫