宝哥软件园

thinkphp抓取网站内容并保存到本地示例

编辑:宝哥软件园 来源:互联网 时间:2021-09-03

Thinkphp抓取网站内容并保存到本地示例中

我需要写一个从电子教材网下载电子书的例子。

电子书网的电子书把一本书的每一页都当成一张图片,然后一本书里面有很多图片,所以我需要批量下载图片。

以下是代码部分:

公共函数下载(){ $ Http=new Org Net Http();$ URL _ pref=' http://www . dzkbw.com/books/rjb/Dili/xc7s/';$ local URL=' Public/book cover/';$reg='|showImg('(。)');|';$ I=1;do { $filename=substr('000 ')。$i,-3)。htm ';$ ch=curl _ init();curl_setopt($ch,CURLOPT_URL,$url_pref。$ filename);curl_setopt($ch,CURLOPT_RETURNTRANSFER,1);curl_setopt($ch,CURLOPT_CONNECTTIMEOUT,10);curl_setopt($ch,CURLOPT_FOLLOWLOCATION,1);$ html=curl _ exec($ ch);curl _ close($ ch);$result=preg_match_all($reg,$html,$out,PREG _ PATTERN _ ORder);if($ result==1){ $ PiCurl=$ out[1][0];$picFilename=substr('000 '。$i,-3)。jpg ';$http-curlDownload($picUrl,$localUrl。$ picFilename);} $ I=$ I ^ 1;} while($ result==1);Echo“下载完成”;}我以人教版七年级地理上册为例,http://www.dzkbw.com/books/rjb/dili/xc7s/001.htm.

网页从001.htm开始,然后数字不断增加

每个网页中都有一张图片,与教材内容相对应,以图片的形式显示教材内容

我的代码是做一个循环,从第一页开始,直到在网页上找不到图片

捕捉到网页内容后,将网页中的图片抓取到本地服务器

抓取后的实际效果:

上面是thinkphp抓取网站内容并保存到本地的例子。如有疑问,请留言或交流,在本网站社区讨论。感谢阅读。我希望你能帮助每个人。感谢您对本网站的支持!

更多资讯
游戏推荐
更多+