四时宝库

程序员的知识宝库

python小伙自制模板之家查询和下载文件的脚本

通过python的requests和lxml库,完成对模板之家免费模板的查询和下载功能(保存本地)

目标网站: www.cssmoban.com

工具:python3.6 requesst、lxml库

以上2个库都可以通过pip安装,在cmd下输入命令:pip install requests(lxml),然后等待安装完成即可(如果报错,也可以网上搜索whl文件,下载到本地安装)

整体思路:

@查找目标网站的分类和相应的url,写入字典待查

@等待用户输入查询分类,返回对应的url

@找到分类的最大页码,做入循环

@找到每个模板url,进入后查找下载地址url

@ 建立用户输入分类文件夹,保存模版至文件夹

大致如此,接下来我们分析网页

入口页面:www.cssmoban.com

最大页码查找

下载地址所在

分类函数,传入名字,返回url:

完整代码和运行结果如下(头部信息请自行输入):

最后

这个网站很简单,不需要登录验证码,不需要cookies,爬虫也没有写的太暴力,注意加上间隔时间,别对人家服务器造成压力最好。

喜欢就关注下呗!喜欢和需要源码的小伙伴可以私信我,回复"资料"就可以哦!

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接