说明:爬虫估计很多人知道,可以自动下载一些网站上面的图片,视频,这里说下使用FileManager和爬虫建立影音、图片库,并分享几个美女站爬虫(1024/mm131/91/mmjpg)。想看美女的可以爬来看看。至于其他学习资料网站的爬虫,可以去Github上找找。

截图


使用教程

爬虫使用python3+requests库编写,在Windows系统和Linux系统下都可以运行,大部分UbuntuDebian都含有Python3,直接安装最新此系统就可以了。而CentOS需要额外安装Python3,这里只说下CentOS 7系统使用方法。

1、安装FileManager网盘
教程参考:利用Caddy扩展快速安装FileManager私人网盘/在线文件管理器。

2、检查Python3并升级
查看Python3是否安装

python3 -V

如果返回-bash: python3: command not found,就使用Python 3.6一键脚本进行安装:

wget https://down.hupsun.com/CentOS_Python3.6.sh && sh CentOS_Python3.6.sh

本脚本包含许多必需库,不会因为缺少依赖而出问题,如果不想用脚本的,也可以手动升级,教程参考:Linux CentOS升级Python 3.6版本方法。

3、安装requests库

pip3 install requests

4、创建文件夹

mkdir /usr/local/caddy/www/file/xx  #用来存储文件
cd /usr/local/caddy/www/file/xx

5、下载并运行爬虫

#91视频爬虫,默认只爬精华前100页,修改while flag<=100即可更改页数。
wget https://down.hupsun.com/91_spider.py && python3 91_spider.py
#1024图片爬虫
wget https://down.hupsun.com/1024_spider.py && python3 1024_spider.py
#mm131图片爬虫
wget https://down.hupsun.com/mm131_spider.py && python3 mm131_spider.py
#mmjpg图片爬虫
wget https://down.hupsun.com/mmjpg.py && python3 mmjpg.py

#带缩略图的91视频爬虫,最后面main()为爬的页数
wget https://down.hupsun.com/91_pro.py && python3 91_pro.py

如果爬电影失败,提示no requests_html的话,还需要运行pip3 install requests_html,然后再开始运行爬虫。

建议使用screen后台操作,参考:使用screen来实现多任务不断线操作命令。最后进入FileManager网盘查看即可。

解除宝塔面板 MySQL 安装最低内存限制

VIRMACH黑五,抢了一堆的小鸡,可是有个比较坑的地方,说是768的内存,实际上在只有744M,如果用宝塔最新版安装就会提示内存地狱768,无法安装MYSQL5.6,感谢...

阅读全文

oracle永久机刷机包(含Windows)

制作教程太繁琐等以后有时间再编辑添加,大家可以参考其它坛友的方法 暂时没找到好用的p2p文件分享方式,且想起流量不够还有300美元可用,所以暂还是用直链分...

阅读全文

一款带Web面板的轻量级、高性能内网穿透工具:nps使用教程

说明:内网穿透工具之前已经介绍了不少了,比如Frp、lanproxy、Holer等,现在再介绍个带Web面板的穿透工具nps,之前叫easyProxy,只是改名了而已,该工具是一...

阅读全文

欢迎留言