本日闲来无事,就写个小爬虫,来爬取Y站上那些嘿嘿嘿 的图片, 必要预备一个F盘,文件存在F://good_imgs里。 之前论坛上也有一个爬取Y站的帖子,但那都是15年的了,而且每次爬雷同的,功能较少,我就重新写了个小爬虫, 可以自选页数,指定爬取页数,从指定页数爬就设置s_page选项,默以为1。 写的不好勿喷, 8/23:添加了time,还加了headers,把假如删除文件夹给去掉了。然鹅不知道什么缘故原由如今yande爬不了。 8/25:颠末这两天研究发现,yande.re的服务器时常抽,由于架设在外洋,这种小题目还是可以明确的, 假如各人碰到Timeout 大概远程主构造闭了一个毗连的话,最好的方法还是等,大概睡一觉第二天又OK了, 8/31:又修复了个小BUG,体验更佳。 PS:本日是初音生日伐,一整页都是关于初音。 9/12:优化了代码, 在这提示各人一句, 小爬怡情, 大爬伤身, 强爬灰飞烟灭, 以是有控制的爬才气可连续发展, 登录/注册后可看大图
|