鱼C论坛

 找回密码
 立即注册
查看: 9000|回复: 112

[作品展示] 【申精】小甲鱼爬虫教程第56节的错误及解决方法

  [复制链接]
发表于 2016-12-4 16:59:37 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 老王他师父 于 2016-12-6 14:08 编辑

最近在临摹小甲鱼爬虫教学的第56章,发现如果按照小甲鱼的代码写,可能会出现一个ssl证书错误,截图如下:

QQ图片20161204165022.png

原代码如下:
  1. import urllib.request
  2. import os

  3. def get_page(url):
  4.     req = urllib.request.Request(url)
  5.     req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36')
  6.     response = urllib.request.urlopen(url)
  7.     html = response.read().decode('utf-8')

  8.     a = html.find('current-comment-page') + 23
  9.     b = html.find(']', a)

  10.     print(html[a:b])

  11. def find_imgs(url):
  12.     pass

  13. def save_imgs(folder, img_addrs):
  14.     pass

  15. def downloadgirls(folder = 'girls', pages = 10):
  16.     os.mkdir(folder)
  17.     os.chdir(folder)
  18.     url = 'https://jandan.net/ooxx'
  19.     page_num = int(get_page(url))

  20.     for i in range(pages):
  21.         page_num -= i
  22.         page_url = url + '/page-' + str(page_num) + '#comments'
  23.         img_addrs = find_imgs(page_url)
  24.         save_imgs(folder, img_addrs)


  25. if __name__ == '__main__':
  26.     downloadgirls()
复制代码


解决方法:

游客,如果您要查看本帖隐藏内容请回复



@小甲鱼 @康小泡 @拈花小仙 @冬雪雪冬
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-5 00:18:18 | 显示全部楼层
有什么好的解决办法呢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-5 19:32:40 | 显示全部楼层
现在的煎蛋网采用了https协议,而小甲鱼做这个视频时,网站使用的还是http协议,所以会有这种情况,期待小甲鱼出新的视频,这个视频毕竟比较老了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-12-6 09:24:00 | 显示全部楼层
雪缘再续 发表于 2016-12-5 19:32
现在的煎蛋网采用了https协议,而小甲鱼做这个视频时,网站使用的还是http协议,所以会有这种情况,期待小 ...

爬图也爬不了了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-6 14:34:25 | 显示全部楼层
我跟着打是能爬到煎蛋的图片的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-12-7 16:22:31 | 显示全部楼层
day_by_day 发表于 2016-12-6 14:34
我跟着打是能爬到煎蛋的图片的。

现在不能了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-7 16:54:14 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-19 17:16:52 | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-19 18:57:18 | 显示全部楼层
hello
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-19 20:11:48 | 显示全部楼层
爬虫教程是哪一个呢?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

头像被屏蔽
发表于 2016-12-19 23:34:09 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-19 23:48:17 | 显示全部楼层
厉害
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-20 21:01:41 | 显示全部楼层
厉害
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-12-29 23:02:04 | 显示全部楼层
我也现在爬不了了 估计是这么原因:
现在的煎蛋网采用了https协议,而小甲鱼做这个视频时,网站使用的还是http协议,所以会有这种情况,期待小甲鱼出新的视频,这个视频毕竟比较老了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-12-29 23:35:43 | 显示全部楼层
学习学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-9 18:11:46 | 显示全部楼层
有解决办法吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-9 21:18:36 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-1-12 12:41:51 | 显示全部楼层
谢谢楼主分享
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-15 20:49:31 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-1-16 10:17:26 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-20 04:32

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表