堆糖图片爬虫升级版

一路吧 · 发表于 2018-7-22 22:25:36

您需要登录才可以下载或查看，没有账号？立即注册

x

import os
import json
import requests
def get_img_content(img_url):
web = requests.get(img_url)
return web.content
def get_json(url,num,dir_path,number):
web = requests.get(url)
html = web.text
my_dict = json.loads(html)
#链接的最终结果：my_dict['data']['object_list'][0]['photo']['path']
for i in my_dict['data']['object_list']:
if number <= num:
my_link = i['photo']['path']
img_path = my_link.split('/')[-1]
img_content = get_img_content(my_link)
with open(dir_path + img_path,'wb') as f:
f.write(img_content)
print('正在下载第%d张' % number)
number += 1
else:
break
return number
def main(keyword,i,number):
dir_path = 'D://堆糖/' #后面有个斜杠
if not os.path.exists(dir_path):
os.mkdir(dir_path)
url = 'https://www.duitang.com/napi/blog/list/by_search/?kw=%s&type=feed&start=%d' % (keyword, i)
number = get_json(url,num,dir_path,number)
return number
if __name__ == '__main__':
keyword = input('请输入需要查找的关键字，如：fate：')
num = int(input('请输入需要下载的张数，如：24张：'))
temp_n = 0
number = 1
for i in range(-1,num//24):
number = main(keyword,temp_n,number)
temp_n += 24

复制代码

账号		自动登录	找回密码
密码			立即注册

[作品展示] 堆糖图片爬虫升级版