鱼C论坛

 找回密码
 立即注册
查看: 1435|回复: 2

小白求助,今天学习爬虫,遇到一点小问题

[复制链接]
发表于 2017-2-11 17:46:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 什么鬼… 于 2017-2-13 11:40 编辑

今天刚刚学习爬虫,然后按照视频里面的流程尝试着去爬爱词霸,然后我的前半部分代码如下
import urllib.request
import urllib.parse
url='http://fy.iciba.com/ajax.php?a=fy'

date={}

date['f']='auto'
date['t']='auto'
date['w']='I love fishc'

date = urllib.parse.urlencode(date).encode('utf-8')

response = urllib.request.urlopen(url,date)

html = response.read().decode('utf-8')

print(html)

然后得到的是{"status":1,"content":{"from":"en-EU","to":"zh-CN","vendor":"baidu","out":"\u6211\u7231fishc<br\/>","err_no":0}}
然后我就蒙了,之前爬有道词典的时候返回的是                                                  {"type":"EN2ZH_CN","errorCode":0,"elapsedTime":6,"translateResult":[[{"src":"I love fishc","tgt":"我爱fishc"}]],"typoResult":["I love<b> fish<\/b>"]}小甲鱼说这个是json结构,然后用json.loads给打开了
那么爱词霸这个返回的是什么结构的,又要怎么打开呢?还是说我前面写的就有问题呢,求大神们帮帮忙带带小白

哦对了,爱词霸的From date和有道的不一样,那写的时候也是一样的用From date改吗?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-2-12 18:17:38 | 显示全部楼层

回帖奖励 +1 鱼币

都是字典,没有什么不同,你一样可以用json提取值
代码如下:
  1. datedic = json.loads(html)
  2. out_key = datedic['content']['out']
  3. print(out_key)
复制代码


显示的结果如下:
  1. 我爱fishc<br/>
复制代码

评分

参与人数 1荣誉 +5 鱼币 +5 贡献 +2 收起 理由
什么鬼… + 5 + 5 + 2 感谢!

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-2-12 18:57:01 | 显示全部楼层
gopythoner 发表于 2017-2-12 18:17
都是字典,没有什么不同,你一样可以用json提取值
代码如下:

终于有人回了
非常感谢!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-25 13:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表