鱼C论坛

 找回密码
 立即注册
查看: 757|回复: 4

[已解决]求助读取网页数据问题

[复制链接]
发表于 2018-7-20 17:38:19 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我代码直接print(data)可以显示出数据,但是保存到文档中就变成了<!DOCTYPE html>
<!--STATUS OK-->





  1. import urllib.request
  2. import os

  3. os.chdir(r'C:\Users\Administrator\Desktop')

  4. url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=666&oq=sads&rsv_pq=9c9e6b33000019f2&rsv_t=bcf3S7elqgCeYZMNgx%2BO8GSS%2BTnAZY3qdj%2Bz9yFtDfdOKWjc0DoBlE4WFIU&rqlang=cn&rsv_enter=1&inputT=2806&rsv_sug3=11&rsv_sug1=9&rsv_sug7=100&bs=sads'

  5. req = urllib.request.Request(url)
  6. req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36')
  7. data = urllib.request.urlopen(req).read()

  8. with open('百度搜索hello代码.txt','wb') as f:
  9.     f.write(data)
  10.    
复制代码
最佳答案
2018-7-20 18:15:34
不是没有,只是没有展示,你往下拖就看到了!!!

import urllib.request
import os


url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=666&oq=sads&rsv_pq=9c9e6b33000019f2&rsv_t=bcf3S7elqgCeYZMNgx%2BO8GSS%2BTnAZY3qdj%2Bz9yFtDfdOKWjc0DoBlE4WFIU&rqlang=cn&rsv_enter=1&inputT=2806&rsv_sug3=11&rsv_sug1=9&rsv_sug7=100&bs=sads'

req = urllib.request.Request(url)
req.add_header('User-Agent',
               'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36')
data = urllib.request.urlopen(req).read()
response = str(data, encoding='utf-8')
print(response)

with open('text.txt', 'w+', encoding='utf-8') as f:
    f.writelines(response)
搜狗截图18年07月20日1733_1.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-7-20 18:15:34 | 显示全部楼层    本楼为最佳答案   
不是没有,只是没有展示,你往下拖就看到了!!!

import urllib.request
import os


url = 'https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&tn=baidu&wd=666&oq=sads&rsv_pq=9c9e6b33000019f2&rsv_t=bcf3S7elqgCeYZMNgx%2BO8GSS%2BTnAZY3qdj%2Bz9yFtDfdOKWjc0DoBlE4WFIU&rqlang=cn&rsv_enter=1&inputT=2806&rsv_sug3=11&rsv_sug1=9&rsv_sug7=100&bs=sads'

req = urllib.request.Request(url)
req.add_header('User-Agent',
               'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36')
data = urllib.request.urlopen(req).read()
response = str(data, encoding='utf-8')
print(response)

with open('text.txt', 'w+', encoding='utf-8') as f:
    f.writelines(response)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-20 18:24:25 | 显示全部楼层
2018720_182339.png

2018720_182346.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-22 16:54:06 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-22 16:58:28 | 显示全部楼层
运运520 发表于 2018-7-20 18:15
不是没有,只是没有展示,你往下拖就看到了!!!

import urllib.request

谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-25 21:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表