鱼C论坛

 找回密码
 立即注册
查看: 1969|回复: 8

不解,求助这是什么问题,怎么解决啊

[复制链接]
发表于 2016-9-17 02:40:17 | 显示全部楼层 |阅读模式
20鱼币

这是小甲鱼老师课后作业的答案

这是小甲鱼老师课后作业的答案

这是运行后的结果

这是运行后的结果

最佳答案

查看完整内容

#!/usr/bin/env python # _*_ encoding: utf-8 _*_ import urllib2 import re from bs4 import BeautifulSoup def main(): url = "http://baike.baidu.com/view/284853.htm" response = urllib2.urlopen(url) html = response.read() soup = BeautifulSoup(html, "html.parser") for each in soup.find_all(href=re.compile("view")): print(each.text + "->" + ''.join(["http: ...
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-9-17 02:40:18 | 显示全部楼层
#!/usr/bin/env python
# _*_ encoding: utf-8 _*_

import urllib2
import re
from bs4 import BeautifulSoup

def main():
    url = "http://baike.baidu.com/view/284853.htm"
    response = urllib2.urlopen(url)
    html = response.read()
    soup = BeautifulSoup(html, "html.parser")
   
    for each in soup.find_all(href=re.compile("view")):
        print(each.text + "->" + ''.join(["http://baike.baidu.com", each["href"]]))
if __name__ == "__main__":
    main()

本人使用的python2 运行结果如下:
锁定->http://baike.baidu.com/view/10812319.htm
网络爬虫->http://baike.baidu.com/view/284853.htm
蜘蛛->http://baike.baidu.com/subview/8483/5395928.htm
FOAF->http://baike.baidu.com/view/271451.htm
万维网->http://baike.baidu.com/view/7833.htm
蚂蚁->http://baike.baidu.com/subview/3312/6169348.htm
蠕虫->http://baike.baidu.com/view/2596.htm
万维网->http://baike.baidu.com/view/7833.htm
网络->http://baike.baidu.com/view/3487.htm
万维网->http://baike.baidu.com/view/7833.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
通用搜索引擎->http://baike.baidu.com/view/3107065.htm
网络数据->http://baike.baidu.com/view/727321.htm
万维网->http://baike.baidu.com/view/7833.htm
网络技术->http://baike.baidu.com/view/25363.htm
通用搜索引擎->http://baike.baidu.com/view/3107065.htm
关键字->http://baike.baidu.com/view/390935.htm
万维网->http://baike.baidu.com/view/7833.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
排序算法->http://baike.baidu.com/view/297739.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
网页抓取->http://baike.baidu.com/view/3692511.htm
爬虫->http://baike.baidu.com/view/998403.htm
广度优先搜索->http://baike.baidu.com/view/825760.htm
广度优先策略->http://baike.baidu.com/view/1242613.htm
搜索算法->http://baike.baidu.com/view/3688332.htm
深度优先策略->http://baike.baidu.com/view/1242612.htm
PageRank->http://baike.baidu.com/view/1518.htm
网络拓扑->http://baike.baidu.com/view/265341.htm
HITS算法->http://baike.baidu.com/view/6284787.htm
递归->http://baike.baidu.com/view/96473.htm
主机->http://baike.baidu.com/view/23880.htm
锚文本->http://baike.baidu.com/view/19075.htm
矩阵->http://baike.baidu.com/view/10337.htm
超文本->http://baike.baidu.com/view/156868.htm
动态页面->http://baike.baidu.com/view/2065821.htm
文本检索->http://baike.baidu.com/view/995193.htm
数据抽取->http://baike.baidu.com/view/709638.htm
数据挖掘->http://baike.baidu.com/view/7893.htm
超链接->http://baike.baidu.com/view/743.htm
数据源->http://baike.baidu.com/view/286828.htm
文本检索->http://baike.baidu.com/view/995193.htm
文本分析->http://baike.baidu.com/view/3488135.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
垃圾邮件->http://baike.baidu.com/view/1522.htm
超链接->http://baike.baidu.com/view/743.htm
动态页面->http://baike.baidu.com/view/2065821.htm
脚本语言->http://baike.baidu.com/view/76320.htm
爱德华->http://baike.baidu.com/view/79537.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
劳伦斯->http://baike.baidu.com/view/58601.htm
斯坦福大学->http://baike.baidu.com/view/13725.htm
主机->http://baike.baidu.com/view/23880.htm
广度优先策略->http://baike.baidu.com/view/1242613.htm
迭代->http://baike.baidu.com/view/461623.htm
随机种子->http://baike.baidu.com/view/552838.htm
锚点->http://baike.baidu.com/view/1021668.htm
超文本->http://baike.baidu.com/view/156868.htm
语义网络->http://baike.baidu.com/view/157370.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
路由器->http://baike.baidu.com/view/1360.htm
robots.txt->http://baike.baidu.com/view/1280732.htm
网络服务器->http://baike.baidu.com/view/813.htm
网络服务器->http://baike.baidu.com/view/813.htm
系统设计->http://baike.baidu.com/view/170106.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
排序算法->http://baike.baidu.com/view/297739.htm
垃圾邮件->http://baike.baidu.com/view/1522.htm
用户代理->http://baike.baidu.com/view/1510829.htm
网络服务器->http://baike.baidu.com/view/813.htm
网络管理员->http://baike.baidu.com/view/31921.htm
网络管理员->http://baike.baidu.com/view/31921.htm
用户标识->http://baike.baidu.com/view/705141.htm
全文索引->http://baike.baidu.com/view/62889.htm
爬虫程序->http://baike.baidu.com/view/1137090.htm
深度优先策略->http://baike.baidu.com/view/1242612.htm
网络数据->http://baike.baidu.com/view/727321.htm
下载者->http://baike.baidu.com/view/1147199.htm
批处理->http://baike.baidu.com/view/80110.htm
网络服务器->http://baike.baidu.com/view/813.htm
代理服务器->http://baike.baidu.com/view/751.htm
主机->http://baike.baidu.com/view/23880.htm
网页抓取->http://baike.baidu.com/view/3692511.htm
c语言->http://baike.baidu.com/view/1219.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
网络服务器->http://baike.baidu.com/view/813.htm
镜像->http://baike.baidu.com/view/3555.htm
Heritrix->http://baike.baidu.com/view/1571189.htm
互联网档案馆->http://baike.baidu.com/view/1477730.htm
网络站点->http://baike.baidu.com/view/1473729.htm
离线观看->http://baike.baidu.com/view/6347425.htm
镜像->http://baike.baidu.com/view/3555.htm
正则表达式->http://baike.baidu.com/view/94238.htm
斯坦福->http://baike.baidu.com/view/46775.htm
搜索引擎->http://baike.baidu.com/view/1154.htm
图形用户界面->http://baike.baidu.com/view/185360.htm
开放源代码->http://baike.baidu.com/view/1708.htm
捷克->http://baike.baidu.com/view/6359.htm
YaCy->http://baike.baidu.com/view/4600486.htm
分布式搜索引擎->http://baike.baidu.com/view/4788917.htm
开放源代码->http://baike.baidu.com/view/1708.htm
robots.txt->http://baike.baidu.com/view/1280732.htm
超链接->http://baike.baidu.com/view/743.htm
Oracle数据库->http://baike.baidu.com/view/1685727.htm
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-9-18 09:39:50 | 显示全部楼层
http://bbs.fishc.com/thread-74332-1-1.html
        Python 初学者如何正确的提问
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-9-18 15:28:13 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-9-20 14:39:19 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2016-9-22 16:33:17 | 显示全部楼层
sen756 发表于 2016-9-17 02:40
#!/usr/bin/env python
# _*_ encoding: utf-8 _*_

你好,为什么用python3怎么就出错了呢,是parser的问题吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-9-22 20:31:05 | 显示全部楼层
学习ing
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-10-9 09:03:19 | 显示全部楼层
真是高级的解答
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2016-10-27 13:43:00 | 显示全部楼层
学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-3-29 10:28

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表