鱼C论坛

 找回密码
 立即注册
查看: 972|回复: 8

[已解决]BeautifulSoup同级标签怎么取值

[复制链接]
发表于 2018-7-13 16:26:11 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 罗同学 于 2018-10-19 15:33 编辑

刚看了小甲鱼的效率革命爬取豆瓣top250的视频,自己动手做的时候,发现网页源码中,一个电影的中文名下面还有两个同级的span标签,分别是英文名和港台名,如下图所示, 微信截图_20180713162035.png
使用each.a.span 只能获取第一个span
  1. import requests
  2. from bs4 import BeautifulSoup as bs
  3. res=requests.get('https://movie.douban.com/top250?start=0&filter=')
  4. soup=bs(res.text,'lxml')
  5. targets=soup.find_all('div',class_='hd')
  6. for each in targets:
  7.         print(each.a.span)
复制代码

请问后面的这两个span标签怎么才能获取
最佳答案
2018-7-20 15:31:07
罗同学 发表于 2018-7-19 14:37
请问如果不全部提取是否可以做到呢,比如我只想取电影英文名(也就是第二个标签)

只取第二个的话就each.span.next_sibling.text就行  找第一个span的下一个节点
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2018-7-13 20:30:53 | 显示全部楼层
怎么木有人,是因为最近网站粗了问题么
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-13 22:48:55 | 显示全部楼层
span=each('span')
print(span[0],span[1])
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-13 23:06:50 | 显示全部楼层
你是需要将所有纯文本都提取出来???  这样的话就可以用text属性  each.a.text
用属性的话只能选取第一个符合条件的   遍历倒是可以解决  就再find_all()一次呗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-14 07:12:03 | 显示全部楼层
循环输出的时候,看代码
  1. for each in targets:
  2.         print(each.a.text)
复制代码


可以直接取出a标签下面的所有文本内容
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-19 14:37:42 | 显示全部楼层
a1296715528 发表于 2018-7-13 23:06
你是需要将所有纯文本都提取出来???  这样的话就可以用text属性  each.a.text
用属性的话只能选取第一 ...

请问如果不全部提取是否可以做到呢,比如我只想取电影英文名(也就是第二个标签)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-20 15:31:07 | 显示全部楼层    本楼为最佳答案   
罗同学 发表于 2018-7-19 14:37
请问如果不全部提取是否可以做到呢,比如我只想取电影英文名(也就是第二个标签)

只取第二个的话就each.span.next_sibling.text就行  找第一个span的下一个节点
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-7-20 22:24:59 | 显示全部楼层
a1296715528 发表于 2018-7-20 15:31
只取第二个的话就each.span.next_sibling.text就行  找第一个span的下一个节点

灰常感谢大佬~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-7-20 22:31:45 | 显示全部楼层

没事  互帮互助
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-27 11:05

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表