beautifulsoup4 这个用于解析html的包,不同版本的使用姿势问题,导致解析数据异常

新版 旧版
beautifulsoup4==4.7.1 beautifulsoup4==4.6.3
通过标签的class进行定位时,会自动删除空格 尊重原始的class,不会删除收尾的空格

一个实例,表明两个不同的版本中的写法

1
2
3
<div class="hello world ">
hello world
</div>

对于 4.7.1 版,使用姿势应该如下,注意class中,去掉了末尾的空格

1
2
soup = BeautifulSoup(coin_html, 'html.parser')
address_table = soup.find("div", attrs={'class', "hello world"})

对于 4.6.3版,使用姿势则应该为

1
2
soup = BeautifulSoup(coin_html, 'html.parser')
address_table = soup.find("div", attrs={'class', "hello world "})

II. 其他

1. 一灰灰Bloghttps://liuyueyi.github.io/hexblog

一灰灰的个人博客,记录所有学习和工作中的博文,欢迎大家前去逛逛

2. 声明

尽信书则不如,已上内容,纯属一家之言,因个人能力有限,难免有疏漏和错误之处,如发现bug或者有更好的建议,欢迎批评指正,不吝感激

3. 扫描关注

一灰灰blog

QrCode

知识星球

goals