对比表格,我们选lxml HTML解析器;
二选html5lib解析器。
安装html5lib时,在Anaconda Prompt里面输入命令pip install html5lib,在线安装网络要好,否则装不上。
解析器 | 使用方法 | 优点 | 缺点 |
---|---|---|---|
Python标准库 | soup=BeautifulSoup (html,"html.parser") | 1.Python内置标准库 2.执行速度适中 | Python2.x或Python3.2x之前的版本中文文档容错能力差 |
lxml HTML解析器 | soup=BeautifulSoup (html,"lxml") | 1.速度快 2.文档容错能力强 | 需要安装C语言库 |
lxml XML解析器 | soup=BeautifulSoup (html,"xml") | 1.速度快 2.唯一支持XML的解析器 | 需要安装C语言库 |
html5lib | soup=BeautifulSoup (html,"html5lib") | 1.最好的容错性 2.以浏览器的方式解析文档 3.生成html5格式的文档 4.不依赖外部扩展库 | 速度慢 |
你是否还在寻找稳定的海外服务器提供商?创新互联www.cdcxhl.cn海外机房具备T级流量清洗系统配攻击溯源,准确流量调度确保服务器高可用性,企业级服务器适合批量采购,新人活动首月15元起,快前往官网查看详情吧