1. python bs4 是個什麼
這是一個模塊,要通過如下語句安裝:
pip install bs4
2. 關於python bs4的import問題
1.誰說沒BeautifulSoup的 。。。你打開
__init__.py裡面有個class 就是BeautifulSoup
2.可以。這樣不是管理很亂么。。
直接把源代碼放到 Python27\Lib\site-packages目錄下就行了
3. python中關於bs4獲取鏈接的問題
import urllib2
import urllib
from lxml import etree
def tieba_spider(fullurl):
headers = {
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.146 Safari/537.36"
}
request = urllib2.Request(fullurl,headers = headers)
html = urllib2.urlopen(request).read()
4. python bs4分析html時,怎麼找到最底層的某個標簽
frombs4importBeautifulSoup
of=open(r'test.html','r')
html_doc=of.readlines()
of.close()
soup=BeautifulSoup(' '.join(html_doc),'html.parser')
printsoup.body.p
<!DOCTYPEhtml>
<html>
<head>
<title>test</title>
</head>
<body>
<p>
<b>xxxxxxxxx</b>
</p>
<b>
<ahref="aasdfd"></a>
<ahref="aasdfd"></a>
</b>
</body>
</html>
5. from bs4 import BeautifulSoup在python3用什麼替代了
不變,仍用 from bs4 import BeautifulSoup
如果沒有安裝bs4,需要在命令行工具中使用pip命令進行安裝,pip install bs4
6. python中bs4.beautiful解析有時候不加前邊的bs4 有什麼區別
這個就是看你是如何import包的
如果是import bs4,那麼就應該是bs4.BeautifulSoup
如果是from bs4 import BeautifulSoup,就可以直接使用BeautifulSoup