1. 為什麼都說爬蟲python好
python上手容易,第三方庫多(go現在第三方庫也多)。
如果不考慮採集速度,不用登陸——requests,單線程,簡單的代碼如下:
url = "http://dd.com"
html = requests.get(url)
html.encoding=('GBK') #避免編碼問題 如有報錯,另外測試
print (html.text[:1000]) #輸出1000個字元,避免ide假死。
本人沒學過java c#,不清楚他們兩個一個簡單爬蟲的代碼量,想來最起碼比python的要多。
不過說實話python的工作機會沒有 java c#的多,也就是說別想著花錢去培訓班培訓了幾個月,就能找到月入過萬的工作。
python的運行效率比其他編程語言要差,不考慮效率的情況下,可以用python寫寫小代碼,有錢的可以寫scrapy代碼,堆伺服器做分布式爬蟲。