python爬蟲反編譯_python 反編譯源碼還原py後怎麼把它再編譯成pyc

1. 怎麼用python編一個反編譯的軟體

python是不能反編譯的，因為得到了一個python的程序，就是得到了它的源代碼。 python是解釋性語言，沒有編譯這一步驟，和c語言和java語言是不一樣的

2. python如何防止反編譯

Python 編譯生成 pyc 僅僅為了提升載入速度，並不是為了防止破解，反編譯後和原來一模一樣。pyinstaller，py2exe，只是把 pyc 打個包，同樣很弱。代碼混淆也只能增加看懂代碼的難度，但並不能防止破解。所以最為穩妥的辦法只有修改Python解釋器，對源代碼進行加密，解釋器載入源代碼時再解密，這種方法雖然可以防止破解，但給自己帶來麻煩不說，發布程序是需要打包自己修改後的解釋器，相當麻煩。

3. python 反編譯源碼還原py後，怎麼把它再編譯成pyc

不用編譯
Python每次執行的時候，都會檢查py是否有同名的pyc
如果沒有或者pyc比py生成時間更早，就會自動把py翻譯成位元組碼的pyc
然後由pyc解釋執行

4. 如何使用python解決網站的反爬蟲

1、從用戶請求的Headers反爬蟲是最常見的反爬蟲策略。
偽裝header。很多網站都會對Headers的User-Agent進行檢測，還有一部分網站會對Referer進行檢測（一些資源網站的防盜鏈就是檢測Referer）。如果遇到了這類反爬蟲機制，可以直接在爬蟲中添加Headers，將瀏覽器的User-Agent復制到爬蟲的Headers中；或者將Referer值修改為目標網站域名[評論：往往容易被忽略，通過對請求的抓包分析，確定referer，在程序中模擬訪問請求頭中添加]。對於檢測Headers的反爬蟲，在爬蟲中修改或者添加Headers就能很好的繞過。
2、基於用戶行為反爬蟲
還有一部分網站是通過檢測用戶行為，例如同一IP短時間內多次訪問同一頁面，或者同一賬戶短時間內多次進行相同操作。[這種防爬，需要有足夠多的ip來應對]
（1）、大多數網站都是前一種情況，對於這種情況，使用IP代理就可以解決。可以專門寫一個爬蟲，爬取網上公開的代理ip，檢測後全部保存起來。有了大量代理ip後可以每請求幾次更換一個ip，這在requests或者urllib中很容易做到，這樣就能很容易的繞過第一種反爬蟲。
編寫爬蟲代理：
步驟：
1.參數是一個字典{'類型'：'代理ip：埠號'}
proxy_support=urllib.request.ProxyHandler({})
2.定製、創建一個opener
opener=urllib.request.build_opener(proxy_support)
3a.安裝opener
urllib.request.install_opener(opener)
3b.調用opener
opener.open(url)
用大量代理隨機請求目標網站，應對反爬蟲

5. 用Python2.7.1寫的小程序可以反編譯得到它的源代碼嗎

可以，網上有很多在線的反編譯工具，給你發幾個鏈接：
1、http://depython.com/index.php
2、https://github.com/eble/pyc2py
3、http://tool.lu/pyc/
不過好像第一個只適用於Python2.0-2.6，第二個適用於Python2.6，第三個應該可以反編譯2.7，你可以都試一下。

6. python源碼編程成pyc後，怎麼防止反編譯

無法防止反編譯，但可以混淆，讓你即使反編譯了，也看不懂語法
下面一段源碼

sd=1

defseed(s):
	globalsd
	sd=s

defrandn(n):
	globalsd
	sd=(sd*1103515245+12345)&0x7fffffff
	returnsd%n

defmain():
	seed(11)
	foriinxrange(4):
		printrandn(313)

if__name__=='__main__':
	main()

混淆後

oo000=1
if9-9:Ii.o0o00Oo0O-iI11I1II1I1I
defoooo(s):
globaloo000
oo000=s
if11-11:ii1I-ooO0OO000o
defii11i(n):
globaloo000
oo000=(oo000*1103515245+12345)&0x7fffffff
returnoo000%n
if66-66:iIiI*iIiiiI1IiI1I1*o0OoOoOO00
defI11i():
oooo(11)
forO0Oinxrange(4):
printii11i(313)
if78-78:i11ii11iIi11i.oOoO0oo0OOOo+IiiI/Iii1ii1II11i
if__name__=='__main__':
I11i()#

7. python生成的exe，反編譯成py的工具，大神提供下，感謝

你解開執行文件。如果是單個的文件，則執行它的時候在臨時目錄里可以找到解開的包。

在解開後的目錄中找到pyc文件，然後利用反編譯工具就可以將pyc反編譯成py文件。

但是有些程序是做了加密的。它們的pyc是它們重新寫python編譯器後自定義的加密格式，用通常的辦法無法解開。需要在內存里反編譯。
-------------
pyc反編譯工具有很多
你搜索uncompyle2， decompyle2, DePython, unpyc, uncompyle, pycdc 等
聽說python2.7而言， uncompyler是最好用的工具。

8. python寫的程序，轉成了exe文件，怎麼進行反編譯為python源碼

1、電腦桌面，輸入「win+R」組合鍵，在彈出窗口中輸入「cmd」，點擊確定。

9. python爬蟲怎麼處理反爬蟲

下面的一些解決方案

IP地址驗證
禁用Cookie
違反爬蟲規則文件
限制訪問頻率
圖形驗證碼

具體詳細內容可參考《瘋狂Python講義》

10. python爬蟲中怎麼寫反爬蟲

1、通過UA判斷：UA是UserAgent，是要求瀏覽器的身份標志。
UA是UserAgent，是要求瀏覽器的身份標志。反爬蟲機制通過判斷訪問要求的頭部沒有UA來識別爬蟲，這種判斷方法水平很低，通常不作為唯一的判斷標准。反爬蟲非常簡單，可以隨機數UA。
2、通過Cookie判定：Cookie是指會員帳戶密碼登錄驗證
Cookie是指會員帳戶密碼登錄驗證，通過區分該帳戶在短時間內爬行的頻率來判斷。這種方法的反爬蟲也很困難，需要多賬戶爬行。
3、通過訪問頻率判定
爬蟲類經常在短時間內多次訪問目標網站，反爬蟲類機制可以通過單個IP訪問的頻率來判斷是否是爬蟲類。這樣的反爬方式難以反制，只能通過更換IP來解決。
4、通過驗證碼判定
驗證碼是反爬蟲性價比高的實施方案。反爬蟲通常需要訪問OCR驗證碼識別平台，或者使用TesseractOCR識別，或者使用神經網路訓練識別驗證碼。
5、動態性頁面載入
使用動態載入的網站通常是為了方便用戶點擊和查看，爬蟲無法與頁面互動，這大大增加了爬蟲的難度。
一般情況下，用戶對網站進行信息爬取時，都要受到「爬蟲」的約束，使用戶在獲取信息時受到一定的阻礙

導航:首頁 > 源碼編譯 > python爬蟲反編譯

python爬蟲反編譯

與python爬蟲反編譯相關的資料