python爬虫反编译_python 反编译源码还原py后怎么把它再编译成pyc

1. 怎么用python编一个反编译的软件

python是不能反编译的，因为得到了一个python的程序，就是得到了它的源代码。 python是解释性语言，没有编译这一步骤，和c语言和java语言是不一样的

2. python如何防止反编译

Python 编译生成 pyc 仅仅为了提升加载速度，并不是为了防止破解，反编译后和原来一模一样。pyinstaller，py2exe，只是把 pyc 打个包，同样很弱。代码混淆也只能增加看懂代码的难度，但并不能防止破解。所以最为稳妥的办法只有修改Python解释器，对源代码进行加密，解释器加载源代码时再解密，这种方法虽然可以防止破解，但给自己带来麻烦不说，发布程序是需要打包自己修改后的解释器，相当麻烦。

3. python 反编译源码还原py后，怎么把它再编译成pyc

不用编译
Python每次执行的时候，都会检查py是否有同名的pyc
如果没有或者pyc比py生成时间更早，就会自动把py翻译成字节码的pyc
然后由pyc解释执行

4. 如何使用python解决网站的反爬虫

1、从用户请求的Headers反爬虫是最常见的反爬虫策略。
伪装header。很多网站都会对Headers的User-Agent进行检测，还有一部分网站会对Referer进行检测（一些资源网站的防盗链就是检测Referer）。如果遇到了这类反爬虫机制，可以直接在爬虫中添加Headers，将浏览器的User-Agent复制到爬虫的Headers中；或者将Referer值修改为目标网站域名[评论：往往容易被忽略，通过对请求的抓包分析，确定referer，在程序中模拟访问请求头中添加]。对于检测Headers的反爬虫，在爬虫中修改或者添加Headers就能很好的绕过。
2、基于用户行为反爬虫
还有一部分网站是通过检测用户行为，例如同一IP短时间内多次访问同一页面，或者同一账户短时间内多次进行相同操作。[这种防爬，需要有足够多的ip来应对]
（1）、大多数网站都是前一种情况，对于这种情况，使用IP代理就可以解决。可以专门写一个爬虫，爬取网上公开的代理ip，检测后全部保存起来。有了大量代理ip后可以每请求几次更换一个ip，这在requests或者urllib中很容易做到，这样就能很容易的绕过第一种反爬虫。
编写爬虫代理：
步骤：
1.参数是一个字典{'类型'：'代理ip：端口号'}
proxy_support=urllib.request.ProxyHandler({})
2.定制、创建一个opener
opener=urllib.request.build_opener(proxy_support)
3a.安装opener
urllib.request.install_opener(opener)
3b.调用opener
opener.open(url)
用大量代理随机请求目标网站，应对反爬虫

5. 用Python2.7.1写的小程序可以反编译得到它的源代码吗

可以，网上有很多在线的反编译工具，给你发几个链接：
1、http://depython.com/index.php
2、https://github.com/eble/pyc2py
3、http://tool.lu/pyc/
不过好像第一个只适用于Python2.0-2.6，第二个适用于Python2.6，第三个应该可以反编译2.7，你可以都试一下。

6. python源码编程成pyc后，怎么防止反编译

无法防止反编译，但可以混淆，让你即使反编译了，也看不懂语法
下面一段源码

sd=1

defseed(s):
	globalsd
	sd=s

defrandn(n):
	globalsd
	sd=(sd*1103515245+12345)&0x7fffffff
	returnsd%n

defmain():
	seed(11)
	foriinxrange(4):
		printrandn(313)

if__name__=='__main__':
	main()

混淆后

oo000=1
if9-9:Ii.o0o00Oo0O-iI11I1II1I1I
defoooo(s):
globaloo000
oo000=s
if11-11:ii1I-ooO0OO000o
defii11i(n):
globaloo000
oo000=(oo000*1103515245+12345)&0x7fffffff
returnoo000%n
if66-66:iIiI*iIiiiI1IiI1I1*o0OoOoOO00
defI11i():
oooo(11)
forO0Oinxrange(4):
printii11i(313)
if78-78:i11ii11iIi11i.oOoO0oo0OOOo+IiiI/Iii1ii1II11i
if__name__=='__main__':
I11i()#

7. python生成的exe，反编译成py的工具，大神提供下，感谢

你解开执行文件。如果是单个的文件，则执行它的时候在临时目录里可以找到解开的包。

在解开后的目录中找到pyc文件，然后利用反编译工具就可以将pyc反编译成py文件。

但是有些程序是做了加密的。它们的pyc是它们重新写python编译器后自定义的加密格式，用通常的办法无法解开。需要在内存里反编译。
-------------
pyc反编译工具有很多
你搜索uncompyle2， decompyle2, DePython, unpyc, uncompyle, pycdc 等
听说python2.7而言， uncompyler是最好用的工具。

8. python写的程序，转成了exe文件，怎么进行反编译为python源码

1、电脑桌面，输入“win+R”组合键，在弹出窗口中输入“cmd”，点击确定。

9. python爬虫怎么处理反爬虫

下面的一些解决方案

IP地址验证
禁用Cookie
违反爬虫规则文件
限制访问频率
图形验证码

具体详细内容可参考《疯狂Python讲义》

10. python爬虫中怎么写反爬虫

1、通过UA判断：UA是UserAgent，是要求浏览器的身份标志。
UA是UserAgent，是要求浏览器的身份标志。反爬虫机制通过判断访问要求的头部没有UA来识别爬虫，这种判断方法水平很低，通常不作为唯一的判断标准。反爬虫非常简单，可以随机数UA。
2、通过Cookie判定：Cookie是指会员帐户密码登录验证
Cookie是指会员帐户密码登录验证，通过区分该帐户在短时间内爬行的频率来判断。这种方法的反爬虫也很困难，需要多账户爬行。
3、通过访问频率判定
爬虫类经常在短时间内多次访问目标网站，反爬虫类机制可以通过单个IP访问的频率来判断是否是爬虫类。这样的反爬方式难以反制，只能通过更换IP来解决。
4、通过验证码判定
验证码是反爬虫性价比高的实施方案。反爬虫通常需要访问OCR验证码识别平台，或者使用TesseractOCR识别，或者使用神经网络训练识别验证码。
5、动态性页面加载
使用动态加载的网站通常是为了方便用户点击和查看，爬虫无法与页面互动，这大大增加了爬虫的难度。
一般情况下，用户对网站进行信息爬取时，都要受到“爬虫”的约束，使用户在获取信息时受到一定的阻碍

导航:首页 > 源码编译 > python爬虫反编译

python爬虫反编译

与python爬虫反编译相关的资料