⑴ 用python写好的程序如何在其他计算机上运行
"直接用输入法打出来的字"
--
这里含好几个过程.
(1)当你用键盘打字时,从键盘进入计算机的是ascii码序列.
(2)“输入法”把
ascii码序列
转换成
输入法
自己规定的
码.
(3)你在一个窗上看到的东西,例如
notepad
的文本编辑窗,wordpad
的文本编辑窗,或
dos
黑窗(控制台命令窗)那是
把
“输入法自己规定的码”显示出来,这里有一个编码到字体(font)到bitmap点阵图形的转换.只有当它们匹配时才能显示出有意义的
字的形状.否则看上去是“乱码”.
以dos
黑窗为例,只有正确设置它的
所谓
代码页(code
page)
,才能显示出有意义的字形.
gbk的code
page是cp936;
big5的code
page是cp950;
gb2312的code
page是cp20936;
dos
命令
chcp
不带参数
可以显示
当前
“代码页”,加参数可以改变
“代码页"
例如:chcp
936
例如:chcp
437
(4)从文本编辑窗
到
存放的文件
也有
代码的转换.
例如,notepad,可以存放为
unicode
小端码,unicode
大端码,utf-8码.
unicode
文件会在文件头自动添加
unicode
bom
(
byte-order
mark)
---
所以,直接用输入法打出来的字是什么编码的呢,具体情况具体分析,不可一概而论.
⑵ Python 源程序编码注意事项
默认情况下,Python 源文件是 UTF-8 编码。在此编码下,全世界大多数语言的字符可以同时用在字符串、标识符和注释中 — 尽管 Python 标准库仅使用 ASCII 字符作为标识符,这只是任何可移植代码应该遵守的约定。如果要正确的显示所有的字符,你的编辑器必须能识别出文件是 UTF-8 编码,并且它使用的字体能支持文件中所有的字符。
你也可以为源文件制定不同的字符编码。为此,在 #! 行(首行)后插入至少一行特殊的注释行来定义源文件的编码:
# -*- coding: encoding -*-
通过此声明,源文件中所有的东西都会被当作用 encoding 指代的 UTF-8 编码对待。在 Python 库参考手册 codecs 一节中你可以找到一张可用的编码列表。
例如,如果你的编辑器不支持 UTF-8 编码的文件,但支持像 Windows-1252 的其他一些编码,你可以定义:
# -*- coding: cp-1252 -*-
这样就可以在源文件中使用 Windows-1252 字符集中的所有字符了。这个特殊的编码注释必须在文件中的 第一或第二 行定义。
⑶ 怎么在Python里使用UTF-8编码
概述
在python代码即.py文件的头部声明即可
解析
py文件中的编码
Python
默认
脚本文件
都是
ANSCII
编码的,当文件
中有非
ANSCII
编码范围内的字符的时候就要使用"编码指示"来修正一个
mole
的定义中,如果.py文件中包含中文字符(严格的说是含有非anscii字符),则需要在第一行或第二行指定编码声明:
#
-*-
coding=utf-8
-*-
#coding=utf-8
#
以上两种选其一即可
其他的编码如:gbk、gb2312也可以;否则会出现:
SyntaxError:
Non-ASCII
character
'\xe4'
in
file
test.py
on
line
3,
but
no
encoding
declared;
see
http://www.python.org/peps/pep-0263.html
for
details
python中的编码与解码
先说一下python中的字符串类型,在python中有两种字符串类型,分别是
str
和
unicode,他们都是basestring的
派生类
;
str类型是一个包含
Characters
represent
(at
least)
8-bit
bytes的序列;
unicode
的每个
unit
是一个
unicode
obj;
在str的文档中有这样的一句话:
The
string
data
type
is
also
used
to
represent
arrays
of
bytes,
e.g.,
to
hold
data
read
from
a
file.
也就是说在读取一个文件的内容,或者从网络上读取到内容时,保持的对象为str类型;如果想把一个str转换成特定编码类型,需要把str转为Unicode,然后从unicode转为特定的编码类型如:utf-8、gb2312等。
拓展内容
utf-8编码
UTF-8(8-bit
Unicode
Transformation
Format)是一种针对Unicode的可变长度
字符编码
,也是一种
前缀码
。它可以用来表示Unicode标准中的任何字符,且其编码中的第一个字节仍与ASCII兼容,这使得原来处理ASCII字符的软件无须或只须做少部分修改,即可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或发送文字的应用中,优先采用的编码。
UTF-8使用一至六个字节为每个字符编码(尽管如此,2003年11月UTF-8被RFC
3629重新规范,只能使用原来Unicode定义的区域,U+0000到U+10FFFF,也就是说最多四个字节):
1、128个US-ASCII字符只需一个字节编码(Unicode范围由U+0000至U+007F)。
2、带有附加符号的拉丁文、
希腊文
、
西里尔字母
、亚美尼亚语、
希伯来文
、
阿拉伯文
、叙利亚文及它拿字母则需要两个字节编码(Unicode范围由U+0080至U+07FF)。
3、其他
基本多文种平面
(BMP)中的字符(这包含了大部分
常用字
,如大部分的汉字)使用三个字节编码(Unicode范围由U+0800至U+FFFF)。
4、其他极少使用的Unicode
辅助平面
的字符使用四至六字节编码(Unicode范围由U+10000至U+1FFFFF使用四字节,Unicode范围由U+200000至U+3FFFFFF使用五字节,Unicode范围由U+4000000至U+7FFFFFFF使用六字节)。
对上述提及的第四种字符而言,UTF-8使用四至六个字节来编码似乎太耗费资源了。但UTF-8对所有常用的字符都可以用三个字节表示,而且它的另一种选择,UTF-16编码,对前述的第四种字符同样需要四个字节来编码,所以要决定UTF-8或UTF-16哪种编码比较有效率,还要视所使用的字符的分布范围而定。不过,如果使用一些传统的压缩系统,比如DEFLATE,则这些不同编码系统间的的差异就变得微不足道了。若顾及传统压缩算法在压缩较短文字上的效果不大,可以考虑使用Unicode标准压缩格式(SCSU)。
互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。互联网邮件联盟(IMC)建议所有电子邮件软件都支持UTF-8编码。
⑷ Python中怎么定义中文编码
在程序的第一行指定中文编码方式,并且输入字符为unicode,然后编码成gb18030方式,完整程序如下:
-------------------------------------
# -*- coding: gb18030 -*-
#!/usr/bin/python
cont = raw_input( u"请输入:".encode("gb18030") )
print cont
-------------------------------------
输入的内容也可以是中文
⑸ 程序小白,问一下php网站想要运行Python文件需要怎么做
关于PHP调用Python数据传输问题
这是以前大学时做项目出现的问题,现在把它挪上来,希望给遇到问题的未来大佬给出一些小的思路,请大佬们不要大意的帮我改正,如果出现问题或者有更好的解决方法,希望大家可以给出,谢谢!
以前小组开展项目实训,我们小组选择的是大数据分析,其中有一个用python进行文本分析之后对用户输入的数据进行分析,然后输出对应的岗位及其他。要求是前端将文本要求传到后台php,php调用python程序处理,再将数据传给php,然后再传到前端,进行下一步处理。结果python传回的数据,在前端显示乱码了,而且得出的结果与单独运行python代码完全不同,一句话,就是php调用python程序期间出错了。
我很认真的检查了好几遍,确定自己php和python所有的编码都是用的utf-8编码,所以这一点是毋庸置疑的,那么问题究竟出在哪呢?php调用python语句是
$job = "有责任心,擅长JAVA";//传入的文本信息
$area = 'E:/text/sim_str.py';//Python程序的地址
$cmd = system("python3 $area 2>C:/Users/Administrator/Desktop/2.txt $job",$ret);//2>是将报错内容定位到这个文件,$ret是一个返回参数,0是正常,1是出错。
最后经过多次的测试,我发现传过去时对文字的编码出现了问题,应该不是UTF-8编码了。有位大神说,这是因为windows系统会自己对传输的信息进行再次编码。然后 我想直接改编码,结果这个python3编码改变出现了问题。最后我的解决方案是不通过系统传送,而是直接通过第三方数据库。双方都调用数据库。一切都可以解决了。
PS:后来又遇见过这种问题,我将python代码进行了修改,让它最终可以直接只传递数字,再在前端对数字进行判断。
⑹ Python为什么一运行就是乱码
可能是编码问题,开头加上coding:utf-8试试。
⑺ python中前后台怎么进行编码转换
coding声明的编码,和你py文件本身的编码,要一致。
你py代码中,所要处理的字符串,即你的html的编码,你也要清楚
然后才可以正常的,decode或encode,才能得到你要的unicode字符串,某种编码的字符串。
你没有解释清楚你的背景,所以没法帮你。
相关的原理和示例代码,我早就写了教程了。
感兴趣的,自己google搜:
【整理】关于HTML网页源码的字符编码(charset)格式(GB2312,GBK,UTF-8,ISO8859-1等)的解释
Python专题教程:字符串和字符编码
其中有很多相关内容的解释,比如:
【总结】Python2.x中常见字符编码和解码方面的错误及其解决办法
⑻ 用什么工具运行python代码
python中常见的ide
Sublime Text
Sublime Text 是开发者中最流行的编辑器之一,多功能,支持多种语言,而且在开发者社区非常受欢迎。Sublime 有自己的包管理器,开发者可以使用TA来安装组件,插件和额外的样式,所有这些都能提升你的编码体验。
推荐学习《python教程》
PyCharm
PyCharm是来自JetBrains公司的全功能python开发环境。过去的15年里JetBrains一直致力于发展顶级的开发工具,旨在让开发工作变得轻松和愉快。
PyCharm是专业的python集成开发环境,有两个版本。一个是免费的社区版本,另一个是面向企业开发者的更先进的专业版本。PyCharm的普及可以从这一事实来衡量,即有很多大品牌公司用户,像Twitter,Groupon,Spotify,eBay和Telefonica等都在用PyCharm。PyCharm专业版本支持更多高级的功能,比如远程开发功能、数据库支持以及对web开发框架的支持等等。
我最喜欢PyCharm的原因是因为它支持很多的第三方web开发框架,比如Django、 Pyramid、web2py、google app engine 和 Flask,这些也使得它成为了一个完整的快速应用集成开发环境。
WingIDE
WingIDE是个相当优秀的 IDE;其编辑器包括大量语言的语法标签高亮显示,虽然它只是个面向 Python 的工具。源代码浏览器对浏览项目或模块非常实用(表现在可导航源代码和文档行摘要中)。虽然没有监视器,但调试器设计得很好。编辑器有优秀的命令自动完成和函数跳转列表,但是没有代码合并。面向项目风格的 IDE 对于大型产品非常有用(在这方面,除了 Komodo 以外,它是大多免费 IDE 中较好的)。总体的界面就像增强的 Idle,使用了与许多 TK 和 XWindow 界面类似的“多窗口”排列方式。我喜欢使用对接和嵌入(这方面,并不是过多使用 MS Visual Studio 造成的),但不同的开发人员可能喜欢不同风格的窗体。WingIDE 是个很有前途的开发环境。
Vim
Vim 是高级文本编辑器,旨在提供实际的 Unix 编辑器'Vi'功能,支持更多更完善的特性集。Vim编辑器最重要的功能就是它不要求使用鼠标(除了GUI版本外)。一开始,你可能会觉得这是个非常糟糕的做法,但是只要你投入时间——是的,这很花时间——学习快捷组合键,就可以大幅提升工作流的速度。Vim 不需要花费太多的学习时间,一旦你需要一个无缝的编程体验,那么就会把 Vim 集成到你的工作流中。
Eric5
Eric5 是一个集成了项目管理功能的 Python 集成开发环境。提供无限制数量的编辑器、集成的 Python Shell、集成调试器、集成对包括 Subversion 和 Mercurial 版本控制系统的支持。集成单元测试等等。可通过插件系统来进行功能扩展,与Eric4 相比,Eric5 是基于 Python 3 的变种。
⑼ python unicode编码
python unicode编码:
下面的代码创建了一个Unicode字符串,用UTF-8编码器将它编码,然后写入到一个文件中去,接着把数据从文件中读回来,解码成Unicode字符串对象,最后,打印出Unicode字符串,用以确认程序正确地运行。
在Linux中编写,在VIM中输入如下代码,保存为uniFile.py
#/home/xiaopeng/python/code/uniFile.py
'''
:Writes
aUnicodestringtoafileinutf-8andreadsitbackin
'''
CODEC='utf-8'编码方式
FILE='unicode.txt'要存的文件名
hello_out=u"Helloworld "创建了一个Unicode格式的字符串
bytes_out=hello_out.encode(CODEC)用UTF-8编码
f=open(FILE,'w')
f.write(bytes_out)写入指定文件中
f.close()
f=open(FILE,'r')
bytes_in=f.read()读取
f.close()
hello_in=bytes_in.decode(CODEC)解码
printhello_in打印
在终端中输入:python uniFile.py
结果打印出 Hello world
然后在python目录下会发现多了一个名为unicode.txt的文件,用cat命令查看一下,发现里面的内容和打印的结果一样.
把Unicode应用到实际中注意一下四点:
1程序中出现字符串时一定要加一个前缀u
2不要用str()函数,用Unicode()代替
3 不要用过时的string模块。如果传给它非ASCII码,它会把一切搞砸。
4 不到必须时不要在你的程序里编解码Unicode字符,只在你要写入文件或者数据库或者网络时,才调用encode()函数和decode()函数。
⑽ python有哪几种编码方式
第一种:ASCII码。是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,它是现今最通用的单字节编码系统,并等同于国际标准IS/IEC
646。
由于计算机是美国人发明的,因此,最早只有127个字母被编码到计算机李,也就是大小写英文字母、数字和一些符号,这个编码表被称为ASCII编码,比如大写字母A的编码是65,小写字母a的编码是97,后128个称为扩展ASCII码。
第二种:GBK和GB2312。能在计算机中显示中文字符是至关重要的,然而ASCII表里一个偏旁部首都没有,所以我们需要一个关于中文和数字对应的关系表,一个字节只能最多表示256个字符,用处理中文显然一个字节是不够的,所以我们需要采用两个字节来表示,所以中国制定了GB2312编码,用来将中文编写进去。
第三种:Unicode。因为各个国家都有一套自己的编码,所以无法避免冲突,因此Unicode诞生了。它可以把所有语言都统一到一套编码里,这样就不会存在乱码问题了,现代操作系统和大多数编程语言都直接支持Unicode。
第四种:UFT-8。基于节约的原则,出现了把Unicode编码转化为可变长编码的UTF-8编码。而UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节,常用的英文字母被编码成一个字节,汉字通常是3个字节,只有很生僻的字符才会被编码成4-6个字节,如果你要传输的文本包含大量英文字符,用UTF-8编码就能节省空间。