python中文编码问题_python有哪几种编码方式

⑴ python读写有中文的文件时，是否需要设置编码格式

需要：
with open("路径","模式",encoding="utf8") as f:

如果不确定编码格式，后面读取可能会出问题

⑵ Python中怎么定义中文编码

在程序的第一行指定中文编码方式，并且输入字符为unicode，然后编码成gb18030方式，完整程序如下:
-------------------------------------
# -*- coding: gb18030 -*-
#!/usr/bin/python

cont = raw_input( u"请输入:".encode("gb18030") )

print cont
-------------------------------------
输入的内容也可以是中文

⑶ python 中文乱码问题

记事本是用utf-8保存你下载了东西的。你下载下来的不是utf-8，保存下来中文当然就乱码了。而gbk和utf-8里英文的编码值都一样，所以不受影响。

一个方法是你留意下目标页面的charset 和 contentType，另一个方法是你复制一个目标页面的字，放cmd里看它的编码长度，以此来判断它的原来编码。

⑷ Python 中文编码问题

我这边输出没有什么问题。

下面是输出：
i = 1
s['statuses'][0]['text'] = 出轨是男人的天性，防小三是女人一生的战役。
s['statuses'][1]['text'] = 漂亮女孩有时候比普通女孩更可怜。男人可以很坦然的拒绝普通女孩的感情和身体，但是男人会欺骗漂亮女孩的感情从而得到她的身体。这就是为什么古人说红颜命薄，你们感受一下。
s['statuses'][2]['text'] = 留几手教你如何利用空闲时间学习
。。。
i = 2
s['statuses'][20]['text'] = 骂人，其实内容并不重要，一个小萝莉，满嘴脏话，也吓不住人。
。。。
i = 3
s['statuses'][40]['text'] = 我不就是在你家住的时候吃了几只烧鸡没给你钱么？至于这么编排我么？这情节都是你在哪本言情小说里扒出来的吧？
后面省略了。

⑸ python2默认不支持中文编码，怎么实现对中文编码的支持

Python 输出 "Hello, World!"，英文没有问题，但是如果你输出中文字符"你好，世界"就有可能会碰到中文编码问题。
Python 文件中如果未指定编码，在执行过程会出现报错：

12

#!/usr/bin/pythonprint "你好，世界";

以上程序执行输出结果为：

12

File "test.py", line 2SyntaxError: Non-ASCII character '\xe4' in file test.py on line 2, but no encoding declared; see hp-0263.html for details

Python中默认的编码格式是 ASCII 格式，在没修改编码格式时无法正确打印汉字，所以在读取中文时会报错。
解决方法为只要在文件开头加入 # -*- coding: UTF-8 -*- 或者 #coding=utf-8 就行了。
实例(Python 2.0+)

1234

#!/usr/bin/python# -*- coding: UTF-8 -*- print "你好，世界";

输出结果为：

1

你好，世界

所以如果大家再学习过程中，代码中包含中文，就需要在头部指定编码。
注意：Python3.X 源码文件默认使用utf-8编码，所以可以正常解析中文，无需指定 UTF-8 编码。

⑹ Python2.7 中文字符编码，使用Unicode时，选择什么编码格式

终端显示字符的编码（windows下终端是cmd，linux下是各种terminal，远程登录是putty或者xshell）
shell环境的编码。比如中文版windows用的是gbk（向下兼容gb2312），大多数linux发行版使用的是utf-8（LANG=zh_CN.UTF-8）。
文本文件的编码。这个通常取决于你的编辑器，而且有的编辑器支持多种编码的话，你可以在文本开头位置指定编辑器使用特定编码。比如# -*- coding: utf8 -*-，vim看到这行会默认将这个脚本认定为utf-8兼容编码格式。
应用程序的内部编码。一个字符串，作为数据只是一个字节数组，但是作为字符的数组，就有一个解析方式。java和python的内部字符编码是utf-16，python和java都支持用不同的编码来对字节数组进行decode来得到字符数组。

⑺ python编码的问题

你好：
编码的问题确实头疼；
我在博客园摘抄了一些编码问题；
这个问题主要是因为：
print 是将字符串转化为系统的编码输出。
而list存储的你设置的编码。

⑻ python2.7打印中文乱码怎么办

由于python默认以ASCII编码，所以不支持中文。所以我们需要在代码前面写上“#_*_ coding:utf-8 _*_”或者#coding=utf-8.当然，如
果你代码中没有中文，就不需要加上了。
还有一个原因，由于python所运行的操作系统决定的，windows默认的编码方式是GBK编码，所以这也是一个导致中文乱码的原因之
一。
建议是不管你用什么，先在代码前面加上这一串，一定不会出现问题。
推荐学习《Python教程》。

⑼ python命令行输入中文乱码怎么办

python2.X，代码中指定了UTF-8，但是在cmd命令行窗口时，打印的中文仍然会乱码。

在python3不存在该问题

运行结果：

原因

中文windows默认的输出编码为gbk ，与脚本中定义的UTF-8不一样，所以出现了解码失败的情况。

相关推荐：《Python基础教程》

解决方法

有如下两种方法可以解决这个问题

方法一

我们可以通过先把中文解码为unicode，然后再转化为gbk来解决这个问题：

修改后运行结果：

方法二

当然，我们也可以通过改变cmd命令行窗口的输出格式来解决这个问题：

·chcp 65001 就是换成UTF-8代码页

·chcp 936 可以换回默认的GBK

但是这样就降低了脚本的兼容性，在其他环境运行的时候可能还会出现这样的错误，而且可能会影响其他脚本运行，所以推荐使用第一种方法。

⑽ python有哪几种编码方式

第一种：ASCII码。是基于拉丁字母的一套电脑编码系统，主要用于显示现代英语和其他西欧语言，它是现今最通用的单字节编码系统，并等同于国际标准IS/IEC
646。
由于计算机是美国人发明的，因此，最早只有127个字母被编码到计算机李，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母a的编码是97，后128个称为扩展ASCII码。
第二种：GBK和GB2312。能在计算机中显示中文字符是至关重要的，然而ASCII表里一个偏旁部首都没有，所以我们需要一个关于中文和数字对应的关系表，一个字节只能最多表示256个字符，用处理中文显然一个字节是不够的，所以我们需要采用两个字节来表示，所以中国制定了GB2312编码，用来将中文编写进去。
第三种：Unicode。因为各个国家都有一套自己的编码，所以无法避免冲突，因此Unicode诞生了。它可以把所有语言都统一到一套编码里，这样就不会存在乱码问题了，现代操作系统和大多数编程语言都直接支持Unicode。
第四种：UFT-8。基于节约的原则，出现了把Unicode编码转化为可变长编码的UTF-8编码。而UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成一个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节，如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。

导航:首页 > 编程语言 > python中文编码问题

python中文编码问题

与python中文编码问题相关的资料