1. python和SQLite問題,怎麼解決
python編碼如果把中文數據存儲至sqlite資料庫某一欄位中,再通過查詢語句取出並進行相關的字元串操作時,經常會出現錯誤提示,類似於UnicodeDecodeError,提示某一類型編碼不能轉換。
出現這個問題的原因是因為python默認使用unicode處理sqlite3的TEXT類型(varchar類型也是如此,因為在sqlite中varchar其實就是TEXT)。python把中文存入資料庫時使用了類似於GBK這樣的編碼,取出時會嘗試把TEXT類型數據轉換成unicode,從而出現錯誤。
由此導致的另一個不容易發現的錯誤是存儲在資料庫中的中文進行了base64之類的編碼,在python中取出時不會存在錯誤,但是再進行base64解碼,並與sqlite3中取出的其它text欄位進行字元串拼接等處理,就出現編碼轉換錯誤,很難發現問題原因,可以把其它text欄位進行如'aaa'.encode('gbk')編碼成GBK碼解決,但不提倡這種方法,更好方法如下:
解決方法是python連接sqlite資料庫後進行如下設置:
conn = sqlite3.connection(「……」)
conn.text_factory = str
另外為了python代碼中硬編碼的中文字元串不出現問題,除了在源碼開始添加
# -*- coding:utf-8 -*-
還要設置python源碼的編碼為utf-8
import sys
reload(sys)
sys.setdefaultencode('utf8')