文件夹和文件的名字里面含有中文字符串时出现乱码的处理:
把该字符串编码转换为unicode或gbk编码的字符串来解决。代码第二行如有声明编码格式如utf-8,则代码里面出现中文字符串的地方就按照utf-8格式的字符串去处理;如没有编码声明,则windows系统默认为gbk编码,而linux默认为utf-8编码。
#!/usr/bin/env python
# coding:utf-8
import os
# 对变量s的值字符串 '中国' 按utf-8编码处理
s = '中国'
# 创建的文件夹为乱码,乱码原因:代码编码为utf-8的中文字符串,但windows系统默认使用gbk编码,所以会乱码,
只有它们一致才不乱码
# os.mkdir(s)
# 下面2种方法都能创建含有中文字符串的文件夹及文件
# 把s的值进行解码,由于其为utf-8编码,所以使用utf-8解码
# os.mkdir(s.decode('utf-8'))
# windows系统的文件夹和文件的名字需要为unicode或gbk编码的字符串,才可以正常显示不乱码。
# os.mkdir(s.decode('utf-8').encode('gbk'))
# f = open(s.decode('utf-8') + '.txt','w')
f = open(s.decode('utf-8').encode('gbk') + '.txt','w')
f.close()
此外,还发现一个现象,是否在使用unittest模块时,创建含有中文名字的文件夹时,是有区别的。
没有使用unittest模块时,可以直接创建含有中文的文件夹,也没出现乱码。代码如下:
#!/usr/bin/env python
# coding:utf-8
import os
import chardet
s = raw_input('请输入要创建的文件夹名字:')
# s的值为ascii字符串,即gbk字符串
print chardet.detect(s)
# 发现不在unittest模块里面,可以不用编码解码处理,直接进行创建含有中文字符串的文件夹,结果也没发现乱码。而
且文件代码声明为utf-8,也没有进行转码,真是不可思议。
os.mkdir(s)
os.chdir(s)
python学习网,免费的在线学习python平台,欢迎关注!