设置linux字符集为UTF-8设置linux字符集
可以在命令行执行file命令查看返回信息以便确认文件的字符集编码。
格式:file文件名
例如:
#fileABClog
ABClog:UTF-8Unicodetext
从结果看该文件是utf-8格式
#filewordtxtwordtxt:ASCIItext
从结果看该文件是gbk格式
如果不符合要求,可以通过iconv命令更改文件格式。
linux中为什么字符集是utf-8的文件有些是乱码有些正常?
在UTF-8中,0-127号的字符用1个字节来表示,使用和US-ASCII相同的编码,其他编码默认是是1-7位对于ASCII吗,因此无论哪种编码,ASCII对于的编码都不会有问题,而其他编码各成一家,如果你把编码设错了就会乱码utf8并不兼容其他编码(ASCII除外),他仅是为了解决编码混战,而产生的一个所有国家都能使用的编码(它是unicode的一种实现)
1998年中国发明了什么计算机操作系统?
1998年中国发明了自主版权的“红旗Linux”计算机操作系统。
中国科学院软件研究所开发的“红旗Linux”是目前国内唯一一套支持大字符集的中文Liunx操作系统,利用了Linux公开源代码的特性,对它进行了增值开发,包括对其内核的改进,增加了设备驱动程序,简化了安装、配置过程,开发出了友好的界面,具有强大的硬件兼容性和数据库支持能力。尤为值得一提的是:红旗Linux针对不同的应用需求提供了各种流行的网络应用服务,可以帮助企业和个人用户迅速建立起代理服务器、防火墙、路由器、工作站、Internet服务器等,并使原来在UNIX上的应用软件100%可以在Linux上使用。
该操作系统自推出以来,已经售出10余万套,用户反映普遍较好,展示了国产操作系统的强大生命力。一批基于此操作平台的应用软件如油藏模拟软件也已经可以成为国外昂贵的同类软件的替代产品。
linux下文件编码格式转换方法(gb18030/utf-8)
在 Linux 做开发或者系统管理遇到乱码是经常的事情,主要windows下中文的默认编码是bg2312,而 linux下是utf-8。很多时候 涉及到和windows平台系统的通信免不了编码的转化,可能大部分人都用iconv库函数(包含在glib中)和iconv命令来执行编码转换,即:
iconv -f gb18030 -t utf-8 file1txt -o file2txt
说实话这个命令不好使,一方面容易重复转换,另一方面不支持通配符,无法成批转 换,文件少了还好说,要是一大堆文件岂不是要累死?
今天我要推荐的是另一个 Shell 下编码转换工具enca。用它不仅可以转换编码,还可以查看文件的原始编码,而且还支持成批转换。使用上也比iconv方便一些。安装enca很简单,一般用源安装就行了,enca用法如下:
enca -L 当前语言 文件名
enca -L zh_CN file //检查文件的编码
enca -L 当前语言 -x 目标编码 文件名
enca -L zh_CN -x UTF-8 file //将文件编码转换为”UTF-8″编码
enca -L zh_CN -x UTF-8 < file1 > file2 //如果不想覆盖原文件可以这样
除了有检查文件编码的功能以外,”enca”还有一个好处就是如果文件本来就是你要转换的那种编码,它不会报错,还是会print出结果来, 而”iconv”则会报错。这对于脚本编写是比较方便的事情。
设置一下环境变量就好了,如果只是想临时设置一下,直接输入 export lang=EN_us,就好了, 如果想长期生效就需要修改环境变量的参数文件了, 不清楚你现在用的是那个操作系统,
0条评论