CentOS下convmv文件名编码转换问题

发布时间:2019-11-11编辑:脚本学堂
在centos下使convmv进行文件名编码转换的方法,有需要的问题的朋友参考下。

由最初的linux到后来的Windows再到现在的Linux,编码一直在转变。

程序文件是在windows下创建的,或是在windows压缩,然后上传到linux 解压的,或者直接上传的,Windows 的文件名中文编码默认为GBK,压缩或者上传后,文件名还会是GBK编码,虽然在ftp或者其它查看工具显示中文,但通过http访问,还会是无法找到文件,出现404错误,而Linux中默认文件名编码为UTF8,由于编码不一致所以导致了文件名乱码的问题,解决这个问题需要对文件名进行转码。

网上提供的方法,其中一个说用 unzip -O ….可以解决,但貌似这个参数不可用,还有说用jar解压的,额。我没有安装jdk ,太麻烦了,配置也比较费劲。

最后,使用了convmv,安装速度很快,不需要配置,直接可以使用,下面给大家分享一下这个小工具:
这里使用的是centos系统,不同系统的安装方法,大家百度之。

安装命令:
 

复制代码 代码示例:
yum install convmv

常用参数:
-r 递归处理子文件夹
–notest 真正进行操作,默认情况下是不对文件进行真实操作
–list 显示所有支持的编码
–unescap 可以做一下转义,比如把%20变成空格
-i 交互模式(询问每一个转换,防止误操作)
convmv 的使用方法:
convmv -f 源编码 -t 新编码 [选项] 文件名

例子:
 

复制代码 代码示例:
convmv -f GBK -t UTF-8 --notest -r 303i.com/*
(303i.com/*为要转编码的文件的当前目录)
 

这样转换以后“GBK编码的文件名”会被转换成UTF-8编码(只是文件名编码的转换,文件内容不会发生变化)。

注意:不要在NTFS和FAT文件系统中使用此命令,否则可能产生意外结果,如果要在Linux中正确的显示NTFS和 FAT的中文件名,可以通过mount参数来解决,具体方法参考man手册。