文栏 - 信息技术 - 浏览文章 - 常用文本文件编码判断方式
常用文本文件编码判断方式
发布时间: 2007/6/24 12:58:44 作者: 出处:
  开头字节   Charset / encoding  
    
  没有特殊字符     Ansi

  EF  BB  BF       UTF-8  
    
  FE  FF           UTF-16/UCS-2,   little endian,就是一般所说的UniCode  
    
  FF  FE           UTF-16/UCS-2,   Unicode Big Endian 正好是上面 Unicode 的反转  
    
  FF  FE  00  00   UTF-32/UCS-4,   little endian.  
    
  00  00  FE  FF   UTF-32/UCS-4,   big-endian.

JAVA里可以用一下方法:
InputStreamReader.getEncoding() 返回此流使用的字符编码的名称。
OutputStreamWriter.getEncoding() 返回此流使用的字符编码的名称。
1/1页次 第1页
所属分类: 信息技术   所属专题: 他山之石
共有 4745 人次浏览

评论作者:
电子邮件:
评论内容:
投票评价:
验 证 码:
图片包含4个随机字符,点击刷新
请输入上面图片中的随机字符