Skip to content

创建不带BOM 的UTF8

Updated: at 08:22,Created: at 06:11

如果使用 StreamWriter 创建的文本,都是默认带 BOM ,如果需要创建一个不带BOM的文件,请看本文。

因为有很多个编码,打开一个文件,很难判断这个文件是什么编码。所以微软就在文件的开始写入4个byte,来告诉程序这个文件是什么格式。需要知道,这个 BOM 是微软定义的,所以在很多的系统是没有 BOM 的,所以保存了一个 xml 文件,可以在其他系统读取就出错了,他们不知道 BOM 。

下面就来提供一个简单的方法创建不带 BOM 的文件。因为和编码有关系,所以只需要替换 StreamWriter 的编码就会好了,下面提供两个方法创建编码。

Encoding utf8WithoutBom = new UTF8Encoding(false);
Encoding isoLatin1Encoding = Encoding.GetEncoding("ISO-8859-1");

建议使用第一个方法,创建编码就可以开始写文件

下面是把 GBK 编码的文件读取然后转换为 UTF8 的代码,代码可以直接运行,当然需要修改文件为自己的文件。

static void Main(string[] args)
{
var file = new FileInfo("E:\\博客\\创建不带BOM 的UTF8.txt");
string str = "";
using (StreamReader stream = new StreamReader(file.FullName, Encoding.GetEncoding("GBK")))
{
str = stream.ReadToEnd();
}
Encoding utf8WithoutBom = new UTF8Encoding(false);
using (StreamWriter stream = new StreamWriter(file.FullName, false, utf8WithoutBom))
{
stream.Write(str);
}
}

参见:http://stackoverflow.com/questions/2502990/create-text-file-without-bom


知识共享许可协议

原文链接: http://blog.lindexi.com/post/%E5%88%9B%E5%BB%BA%E4%B8%8D%E5%B8%A6BOM-%E7%9A%84UTF8

本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。 欢迎转载、使用、重新发布,但务必保留文章署名 林德熙 (包含链接: https://blog.lindexi.com ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请与我 联系