2024年3月17日发(作者:)

如何对xml文件进行编辑_

XML文档可以包含外文字符比如挪威语或者法语(中文当然也可以!这一部分还是不能照原文翻译,下

面有些内容是我自己写的)

为了让你的解析器能够明白这些字符,你必需在XML文档中统一的字符编码标准。

--------------------------------------------------------------------------------

Windows 95/98 记事本

Windows 95/98 记事本不能以Unicode的编码格式保存文件。

可以用法记事原来编辑和保存包含了外文字符的XML文档 (比如:挪威语或者法语或者中文)

xml version="1.0"?

note

from小奀/from

to小林/to

message晚上一起去火锅呀/message

/note

但是假如你用扫瞄器打开这个用记事本编辑过的XML文档,将会消失一个错误。

--------------------------------------------------------------------------------

在Windows 95/98 记事本中用法编码

Windows 95/98 记事本编辑XML文件必需进行编码属性设置。

为了避开发生错误,可以在XML文档声明中加上一个encoding属性,指明此XML文档的编码类型,

但是不要用法Unicode编码。

下面的编码类型不会导致错误,, 并且汉字显示正常:

xml version="1.0" encoding="gb2312"?

下面的编码类型不会导致错误,, 并且汉字显示正常:

xml version="1.0" encoding="gbk"?

下面的编码类型不会导致错误,, 并且汉字显示不正常(乱码):

xml version="1.0" encoding="windows-1252"?

下面的编码类型不会导致错误,, 并且汉字显示不正常(乱码):

xml version="1.0" encoding="ISO-8859-1"?

下面的编码类型不会导致错误,,并且汉字显示正常:

xml version="1.0" encoding="UTF-8"?

下面的编码类型会导致错误,:

xml version="1.0" encoding="UTF-16"?

--------------------------------------------------------------------------------

用法Windows 2021 记事本

Windows 2021 记事本可以以Unicode编码格式保存文件。

Windows 2021 的记事本支持Unicode字符集。假如用法Win2021的记事本以Unicode的编码格式

保存XML文档(请留意这里在XML声明中没有编码信息):

xml version="1.0"?

notefrom小奀/fromto小林/tomessage晚上一起去火锅呀/message/note

--------------------------------------------------------------------------------

Windows 2021 记事本编码

Windows 2021记事本还可以以"UTF-16"编码格式保存文件。

假如你在XML文档中声明白编码属性而又以Unicode编码格式保存文件,将可能发生错误。

下面的代码将会导致错误:

xml version="1.0" encoding="windows-1252"?

下面的代码将会导致错误:

xml version="1.0" encoding="ISO-8859-1"?

下面的代码将会导致错误:

xml version="1.0" encoding="UTF-8"?

下面这个文件; note_encode_utf16_, 将会在IE5.0+中显示正常,在网景Netscape 6.2扫瞄器中

将会消失错误。

xml version="1.0" encoding="UTF-16"?

--------------------------------------------------------------------------------

错误信息

当时用IE5.0或者更高版本扫瞄XML文档时,可能会遇到两中不同的编码错误:

在文本内容中发觉一个非法字符(An invalid character was found in text content)。

假如你的XML文档和你的XML文档的编码格式不匹配就可能导致错误发生。通常状况是,XML文档

包含一些“非英文”字符,并且用法了单字节编码的编辑器,而且没有在XML文档的声明中设置XML文档

的编码格式。

不支持从当前的编码格式转换成另一种编码格式(Switch from current encoding to specified

encoding not supported)。

假如XML文档以Unicode/UTF-16编码格式保存,但是XML文档的声明中却设置了编码格式是一些

单字节的编码(比如 Windows-1252, ISO-8859-1 或者 UTF-8);或者XML文档以单字节编码格式保存,

但是XML文档的声明中却设置了编码格式是一些Unicode/UTF-16的编码形式,这样两种状况都会导致错

误发生。

--------------------------------------------------------------------------------

结论

结论:在保存XML文档之前在XML文档的声明中设置文档的编码格式,我的一些关于避开错误发生的

建议:

用法一种支持Unicode编码格式的编辑器。

确信你知道自己正在用法那种编码格式。

在XML文档中用法属性声明设置编码格式。

更多信息请查看IT技术专栏

...