c# 解析XML文件的方法总结

发布时间:2020-12-26编辑:脚本学堂
为大家介绍c#是如何解析xml文件的,c#访问xml文件一般有两种模型:流模型和DOM(文档对象模型)。流模型中有两种变体——“推”模型和“拉”模型。

 “推”模型也就是常说的SAX,SAX是一种靠事件驱动的模型。
 它每发现一个节点就用“推”模型引发一个事件,而我们必须编写这些事件的处理程序,很麻烦。

.NET中使用的是基于“拉”模型的实现方案。 “拉”模型在遍历文档时会把感兴趣的文档部分从读取器中拉出,不需要引发事件,允许我们以编程的方式访问文档,这大大的提高了灵活性,“拉”模型可以选择性的处理节点。在.NET中,“拉”模型通过XML阅读器(XMLTextReader类)来实现的。该类提供Xml文件读取的功能,它可以验证文档是否格式良好,如果不是格式良好的Xml文档,该类在读取过程中将会抛出XmlException异常。任何时候在内存中只有当前节点,但它是只读的,向前的,不能在文档中执行向后导航操作。

DOM的好处在于它允许编辑和更新XML文档,可以随机访问文档中的数据,可以使用XPath查询。但是,DOM的缺点在于它需要一次性的加载整个文档到内存中,对于大型的文档,这会造成资源问题。在.NET中使用XML DOM分析器(XMLDocument)实现DOM模型。

因此,.NET Framework完全支持XML DOM模式,但它不支持SAX模式。.NET Framework支持两种不同的分析模式:XML DOM分析器(XMLDocument类)和XML阅读器(XMLTextReader类),不支持SAX分析器, 但这并不意味着它没有提供类似SAX分析器的功能。通过XML阅读器可以将SAX的所有的功能很容易的实现及更有效的运用。

我们一般选用xpath的方式来解析xml文档。
这主要是因为:
1,文件大小。要处理的文件不大,一般都在几百K到1M。
2,XPath的灵活性。不需要获取文档的全部数据,只需要获取大部分想要的数据。
3,学习代价低。符合一般的思维习惯,通过Path获取结果。

通过XPath的方式解析xml文档,需要先加载文档,然后再读取想要的节点值。

xml文档
protected XmlDocument doc = null;
xml文档的根元素(节点)
protected XmlElement root = null;
xml文档的名空间管理器
protected XmlNamespaceManager nsmgr = null;
加载文档:
 

复制代码 代码示例:
protected void LoadXmlFile(FileInfo xmlFile)
 {
     if (xmlFile == null || !xmlFile.Exists)
     {
  throw new FileNotFoundException(string.Format("要解析的文件不存在{0}。",xmlFile.FullName));
     }
     //加载文件
     this.doc = new XmlDocument();
     doc.Load(xmlFile.FullName);
     //准备读取文件
     root = doc.DocumentElement;
     string nameSpace = root.NamespaceURI;
     nsmgr = new XmlNamespaceManager(doc.NameTable);
     nsmgr.AddNamespace("ns", nameSpace);
 }
 

注意:
这两行是取得xml文档的名空间
 

复制代码 代码示例:
root = doc.DocumentElement;
string nameSpace = root.NamespaceURI;

这两行是建立xml文档的名空间管理器
 

复制代码 代码示例:
nsmgr = new XmlNamespaceManager(doc.NameTable);
nsmgr.AddNamespace("ns", nameSpace);

如果你的xml文档有名空间,则这部分的代码是必不可少的。

读取文档节点值:
这里两个传入参数prefixPath是节点的上级节点路径,xRelativePath是要读取的节点名称。

另外,变量XmlFileInfo是要加载的xml文件。
 

复制代码 代码示例:
protected string GetNodeValue(string prefixPath, string xRelativePath)
 {
     if (doc == null)
     {
  LoadXmlFile(XmlFileInfo);
     }
     string xPath = string.Empty;
     if (!string.IsNullOrEmpty(xRelativePath))
     {
  if (!string.IsNullOrEmpty(prefixPath))
  {
      xPath = prefixPath + xRelativePath;
  }
  else
  {
      xPath = xRelativePath;
  }
     }
     xPath = xPath.Replace("/", "/ns:");
     XmlNode node = root.SelectSingleNode(xPath, nsmgr);
     if (node == null)
     {
  return null;
     }
     return node.InnerXml;
 }

为什么要设置两个参数prefixPath和xRelativePath呢,只是为了自己觉得方便,也可以在方法外确定了这个XPath,在方法中只设置一个传入参数,效果是一样的。

注意这一行:
xPath = xPath.Replace("/", "/ns:");
如果你的xml文档带名空间,则这行是比不可少的,否则会出现找不到节点,无法解析的情况。

这里还有一个不得不说的问题,就是关于XPath的。
对于这样一个xml文档,要查找第一个节点下的学生的Name时(ID=01),其XPath应该是"/ns:Root/ns:Students/ns:Student[1]/ns:Name"。xml对于重复的节点名称,是按照顺序1,2,3...的方式遍历的,也就是说如果要找第N个Student节点的下的节点之,那么应使用Student[N]的标识方式。 
 

复制代码 代码示例:
<?xml version="1.0" encoding="UTF-8" ?>
<Root xmlns="urn:ClassNameSpace">
<Class>
<ClassID>1234</ClassID>
</Class>
<Students>
<Student>
<ID>01</ID><Name>Name01</Name>
</Student>
<Student>
<ID>02</ID><Name>Name02</Name>
</Student>
</Students>
</Root>
 

当然,这里也可以获取节点属性的值,查找满足特定值的节点等等,这些和上面获取节点值的过程是类似的。

有关c#解析xml文件的内容介绍完了,希望对大家有所帮助。