Csharp/C#教程:如何在C#中以最快的方式检索HTMLDocument的所有文本节点?分享


如何在C#中以最快的方式检索HTMLDocument的所有文本节点?

我需要在HTMLDocument的所有文本节点上执行一些逻辑。 这就是我目前这样做的方式:

HTMLDocument pageContent = (HTMLDocument)_webBrowser2.Document; IHTMLElementCollection myCol = pageContent.all; foreach (IHTMLDOMNode myElement in myCol) { foreach (IHTMLDOMNode child in (IHTMLDOMChildrenCollection)myElement.childNodes) { if (child.nodeType == 3) { //Do something with textnode! } } } 

由于myCol中的某些元素也有子元素,它们本身也在myCol中,因此我不止一次访问某些节点! 必须有更好的方法来做到这一点?

最好在递归函数中迭代childNodes(直接后代),从顶层开始,类似于:

 HtmlElementCollection collection = pageContent.GetElementsByTagName("HTML"); IHTMLDOMNode htmlNode = (IHTMLDOMNode)collection[0]; ProcessChildNodes(htmlNode); private void ProcessChildNodes(IHTMLDOMNode node) { foreach (IHTMLDOMNode childNode in node.childNodes) { if (childNode.nodeType == 3) { // ... } ProcessChildNodes(childNode); } } 

您可以使用HTML Agility Pack中的 XPath一次访问所有文本节点。

我认为这将如图所示,但没有尝试过。

上述就是C#学习教程:如何在C#中以最快的方式检索HTMLDocument的所有文本节点?分享的全部内容,如果对大家有所用处且需要了解更多关于C#学习教程,希望大家多多关注—计算机技术网(www.ctvol.com)!

 using HtmlAgilityPack; HtmlDocument htmlDoc = new HtmlDocument(); // filePath is a path to a file containing the html htmlDoc.Load(filePath); HtmlNodeCollection coll = htmlDoc.DocumentNode.SelectNodes("//text()"); foreach (HTMLNode node in coll) { // do the work for a text node here } 

www.ctvol.com true Article Csharp/C#教程:如何在C#中以最快的方式检索HTMLDocument的所有文本节点?分享

本文来自网络收集,不代表计算机技术网立场,如涉及侵权请联系管理员删除。

ctvol管理联系方式QQ:251552304

本文章地址:https://www.ctvol.com/cdevelopment/1031144.html

(0)
上一篇 2022年1月13日 下午4:47
下一篇 2022年1月13日 下午4:48

精彩推荐