编程联盟 专业定做出售asp.net毕业设计毕业论文
频道导航.NET数据库Java网络编程语言WEB开发重点导航最新编程资料热门编程文章编程工具大集合下载精品电子书教程下载
出售asp.net毕业设计 出售asp.net毕业设计 出售asp.net毕业设计 出售asp.net毕业设计
首页>>开发资料>>.NET编程>> C#过滤所有HTML代码的函数

C#过滤所有HTML代码的函数增强型1G空间特价350元!

点击:4536
发布时间:2008-12-23 0:59:16
作者: 编程联盟整理
来源: 互联网


  定做出售计算机毕业论文 asp.net毕业设计网

毕业设计客服
自己写的一段正则表达式,作用是删除 Page 里面Code 中的 HTML标签,这在做采集信息,消除其中的HTML很有用处,,欢迎大家收藏!

public string checkStr(string html)
{
System.Text.RegularExpressions.Regex regex1 = new System.Text.RegularExpressions.Regex(@"<script[\s\S]+</script *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@" href *= *[\s\S]*script *:", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex3 = new System.Text.RegularExpressions.Regex(@" no[\s\S]*=", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex4 = new System.Text.RegularExpressions.Regex(@"<iframe[\s\S]+</iframe *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex5 = new System.Text.RegularExpressions.Regex(@"<frameset[\s\S]+</frameset *>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex6 = new System.Text.RegularExpressions.Regex(@"\<img[^\>]+\>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);

System.Text.RegularExpressions.Regex regex7 = new System.Text.RegularExpressions.Regex(@"</p>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex8 = new System.Text.RegularExpressions.Regex(@"<p>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
System.Text.RegularExpressions.Regex regex9 = new System.Text.RegularExpressions.Regex(@"<[^>]*>", System.Text.RegularExpressions.RegexOptions.IgnoreCase);
html = regex1.Replace(html, ""); //过滤<script></script>标记
html = regex2.Replace(html, ""); //过滤href=javascript: (<A>) 属性
html = regex3.Replace(html, " _disibledevent="); //过滤其它控件的on...事件
html = regex4.Replace(html, ""); //过滤iframe
html = regex5.Replace(html, ""); //过滤frameset
html = regex6.Replace(html, ""); //过滤frameset
html = regex7.Replace(html, ""); //过滤frameset
html = regex8.Replace(html, ""); //过滤frameset
html = regex9.Replace(html, "");
html = html.Replace(" ", "");
html = html.Replace("</strong>", "");
html = html.Replace("<strong>", "");
return html;
}


文章来源:http://www.bcbbs.net/news/Content.aspx?id=21286
文章来源:http://www.bcbbs.net/news/Content.aspx?id=21286
asp.net毕业设计定做出售 asp.net毕业论文
收藏本文章 关闭本页
编程联盟 | 编程论坛 | 关于本站 | 站点地图 | 友情链接 | 联系我们|版权声明|购买本站广告
Powered by 编程联盟 2007-2010 bcbbs.net冀ICP备08005404号
编程联盟群:群1【39111008】 群2【60142030】群三【83882594】群四【62585405】群五【37260303】群六【32771492】群七【85894797】群八【42624779】欢迎讨论技术