`
keml
  • 浏览: 12250 次
  • 性别: Icon_minigender_1
  • 来自: 上海
最近访客 更多访客>>
社区版块
存档分类
最新评论

清除html标签,javascript, style.

 
阅读更多
public static String getonerow(String HTMLStr)
	{
		String htmlStr = HTMLStr;
		String textStr = "";
		java.util.regex.Pattern p_script;
		java.util.regex.Matcher m_script;
		java.util.regex.Pattern p_style;
		java.util.regex.Matcher m_style;
		java.util.regex.Pattern p_html;
		java.util.regex.Matcher m_html;
		try
		{
			String regEx_script = "<[//s]*?script[^>]*?>[//s//S]*?<[//s]*?///[//s]*?script[//s]*?>"; 
			String regEx_style = "<[//s]*?style[^>]*?>[//s//S]*?<[//s]*?///[//s]*?style[//s]*?>"; 
			String regEx_html = "<[^>]+>";
			p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
			m_script = p_script.matcher(htmlStr);
			htmlStr = m_script.replaceAll(""); 
			p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
			m_style = p_style.matcher(htmlStr);
			htmlStr = m_style.replaceAll(""); 
			p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
			m_html = p_html.matcher(htmlStr);
			htmlStr = m_html.replaceAll("");
			textStr = htmlStr.replaceAll("&nbsp;", "");
			textStr = htmlStr.replaceAll("<",  "<");
			textStr = htmlStr.replaceAll(">",  ">");
			textStr = htmlStr.replaceAll("®", "®");
			textStr = htmlStr.replaceAll("&", "&");
		}
		catch (Exception e)
		{
			System.err.println("Html2Text: " + e.getMessage());
		}
		return textStr;
	}

 

分享到:
评论

相关推荐

    JavaScript使用ul中li标签实现删除效果

    本文实例为大家分享了js使用ul中li标签实现删除效果的具体代码,供大家参考,具体内容如下 &lt;html&gt; &lt;head&gt; &lt;meta charset="utf-8"&gt; &lt;title&gt;&lt;/title&gt; &lt;style type="text/css"&...

    出现问题a is defined高手帮忙

    style.alphaIE = 'alpha(opacity=' + (style.opacity * 100) + ')'; this.globals.backStack=[]; //其他选项 this.globals.options={ buttonHTML: 'zoom ...', buttonStartingStyle: {width: '52px', ...

    js使用小技巧

    获得style内容 obj.style.cssText HTML标签 document.documentElement.innerHTML 第一个style标签 document.styleSheets[0] style标签里的第一个样式 document.styleSheets[0].rules[0] 防止点击空链接...

    php过滤危险html代码

    function uh($str) { $farr = array( "/\s+/", //过滤多余的空白... "<\\1\\2\\3>", //如果要直接清除不安全的标签,这里可以留空 "\\1\\2", ); $str = preg_replace( $farr,$tarr,$str); return $str; } ?&gt;

    html入门到放弃笔记

    HTML + JavaScript + Ajax + CSS 赵旭 zhaoxu@tedu.cn HTML5 1、WEB基础知识(了解) 1、Internet - 网 由若干台电脑、手机、平板 通过 网线(WIFI) 连接起来的结构 2、基于Internet上的程序 1、C / S 结构 ...

    WebMarkupMin:Web标记Minifier(缩写为WebMarkupMin)-一个包含一组标记Minifier的.NET库。 该项目的目的是通过减少HTML,XHTML和XML代码的大小来提高Web应用程序的性能。

    此外,HTML和XHTML缩小程序支持从style标签和属性中缩小CSS代码,并从script标签,事件属性和具有[removed]协议的超链接中缩小JavaScript代码。 WebMarkupMin.Core包含基于Douglas Crockford的内置JavaScript缩小和...

    xheditor-1.1.14

    参数值:default(默认风格),o2007blue(Office 2007 蓝色),o2007silver(Office 2007 银色),vista(Vista),nostyle(NoStyle) layerShadow:阴影的深度(按钮面板和模式窗口的背景阴影) 参数值:0(不显示阴影),大于0的...

    xheditor v1.0.0 rc2 build 100401

    占位符被清除,造成块标签零高度问题的修正 修正:IE拖动img大小不更新width和height属性值问题的修正 修正:IE浏览器下在表格中粘贴会位置错乱问题的修正 修正:IE浏览器下超链接的链接文字,在超链接是...

    XML轻松学习手册--XML肯定是未来的发展趋势,不论是网页设计师还是网络程序员,都应该及时学习和了解

    CSS大家很熟悉了,全称是Cascading Style Sheets(层叠样式表),是目前用来在浏览器上显示XML文档的主要方法。 3.Behaviors Behaviors现在还没有成为标准。它是微软的IE浏览器特有的功能,用它可以对XML标识设定...

    ASP.NET4高级程序设计(第4版) 3/3

    2.4.2 控件标签如何与页面变量连接 44 2.4.3 事件如何与事件处理程序连接 46 2.5 Web项目 47 2.5.1 基于项目的开发 47 2.5.2 创建Web项目 48 2.5.3 迁移旧版Visual Studio创建的网站 49 2.6 Visual ...

    庖丁解牛纵向切入ASP.NET 3.5控件和组件开发技术.pdf

    3.3.2 直接输出html标签32 3.3.3 使用服务器控件的rendercontrol方法33 3.4 addattributestorender方法34 3.5 createchildcontrols方法35 3.6 inamingcontainer接口36 3.7 实现复合控件38 3.7.1 ...

    dreamweaver的各种组件

    set global Var 在head标签中设置javascript的全局变量 windwo mover 将窗口移到屏幕的指定地方 dreamshow 使图片像播放幻灯一样顺序播放 Show-HideallLayers 隐藏或者显示所有的层 OpenerLocation 在新窗口中...

    ASP.NET4高级程序设计第4版 带目录PDF 分卷压缩包 part1

    2.4.2 控件标签如何与页面变量连接 2.4.3 事件如何与事件处理程序连接 2.5 Web项目 2.5.1 基于项目的开发 2.5.2 创建Web项目 2.5.3 迁移旧版Visual Studio创建的网站 2.6 Visual Studio调试 2.6.1 ...

    freemarker总结

    JAVA模版引擎Freemarker常用标签(一) 1. if指令 这是一个典型的分支控制指令,该指令的作用完全类似于Java语言中的if,if指令的语法格式如下: &lt;#if condition&gt;... &lt;#elseif condition&gt;... &lt;#elseif condition&gt;......

    庖丁解牛:纵向切入ASP.NET 3.5控件和组件开发技术

    3.3.2 直接输出html标签 32 3.3.3 使用服务器控件的rendercontrol方法 33 3.4 addattributestorender方法 34 3.5 createchildcontrols方法 35 3.6 inamingcontainer接口 36 3.7 实现复合控件 38 3.7.1 ...

    庖丁解牛 纵向切入ASP.NET 3.5控件和组件开发 part1

    3.3.2 直接输出html标签 32 3.3.3 使用服务器控件的rendercontrol方法 33 3.4 addattributestorender方法 34 3.5 createchildcontrols方法 35 3.6 inamingcontainer接口 36 3.7 实现复合控件 38 3.7.1 ...

    庖丁解牛 纵向切入ASP.NET 3.5控件和组件开发 part2

    3.3.2 直接输出html标签 32 3.3.3 使用服务器控件的rendercontrol方法 33 3.4 addattributestorender方法 34 3.5 createchildcontrols方法 35 3.6 inamingcontainer接口 36 3.7 实现复合控件 38 3.7.1 ...

Global site tag (gtag.js) - Google Analytics