`
akunamotata
  • 浏览: 372777 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

java使用正则表达式去除字符串的html标签

    博客分类:
  • java
阅读更多
   1. /** 
   2.      * 删除input字符串中的html格式 
   3.      *  
   4.      * @param input 
   5.      * @param length 
   6.      * @return 
   7.      */  
   8.     public static String splitAndFilterString(String input, int length) {  
   9.         if (input == null || input.trim().equals("")) {  
  10.             return "";  
  11.         }  
  12.         // 去掉所有html元素,  
  13.         String str = input.replaceAll("\\&[a-zA-Z]{1,10};", "").replaceAll(  
  14.                 "<[^>]*>", "");  
  15.         str = str.replaceAll("[(/>)<]", "");  
  16.         int len = str.length();  
  17.         if (len <= length) {  
  18.             return str;  
  19.         } else {  
  20.             str = str.substring(0, length);  
  21.             str += "......";  
  22.         }  
  23.         return str;  
  24.     }  

  新闻内容或者博客文章,如果显示摘要,需要去除内容的html格式标签,找到一个正则表达式,实现了:

分享到:
评论
2 楼 akunamotata 2009-07-08  
非常谢谢...
1 楼 damoqiongqiu 2009-07-01  
有可以专门用来解析HTML的开源包htmlPareser,很好用,可以试试。

相关推荐

    java 利用正则表达式从字符串中提取省、市、区、镇、乡等区域名称(包含少数民族地区),支持地址中无省,无市,无县情况。

    java 利用正则表达式从字符串中提取省、市、区、镇、乡等区域名称(包含少数民族地区),支持地址中无省,无市,无县情况。

    Java正则表达式去除img标签的src内容

    java代码,从image标签中正则匹配取出src标签的内容,java代码,从image标签中正则匹配取出src标签的内容

    Java使用正则表达式去除小数点后面多余的0功能示例

    主要介绍了Java使用正则表达式去除小数点后面多余的0功能,结合具体实例形式分析了java字符串正则替换相关操作技巧,需要的朋友可以参考下

    Java使用正则表达式删除所有HTML标签的方法示例

    主要介绍了Java使用正则表达式删除所有HTML标签的方法,结合完整实例形式分析了java针对HTML页面元素script标签、style标签、html标签等的正则匹配相关操作技巧,需要的朋友可以参考下

    java 正则表达式

    JAVA正则表达式语法(转)正则表达式语法正则表达式是一种文本模式,包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”)。模式描述在搜索文本时要匹配的一个或多个字符串。正则表达式示例表达式 ...

    精通正则表达式~~~

    作为正则表达式的字符串... 101 字符编码... 105 正则模式和匹配模式... 110 常用的元字符和特性... 113 字符表示法... 115 字符组及相关结构... 118 锚点及其他“零长度断言” 129 注释和模式量词... 135 ...

    正则表达式去除中括号(符号)及里面包含的内容

    ps:下面看下利用正则表达式提取括号内内容 比如现在要提取 中华人们共和国,简称(中国) 这句话中括号里的“中国” import java.util.regex.Matcher; import java.util.regex.Pattern; public class Test { ...

    Java正则表达式处理特殊字符转义的方法

    由于正则表达式定了一些特殊字符,而有时候需要对这些特殊字符进行匹配的话就需要进行转义了,下面这篇文章主要给大家介绍了Java正则表达式处理特殊字符转义的方法,需要的朋友可以参考借鉴,下面来一起看看吧。

    正则表达式经典实例

    即使有经验的用户也经常会遇到性能不佳、误报、漏报等让人挠头的错误,本书对于如何使用正则表达式来解决一些常见的问题给出了按部就班的解决方案,其中包括c#、Java、JavaScript、Perl、PHP、Python、Ruby和VB...

    正则表达式经典实例.pdf

    即使有经验的用户也经常会遇到性能不佳、误报、漏报等让人挠头的错误,本书对于如何使用正则表达式来解决一些常见的问题给出了按部就班的解决方案,其中包括c#、Java、JavaScript、Perl、PHP、Python、Ruby和VB...

    正则表达式

    当一个正则表达式成功地和目标字符串相匹配时,可以从目标串中抽出和括号中的子模式相匹配 的部分.例如,假定我们正在检索的模式是一个或多个字母后面跟随一位或多位数字,那么我们可以使用模式 / [a-z] + \ d+/.但是...

    c#匹配整数和小数的正则表达式

    匹配整数的一种表达式: Regex.IsMatch(inputerstr, “^([0-9]{1,})$”) 其中Inputerstr是要匹配的字符串 这个表达式仅匹配整数,如果是整数形式返回true,... 您可能感兴趣的文章:Java使用正则表达式去除小数点后面

    JavaScript利用正则表达式去除日期中的-

    第二种,就是利用正则表达式去掉“-” 相比较而言,第二种方法快捷,不容易出错。 2、实现源码 代码如下: &lt;&#37;@ page language=”java” import=”java.util.*” pageEncoding=”UTF-8″%&gt; &lt;!DOCTYPE HTML ...

    java正则表达式提取数字的方法实例

    主要介绍了java正则表达式提取数字的方法,还有去除字符串数字的方法,大家参考使用吧

    java代码-正则去除HTML代码中的IMG标签

    java代码-正则去除HTML代码中的IMG标签

    解析字符串去除HTML代码,保留文字,图片,视频

    用正则表达式,去除字符串中的HTML代码并保留文字,图片,视频。

    javascript中使用正则表达式删除前后空格的方法

    js正则表达式删除字符串前后空格 String.prototype.trim=function(){ var reSpace=/^\s*(.*?)\s*$/; return this.replace(reSpace,”$1″); }; 让我们分析一下第二行的正则表达式 ^ 行开始 \s* 匹配字符前面的所有...

    javascript使用正则表达式实现去掉空格之后的字符

    思路:获取到字符串中的空格,然后把空格及空格后的字符全部替换为空. 获取空格的正则为\s 实践: 代码如下: var date = “2015-12-26 15:22:00”; console.log(date.replace(/\s*/g,”)); 但是得到的结果是2015-12-...

    JavaScript利用正则表达式去除日期中的“-”

    第二种,就是利用正则表达式去掉“-” 相比较而言,第二种方法快捷,不容易出错。 2、实现源码 &lt;&#37;@ page language=java import=java.util.* pageEncoding=UTF-8%&gt; &lt;!DOCTYPE HTML PUBLIC -//W3C//DTD ...

    正则表达式教程

    [\u4e00-\u9fa5]27 双字节字符:[^\x00-\xff] (包括汉字在内,可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1))28 空白行的正则表达式:\n\s*\r (可以用来删除空白行)29 HTML标记的正则表达式:&lt;(\S...

Global site tag (gtag.js) - Google Analytics