本篇文章给大家谈谈html标签过滤java,以及正则过滤html标签对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
本文目录一览:
1、在Java截取字符串的时候,如何过滤掉html标签2、java html字符过滤器3、java正则表达式过滤html p标签
在Java截取字符串的时候,如何过滤掉html标签
去除html标签
function
strip_tags($string,
$replace_with_space
=
true)
{
if
($replace_with_space)
{
return
preg_replace(‘![^]*?!’,
‘
‘,
$string);
}
else
{
return
strip_tags($string);
}
}
截取字符函数(匹配各种编码)
function
truncate($string,
$length
=
80,
$etc
=
‘…’,
$break_words
=
false,
$middle
=
false){
if
($length
==
0)
return
”;
if
(is_callable(‘mb_strlen’))
{
if
(mb_detect_encoding($string,
‘utf-8,
iso-8859-1′)
===
‘utf-8’)
{
//
$string
has
utf-8
encoding
if
(mb_strlen($string)
$length)
{
$length
-=
min($length,
mb_strlen($etc));
if
(!$break_words
!$middle)
{
$string
=
preg_replace(‘/\s+?(\s+)?$/u’,
”,
mb_substr($string,
0,
$length
+
1));
}
if
(!$middle)
{
return
mb_substr($string,
0,
$length)
.
$etc;
}
else
{
return
mb_substr($string,
0,
$length
/
2)
.
$etc
.
mb_substr($string,
–
$length
/
2);
}
}
else
{
return
$string;
}
}
}
//
$string
has
no
utf-8
encoding
if
(strlen($string)
$length)
{
$length
-=
min($length,
strlen($etc));
if
(!$break_words
!$middle)
{
$string
=
preg_replace(‘/\s+?(\s+)?$/’,
”,
substr($string,
0,
$length
+
1));
}
if
(!$middle)
{
return
substr($string,
0,
$length)
.
$etc;
}
else
{
return
substr($string,
0,
$length
/
2)
.
$etc
.
substr($string,
–
$length
/
2);
}
}
else
{
return
$string;
}
}
综合就是
$arc=strip_tags($arc);
java html字符过滤器
这是我看到一个不错的,自己看看吧
import java.util.regex.Pattern;
public class Test
{
public static void main(String[] args)
{
String ww=”htmlsssbodyss/bodyssss/html”;
String ff=html2Text(ww);
System.out.println(ff);
}
public static String html2Text(String inputString) {
String htmlStr = inputString; // 含html标签的字符串
String textStr = “”;
java.util.regex.Pattern p_script;
java.util.regex.Matcher m_script;
java.util.regex.Pattern p_style;
java.util.regex.Matcher m_style;
java.util.regex.Pattern p_html;
java.util.regex.Matcher m_html;
try {
String regEx_script = “[\\s]*?script[^]*?[\\s\\S]*?[\\s]*?\\/[\\s]*?script[\\s]*?”; // 定义script的正则表达式{或script]*?[\s\S]*?\/script
// }
String regEx_style = “[\\s]*?style[^]*?[\\s\\S]*?[\\s]*?\\/[\\s]*?style[\\s]*?”; // 定义style的正则表达式{或style]*?[\s\S]*?\/style
// }
String regEx_html = “[^]+”; // 定义HTML标签的正则表达式
p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
m_script = p_script.matcher(htmlStr);
htmlStr = m_script.replaceAll(“”); // 过滤script标签
p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
m_style = p_style.matcher(htmlStr);
htmlStr = m_style.replaceAll(“”); // 过滤style标签
p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
m_html = p_html.matcher(htmlStr);
htmlStr = m_html.replaceAll(“”); // 过滤html标签
textStr = htmlStr;
} catch (Exception e) {
System.err.println(“Html2Text: ” + e.getMessage());
}
return textStr;
}
}
java正则表达式过滤html p标签
用JavaScript方法如下,JAVA语言类似:
‘你的HTML文本’.replace(/.+(.+).+/,’$1′)
html标签过滤java的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于正则过滤html标签、html标签过滤java的信息别忘了在本站进行查找喔。