正则表达式,又称正规表示法、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在很多文本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。
1、通过正则表达式判断字符串中是否包含中文,具体代码如下:
import java.util.regex.Matcher; import java.util.regex.Pattern; public class Demo { public static void main(String[] args) { System.out.println("true 包含 -- false 不包含->结果为" + isChinese("素文宅Yoodb")); } public static boolean isChinese(String str) { Pattern p = Pattern.compile("[\u4e00-\u9fa5]"); Matcher m = p.matcher(str); if (m.find()) { return true; } return false; } }
运行结果如下:
true 包含 -- false 不包含->结果为true
2、判断字符串中是否只包含中文,具体代码如下:
public class Demo { public static void main(String[] args) { System.out.println("true 包含 -- false 不包含->结果为" + isChinese("素文宅Yoodb")); } public static boolean isChinese(String strName) { char[] ch = strName.toCharArray(); boolean bo = false; for (int i = 0; i < ch.length; i++) { char c = ch[i]; if (isChinese(c)) { bo = true; }else{ bo = false; } } return bo; } private static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c); if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS || ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A || ub == Character.UnicodeBlock.GENERAL_PUNCTUATION || ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION || ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) { return true; } return false; } }
运行结果如下:
true 包含 -- false 不包含->结果为false