以下几个正则表达式,为主要非英文语系字符范围。
比如需要匹配所有中日韩非符号字符,正则表达式这样写:^[u3400-u9FFF]+$。理论上没错, 可是我到msn.co.ko随便复制了个韩文下来,则根本不对的。
再到msn.co.jp复制了个'お', 也不得行..
然后把范围扩大到^[u2E80-u9FFF]+$, 这样倒是都通过了, 这个应该就是匹配中日韩文字的正则表达式了, 包括我們臺灣省還在盲目使用的繁體中文
而关于中文的正则表达式, 应该是^[u4E00-u9FFF]+$, 和论坛里常被人提起的^[u4E00-u9FA5]+$很接近
注意:^[u4E00-u9FA5]+$ 这是专门用于匹配简体中文的正则表达式,实际上繁体字也可以,测试'中華人民共和國', 也通过了。
而且,^[u4E00-u9FFF]+$ 输出结果也是一样的。