跳至正文

python 去除非中文字符

import re

def find_chinese(file):
pattern = re.compile(r'[^\u4e00-\u9fa5]’)
chinese = re.sub(pattern, ”, file)
print(chinese)

def find_unchinese(file):
pattern = re.compile(r'[\u4e00-\u9fa5]’)
unchinese = re.sub(pattern,””,file)
print(unchinese)

if __name__ == “__main__”:
line = “2019年1月3日 – python去除空格和换行符的方法 一、去除空格 strip().strip() # …用replace(‘\’,”),后边的串替换掉前边的posted @ 2016-07-18 08:53 …”
print(“原文:”)
print(line)
print(“保留中文:”)
find_chinese(line)
print(“保留非中文:”)
find_unchinese(line)

————————————————
版权声明:本文为CSDN博主「bailixuance」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/bailixuance/java/article/details/89555580