我先在有这么多数据:Input tags Kan Kansas 美国堪萨斯州州名
Input tags Kan 赣江
Input tags Kanagawa <日> 神奈川
Input tags Kanaka 夏威夷及南洋群岛的土人
Input tags Kananga
Input tags Kanarese 卡纳拉地区人
Input tags Kanawha series 地质]卡纳华统
Input tags Kanazawa
Input tags Kanchenjunga 干城章嘉峰
Input tags Kandahar
Input tags Kandinski
Input tags Kandy
Input tags Kane
我怎么能用正则把 不带有汉语意识的字符去掉呢 例如替换成:
Input tags Kan Kansas 美国堪萨斯州州名
Input tags Kan 赣江
Input tags Kanagawa <日> 神奈川
Input tags Kanaka 夏威夷及南洋群岛的土人
Input tags Kanarese 卡纳拉地区人
Input tags Kanawha series 地质]卡纳华统
Input tags Kanchenjunga 干城章嘉峰
Input tags Kan 赣江
Input tags Kanagawa <日> 神奈川
Input tags Kanaka 夏威夷及南洋群岛的土人
Input tags Kananga
Input tags Kanarese 卡纳拉地区人
Input tags Kanawha series 地质]卡纳华统
Input tags Kanazawa
Input tags Kanchenjunga 干城章嘉峰
Input tags Kandahar
Input tags Kandinski
Input tags Kandy
Input tags Kane
我怎么能用正则把 不带有汉语意识的字符去掉呢 例如替换成:
Input tags Kan Kansas 美国堪萨斯州州名
Input tags Kan 赣江
Input tags Kanagawa <日> 神奈川
Input tags Kanaka 夏威夷及南洋群岛的土人
Input tags Kanarese 卡纳拉地区人
Input tags Kanawha series 地质]卡纳华统
Input tags Kanchenjunga 干城章嘉峰
这样
string result = Regex.Replace(yourStr, @"(?m)(?=[a-zA-Z'.\s]+$).+[\r\n]+", "\r\n").Replace("\r\n\r\n", "\r\n");result就是你要的结果。
string result = Regex.Replace(yourStr,@"(?m)^(?=[^\u4E00-\u9FA5]*$).+","");
(?im)^[a-z\s]+$
替换成
空
应该也可以吧
换成:
美国堪萨斯州州名 Input tags Kan Kansas
还有tab在正则里表示什么意识?
\t表示tab,和一般的字符转义一样。
string result = Regex.Replace(yourStr, @"(?im)(?:(^[^\u4E00-\u9FA5]*$)|(^[a-z'?.\s]+)([<>\s\[\]\u4E00-\u9FA5]+)\s+$)",
delegate(Match m)
{
if (m.Groups[2].Success)
{
return m.Groups[3].Value + " " + m.Groups[2].Value;
}
return "";
});
result = Regex.Replace(result, @"(\r|\n|\r\n){2}", "\r\n");
Aino Arabist 阿拉伯学者
Aino Arabization 阿拉伯化Aino Araby 阿拉伯半岛Aino Aragon 西班牙北部地方
Aino Araldite 环氧树脂粘合剂Aino Aramaic 亚拉姆语
Aino Aramco Arabian-American Oil Company阿拉伯-美国石油公司
Aino Arapaho Arapahos阿拉 帕霍人
Aino Araucan 阿劳干语组的印第安语
能去掉这些空行吗? 这些好像不是一般的空行 用\n[\s| ]*\r不管用
给你替换了呀
Aino Araldite 环氧树脂粘合剂Aino Aramaic 亚拉姆语
Aino Aramco Arabian-American Oil Company阿拉伯-美国石油公司
Aino Arapaho Arapahos阿拉 帕霍人
以上看上去像空格 其实不是 鼠标放上去会停留在第一列的位置上 也不能往后移动