如何用正则获取网页中的所有英文单词 一个网页夹杂 英文 中文 特殊符号,音标 等,我想只获取其中的全啊单词,忽略其它 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 http://topic.csdn.net/u/20090428/11/a0432460-17d0-469f-9061-5c240e03252d.html看看这个例子,网页抓取技术,然后再针对你保存到数据库的字符串进行过滤,希望对你有帮助。 单词中间不会有空格,可以有',按英文排版顺序,可以有连字符。试试这个\b(?!'-)([a-zA-Z']|-[\r\n]+[a-zA-Z']+)+当然了。你匹配完成后,对连字符要重新剔除一次。 原文hello world! Jus-t test here.It's w-ork fine,is it?正则\b(?!'-)([a-zA-Z']|-[\r\n]+[a-zA-Z']+)+匹配结果helloworldJus-ttesthereIt'sw-orkfineisit 最终如果你处理的有换行、连字符,单词中的需要去掉。Regex.Replace(word,@"[\r\n\-]","") 解析HTMLhttp://topic.csdn.net/u/20100428/19/46bf1fab-1498-4c17-aece-e9efa8143391.html 怎么样截取字符串??? 如何赋值给这个变量,请教! 文档库设计方法 希望高手能够进来帮助,新手可以进来学习! 想找外文翻译的资料,新闻发布系统 为什么这个照片预览的代码 在IE7下不显示 郁闷死了 其他浏览器就可以 请问我下载的asp.net程序看不到.cs文件。用什么工具可以看呢? 简单问题,,去除第一个字符 请教: 我用的是cuteeditor,在本地用好好的,发布到服务器就打不开,整个页面报错了 关于多选一的验证 asp.net点击率的问题 支付宝-即时到帐接口问题——在线
看看这个例子,网页抓取技术,然后再针对你保存到数据库的字符串进行过滤,希望对你有帮助。
\b(?!'-)([a-zA-Z']|-[\r\n]+[a-zA-Z']+)+当然了。你匹配完成后,对连字符要重新剔除一次。
hello world! Jus-
t test here.It's w-
ork fine,is it?正则
\b(?!'-)([a-zA-Z']|-[\r\n]+[a-zA-Z']+)+匹配结果
hello
world
Jus-
t
test
here
It's
w-
ork
fine
is
it
Regex.Replace(word,@"[\r\n\-]","")
http://topic.csdn.net/u/20100428/19/46bf1fab-1498-4c17-aece-e9efa8143391.html