如何获取HTML字段中,所有URL地址(过滤掉其它所有) 如何获取HTML字段中,所有URL地址(过滤掉其它所有) 解决方案 » 免费领取超大流量手机卡,每月29元包185G流量+100分钟通话, 中国电信官方发货 TextBox2.Text = ""; string web_url = this.TextBox1.Text;//"http://blog.csdn.net/21aspnet/" string all_code = ""; HttpWebRequest all_codeRequest = (HttpWebRequest)WebRequest.Create(web_url); WebResponse all_codeResponse = all_codeRequest.GetResponse(); StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream()); all_code = the_Reader.ReadToEnd(); the_Reader.Close(); ArrayList my_list = new ArrayList(); string p = @"http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?"; Regex re = new Regex(p, RegexOptions.IgnoreCase); MatchCollection mc = re.Matches(all_code); for (int i = 0; i <= mc.Count - 1; i++) { bool _foo = false; string name = mc[i].ToString(); foreach (string list in my_list) { if (name == list) { _foo = true; break; } }//过滤 if (!_foo) { TextBox2.Text += name + "\n"; } } MatchCollection matchs = Regex.Matches(HTML,@"<a>(?<url>[^<]*)</a>", RegexOptions.IgnoreCase); foreach (Match m in matchs){ str += m.Groups["url"].Value;} 现在我使用tds__609(学历代表过去、能力代表现在、学习力代表未来)的代码能够获得,但连接同什么图片等连接也一起获得了,现在我只想要<a里边的连接,表达式应该怎么写????? <a里还有不包括内部连接也要啊!!! 超链接到根目录产生的404错误。 如何固定大小? 请教一个问题,是关于button按钮的,哪位高手可以帮我解答啊??????? 晕,代码估计被混淆了。 请教如何在Panel控件里换行??? 100分求教邮件进入数据库的语句. 关于 Base-64 字符数组的无效长度问题。 Windows2003+Vs.NET2003下的ASP页面调试问题! asp.net中TreeView的应用如何? 1.1好像不支持了? 大家是怎么做的? 弹出窗口的小问题!!在线等......... 如何自动运行程序? 怎样捕获存储过程中的异常或返回值啊?
string web_url = this.TextBox1.Text;//"http://blog.csdn.net/21aspnet/"
string all_code = "";
HttpWebRequest all_codeRequest = (HttpWebRequest)WebRequest.Create(web_url);
WebResponse all_codeResponse = all_codeRequest.GetResponse();
StreamReader the_Reader = new StreamReader(all_codeResponse.GetResponseStream());
all_code = the_Reader.ReadToEnd();
the_Reader.Close();
ArrayList my_list = new ArrayList();
string p = @"http://([\w-]+\.)+[\w-]+(/[\w- ./?%&=]*)?";
Regex re = new Regex(p, RegexOptions.IgnoreCase);
MatchCollection mc = re.Matches(all_code); for (int i = 0; i <= mc.Count - 1; i++)
{
bool _foo = false;
string name = mc[i].ToString();
foreach (string list in my_list)
{
if (name == list)
{
_foo = true;
break;
}
}//过滤 if (!_foo)
{
TextBox2.Text += name + "\n";
}
}
{
str += m.Groups["url"].Value;
}