高手进关于网页地址搜索数据的问题

比如说http://shop36459303.taobao.com这样一个地址链接我想要通过输入这个链接得到店铺的名称并将其输入到一个只读的文本框里怎么实现？希望能帮在下解答一下不胜感激用C#或者脚本语言可以做到么？

解决方案 »

免费领取超大流量手机卡，每月29元包185G流量+100分钟通话, 中国电信官方发货

string s = readUrlHTML(@"http://shop36459303.taobao.com");
            string result = s.Substring(s.IndexOf("<title>"), s.IndexOf("</title>") - s.IndexOf("<title>")).Replace("<title>", "").Replace("\t", "").Replace("\r", "").Replace("\n", "");
//结果：首页-桑德大卖场-淘宝网
//后边的截取我就不写了，你懂的 /// <summary>
        /// 读取URL
        /// </summary>
        /// <param name="url"></param>
        /// <returns></returns>
        private System.String readUrlHTML(System.String url)
        {
            System.Net.HttpWebRequest request = null;
            System.Net.HttpWebResponse response = null;
            System.String innerHTML = "";
            try
            {
                request = (System.Net.HttpWebRequest)System.Net.HttpWebRequest.Create(url);
                request.Method = "get";
                response = (System.Net.HttpWebResponse)request.GetResponse();
                System.Text.Encoding encode = null;
                try
                {
                    encode = System.Text.Encoding.GetEncoding(response.CharacterSet);
                }
                catch
                {
                    encode = System.Text.Encoding.Default;
                }
                System.IO.Stream stream = response.GetResponseStream();
                System.IO.StreamReader read = new System.IO.StreamReader(stream, encode);
                innerHTML = read.ReadToEnd();
                response.Close();
            }
            catch
            {
                innerHTML = "";
            }
            return innerHTML;
        }
static string GetHtml(string url, Encoding encoding)
  {
    byte[] buf = new WebClient().DownloadData(url);
    if (encoding != null) return encoding.GetString(buf);
    string html = Encoding.UTF8.GetString(buf);
    encoding = GetEncoding(html);
    if (encoding == null || encoding == Encoding.UTF8) return html;
    return encoding.GetString(buf);
  }
static string GetTitle(string html)
  {
    string pattern = @"(?si)<title(?:\s+(?:""[^""]*""|'[^']*'|[^""'>])*)?>(?<title>.*?)</title>";
    return Regex.Match(html, pattern).Groups["title"].Value.Trim();
  }
错了不是查询Title,是查询里面的<a class="hCard fn" href="http://alanfurniture.taobao.com">艾伦家具</a>这个他们共有特点都是class="hCard fn" 如何把‘艾伦家具’查询出来呢？
MatchCollection mc= Regex.Matches(str, @" <a\sclass=\"hCard fn\"[^> ]*href=([ ' " "]?)(? <url> [^ ' " "> \s]*)\1?[^> ]*> (? <text> [^ <]*) </a> ", RegexOptions.IgnoreCase);
foreach (Match m in mc)
{
  Response.Write(m.Groups[ "url "].Value);
  Response.Write(m.Groups[ "text "].Value);
}
  string s = readUrlHTML(@"http://shop36459303.taobao.com");
            Regex r = new Regex("(?<=<a class=\"hCard fn\" .*>).*(?=</a>)");
            MatchCollection math = r.Matches(s);
            foreach (Match m in math)
            {
                string result = m.ToString(); //tv在线购物专柜
            }
string s = "<a class=\"hCard fn\" href=\"http://alanfurniture.taobao.com\">艾伦家具</a>";
            Regex r = new Regex("(?<=<a class=\"hCard fn\" .*>).*(?=</a>)");
            MatchCollection math = r.Matches(s);
            foreach (Match m in math)
            {
                string result = m.ToString(); //艾伦家具
            }
wuyq11前辈再帮个忙
是一个页面只有一个<a class="hCard fn" href="http://alanfurniture.taobao.com">艾伦家具</a>  我在文本框输入http://alanfurniture.taobao.com 下面的文本框会自动提取艾伦家具这4个字
不论我输入什么地址所有的页面都是有个共同的<a class="hCard fn" ，后面的href不一定就是文本框输入的地址  ，怎么用正则表达式查询阿？

高手进 关于网页地址搜索数据的问题

解决方案 »

高手进关于网页地址搜索数据的问题