我想提取一个网页目录下的子网页,但不知道怎么提取。急。
http://www.16k.cn/Html/Book/1/1563/Index.html这个是网页的首页,以下是子网页,怎么提取这些呢?
<li><a href="312676.html" title="更新时间:2008-3-31 11:13:23
更新字数:2359">第一章 海山的夏末(一)</a></li>
    <li><a href="312677.html" title="更新时间:2008-3-31 11:13:23
更新字数:1973">第二章 海山的夏末(二)</a></li>
    <li><a href="312678.html" title="更新时间:2008-3-31 11:13:23
更新字数:1930">第三章 海山的夏末(三)</a></li>
    <li><a href="312679.html" title="更新时间:2008-3-31 11:13:24
更新字数:2277">第四章 海山的夏末(四)</a></li>
    <li><a href="312680.html" title="更新时间:2008-3-31 11:13:24
更新字数:2252">第五章 海山的夏末(五)</a></li>
    <li><a href="312681.html" title="更新时间:2008-3-31 11:13:24
更新字数:2362">第六章 海山的夏末(六)</a></li>
    <li><a href="312682.html" title="更新时间:2008-3-31 11:13:24
更新字数:2231">第七章 海山的夏末(七)</a></li>
    <li><a href="312683.html" title="更新时间:2008-3-31 11:13:25
更新字数:2300">第八章 王梓之秋(一)</a></li>
    <li><a href="312684.html" title="更新时间:2008-3-31 11:13:25
更新字数:2253">第九章 王梓之秋(二)</a></li>
    <li><a href="312685.html" title="更新时间:2008-3-31 11:13:25
更新字数:2653">第十章 王梓之秋(三)</a></li>
    <li><a href="312686.html" title="更新时间:2008-3-31 11:13:25
更新字数:2434">第十一章 王梓之秋(四)</a></li>
    <li><a href="312687.html" title="更新时间:2008-3-31 11:13:25
更新字数:2204">第十二章 王梓之秋(五)</a></li>
    <li><a href="312688.html" title="更新时间:2008-3-31 11:13:25
更新字数:2308">第十三章 王梓之秋(六)</a></li>
    <li><a href="312689.html" title="更新时间:2008-3-31 11:13:26
更新字数:2315">第十四章 王梓之秋(七)</a></li>
    <li><a href="312690.html" title="更新时间:2008-3-31 11:13:26
更新字数:2277">第十五章 王梓之秋(八)</a></li>
    <li><a href="312691.html" title="更新时间:2008-3-31 11:13:26
更新字数:2346">第十六章 王梓之秋(九)</a></li>
    <li><a href="312692.html" title="更新时间:2008-3-31 11:13:26
更新字数:2178">第十七章 王梓之秋(十)</a></li>
    <li><a href="312693.html" title="更新时间:2008-3-31 11:13:26
更新字数:2291">第十八章 王梓之秋(十一)</a></li>
    <li><a href="312694.html" title="更新时间:2008-3-31 11:13:27
更新字数:2214">第十九章 意识流(一)</a></li>
    <li><a href="312695.html" title="更新时间:2008-3-31 11:13:27
更新字数:2263">第二十章 意识流(二)</a></li>

解决方案 »

  1.   

    string str="..";
    MatchCollection mc = Regex.Matches(str,"<li> <a href=\"([^\"]*)\" title=\"更新时间:[^\"]*\">[^<]*</a> </li>");
    for(int i=0;i<mc.Count;i++)
    {
    Response.Write(mc[i].Groups[0].Value);
      

  2.   


    Regex re = new Regex("(?<=href\\=[\\\"]?){1}\\w*(\\.html)(?=\\\"?)", RegexOptions.None);
    MatchCollection mc = re.Matches("text");
    foreach (Match ma in mc)
    {
    }
      

  3.   

    有没有人写一个ASP能用的呀?我要是ASP的完整的,能直接用的,是最好的了。各位大侠,再写一下吧。麻烦了。