在一个网页源代码中如果分离出所有的连接放到一个tStringList中?
我指的是在Delphi中通过编程实现。
比如网页源代码在一个strings中,现将其中的<a href=XX.XX.XX.XX>sdfddf</a>这种形式的连接中的“XX.XX.XX.XX”,也就是实际上的超链接添加到另外一个stringList中去。

解决方案 »

  1.   

    var D : IHTMLDocument2;
        i : integer;
        L : IHTMLElement;
    begin
      d := WebBrowser1.document as IHTMLDocument2;
      for i := 0 to D.links.length -1 do begin
        L := d.links.item(varempty,0) as IHtmlelement;
        Memo1.Lines.add(l.getAttribute('href',0));  end;
    end;
      

  2.   

    我不想用WebBrowser控件,我想通过NMHTTP控件获取网页代码分析。
    怎么办呢?PageProducder,WebDispatch这些控件不知怎么用?能否派上用场?
      

  3.   

    NMHTTP什么的根本同HTML无关..要解析网页,现成的东西就是微软的MSHTML组件,IE也是用它.uses mshtml;var
      aIntf:DispHTMLDocument;
      bIntf:IHTMLDocument2;
    begin
      aIntf:=CoHTMLDocument.Create;
      aIntf.open(...);
      bIntf:=aIntf as IHTMLDocument2;
    .....其它的就照 idilent(忍不住来讨论) 那样..
    如果实在不想用这东东,还有一个方法,也不算太难..
    就是把网页当做文本文档,搜索标记<a
    做一些解析字符串的代码,好在你仅仅是想解出链接,
    这种解析要不了多少代码.