老板要求将网页上的文字提取出来,我没有做过该类程序,有做过哪方面的希望能有所提示,谢谢。

解决方案 »

  1.   

    WebBrowser.OleObject.Document.OuterText
      

  2.   

    WebBrowser.OleObject.Document.Body.OuterText
      

  3.   

    其实你可以参考http://hub.myrice.com/delphizt/wlyy/009.htm的文章,你可以用google搜索一下
    delphi与internet
    这片文章还可以看看
      

  4.   

    procedure savetxt(webbrowser1:twebbrowser; memo1: tmemo; savedialog1: tsavedialog);
    begin
     memo1.Lines.Clear;
     Memo1.Lines.Add(IHtmlDocument2(WebBrowser1.Document).Body.OuterText);
     if savedialog1.Execute then
     begin
      memo1.Lines.SaveToFile(savedialog1.FileName);
     end;
    end;
      

  5.   

    use comobj;
     var 
     dd,ee:olevariant;
    dd:=createoleobject('Word.Application');
     try
     for i:=0 to filelistbox1.Count-1    do
          begin
           filelistbox1.ItemIndex:=i;
           ee:=dd.Documents.Open(filelistbox1.FileName);
           ee.saveas(copy(filelistbox1.FileName,1,pos('.',filelistbox1.FileName))+'txt',wdFormatText);
           ee.close;
             progressbar.Position:=progressbar.Position+1;
           end;
      finally
      dd.quit;
      

  6.   

    coreblood(菜码):你在么?我想在线问你几个问题。我的QQ:6011458
      

  7.   

    增加memo1,memo2,button1,fastnet页的NMHttp控件。procedure TForm1.Button1Click(Sender: TObject);
    var body:string;
        header:string;
    begin
        nmhttp1.InputFileMode:=false;
        nmhttp1.OutputFileMode := FALSE;
        NMHTTP1.ReportLevel := Status_Basic;
        nmhttp1.Get('www.sohu.com');
        memo1.text:=nmhttp1.header;
        memo2.text:=nmhttp1.body;
    end;
      

  8.   

    不好意思,“host lookup failed”??
      

  9.   

    简单的提取上面的方法就可以了,复杂的话通过MSHTML也可以提取出来,把问题问明白一些。
      

  10.   

    如果有代理可以这样:
    procedure TForm1.Button1Click(Sender: TObject);
    var body:string;
        header:string;
    begin
        nmhttp1.InputFileMode:=false;
        nmhttp1.OutputFileMode := FALSE;
        NMHTTP1.ReportLevel := Status_Basic;
        NMHTTP1.Proxy := 代理地址;
        NMHTTP1.ProxyPort := 代理的端口;
        nmhttp1.Get('www.sohu.com');
        memo1.text:=nmhttp1.header;
        memo2.text:=nmhttp1.body;
    end;