取网页内容无非就是匹配查找,正则表达式等IO操作file或dir,通过遍历取得子文件或文件夹

解决方案 »

  1.   

    能否给出具体的代码来呢,及如何取得匹配数据,如何取得文件夹名称,如何写到文件中去,谢谢!
    关键是结构是这样的,文件夹1->文件夹2->网页文件
    我要导出的excel文件的格式为:在某个sheet表的列中第一列为:文件夹1名,第二列为:文件夹2的名,第三列为:网页中的班级名称,
      

  2.   

    此法将html中所有的内容,如按钮,表格,图片等全部输出到Execl中。 
       Response.Clear();     
       Response.Buffer=   true;     
       Response.AppendHeader("Content-Disposition","attachment;filename="+DateTime.Now.ToString("yyyyMMdd")+".xls");           
       Response.ContentEncoding=System.Text.Encoding.UTF8;   
       Response.ContentType   =   "application/vnd.ms-excel";   
       this.EnableViewState   =   false;   
    这里我们利用了ContentType属性,它默认的属性为text/html,这时将输出为超文本,即我们常见的网页格式到客户端,如果改为ms-excel将将输出excel格式,也就是说以电子表格的格式输出到客户端,这时浏览器将提示你下载保存。ContentType的属性还包括:image/JPEG;text/HTML;image/GIF;vnd.ms-excel/msword 。同理,我们也可以输出(导出)图片、word文档等。下面的方法,也均用了这个属性。