有一堆的HTML文件要匹配修改标签...这倒能做! 可能在这堆HTML文件中有个大小1.34MB的HTML文件...程序一匹配到它就会不走了...很久很久都不动!
我想是不是太大了..所以程序算不过来挂掉了!所以我想把这1MB多的文件分开来匹配! 每次读取大概100KB进行匹配 然后保存匹配完的字符串,再进行下一个100KB匹配!C#怎么截取指定长度的字符串呢?

解决方案 »

  1.   

    不懂。什么叫html中还有一个html?如何分析的?如果是正则,会不会是正则写的有问题导致正则引擎崩溃?如果内嵌的文件,文件时Base64编码存在的,如何跳过去有点麻烦。
      

  2.   

    substring 是不是你要的哦????
      

  3.   

    打开文件,循环读取,每次读取指定的长度,然后匹配,MSDN上看看FileStream,应该可以满足你的要求。此一次读取完成后,记录当前的位置或者每次读取时计算当前的位置,然后使用Postion进行定位。
      

  4.   


    LZ 是 有 一堆 html 文件中 有一个.....
      

  5.   

    不过拆开不是好办法,因为你如果把标签拆掉了怎么办?
    第一段最后是<a href
    第二段开头是="aa.html">ff</a>
    这样这个标签就拆开无法找到了。
      

  6.   

    先首用System.IO 里的StreamRead去读取文件.判断文件的大小,如果大于1MB.然后用ReadLine()方法一行一行的读。这样应该就可以了。
      

  7.   

    什么样的HTML文件大小能达到1.34MB...请恕我孤陋寡闻了..