问题描述:某指定文件夹内有20个文件夹,遍历每个文件夹内所有文本文件(每个文件夹有10个文本文件,都是英文文本文件,文件夹名是该10个文本文件的主题),取出文本文件的每个单词,统计每个单词出现次数。
举例说明:把问题简单化,假设第一层文件夹fold1下有3个文件夹分别叫apple,tree,man。在这3个文件夹下面分别有2个文本文件,现在遍历所有的文本文件假设得到2个单词me,you。接着统计这2个单词在各自的主题下出现的次数,如下表主题|apple|tree|man|
---------------------
me  |  10 | 1  | 5 |
---------------------
you |   1 |  1 | 0 |求高手指点,最好给点代码,特别是怎么算次数的。分不够再加

解决方案 »

  1.   

    Regex myReg = new Regex(" x ");//假设第一个单词是x  
      string   myStr   =   "";//文本内容  
      int   count=myReg.Matches(myStr).Count;//获取x在文本中出现次数
      

  2.   

    循环文件就简单了
    自己写个递归就可以了private void getDirectories(string path)
    {
    string[] fileNames = Directory.GetFiles(path);
    string[] directories = Directory.GetDirectories(path);
    foreach (string file in fileNames)
    {
    Console.WriteLine("Filename:{0}",file);
    }
    foreach (string dir in directories)
    {
    Console.WriteLine("Directoriesname:{0}",dir);
    getDirectories(dir);
    }
    }