小弟最近在做一个单词计数的程序,有几个问题不知道怎么解决,烦请各位大神给个解决的办法。
(1)char[] sep = {' ',',','.','?','!','(',')',';',':'}这是我定义的一些确认单词的分隔符,有个问题就是,我定义的是2个单词间有一个空格,如果单词间有2个空格如何解决?
(2)我先把要处理的文件的行数统计下来,但是,如何处理空行?
 string fileName = @"e:\2.txt";
            DateTime startReadTime = DateTime.Now;
            StreamReader sr = File.OpenText(fileName);   //打开文件
            TimeSpan costOfRead = DateTime.Now.Subtract(startReadTime);            
            double readFileTime = costOfRead.TotalMilliseconds;            
            string currentLine;           
            char[] sep = {' ',',','.','?','!','(',')',';',':'};           //预定义单词间的分隔符           
            string str;
            ArrayList fileLines = new ArrayList();
            DateTime startWordCount = DateTime.Now;
            while ((currentLine = sr.ReadLine()) != null)
            {
                if (currentLine.Length == 0)
                    continue;
                currentLine.ToLower();
                fileLines.Add(currentLine);                                       
            }c#单词计数

解决方案 »

  1.   

                char[] sep = { ' ', ',', '.', '?', '!', '(', ')', ';', ':' };
                string fileName = @"e:\2.txt";            string text = File.ReadAllText(fileName, Encoding.Default);
                string[] fileLines = text.Split(sep, StringSplitOptions.RemoveEmptyEntries);
      

  2.   

    string x = "x";
    x.Split(new char[] { ',', ' ' }, StringSplitOptions.RemoveEmptyEntries);