自动登录 paper.people.com.cn,验证码可以通过Tesseract识别。          
但是 HttpWebResponse response = (HttpWebResponse)webRequest.GetResponse()这句抛出The remote server returned an error: (404) Not Found.附验证码识别代码----------
                using (Bitmap bmp = new Bitmap(stream))
                {
                    tessnet2.Tesseract tesseract = new Tesseract();
                    tesseract.Init(null, "eng", true);
                    List<Word> words = tesseract.DoOCR(bmp, Rectangle.Empty);
                    foreach (tessnet2.Word word in words)
                        Console.WriteLine("{0} : {1}", word.Confidence, word.Text);
                }

解决方案 »

  1.   

    是POST的么?看看地址找对没有,404说明没资源存在。
      

  2.   

    我用httpwatch看过了,地址MS没有错啊
      

  3.   

    远程服务器返回错误
    内容是否很多,是否超时
    byte[] bs = Encoding.ASCII.GetBytes(param); HttpWebRequest request= (HttpWebRequest) HttpWebRequest.Create(""); 
    request.Method = "POST"; 
    request.ContentType = "application/x-www-form-urlencoded"; 
    request.ContentLength = bs.Length; 
    Stream writer = request.GetRequestStream(); 
            writer.Write(data, 0, data.Length); 
            writer.Flush(); 
            writer.Close(); 
            HttpWebResponse response = (HttpWebResponse)request.GetResponse(); 
            Stream stream = response.GetResponseStream(); 
            StreamReader reader = new StreamReader(stream, encoding); 
            string html = reader.ReadToEnd();