如果简单的取出来,可以用innerText就可以了但是我是想取出来实现翻译,而且要把翻译后的内容拿去替换,翻译的方法我是有了,但不知道如何才能把内容从WebBroswer中取出来并实现替换。因为很多文章的内容中夹杂着图片什么的,我不希望在翻译后,连图片都没了。用InnerText的话,文章内容倒是取出来,但图片什么的却丢失了。请问各位有什么好的方法没?

解决方案 »

  1.   

    想要翻译页面,可以把页面的链接地址提交到GOOGLE,然后读取GOOGLE的翻译结果页面。
    再就是根据WebBrowser的DocumentText获取页面的HTML内容,然后逐字检查该字符是否是汉字,记录汉字字符串的开始与结尾索引,再获取汉字字符串进行翻译,
      

  2.   

    因为页面是放在本地的,所以google全文翻译不做考虑,第二个解决办法可能是不可行的哦,因为类似下面的:今天是<font color=red>美好</font>的一天可能是font标记,也可能是其他什么乱七八糟的标记,
    应该翻译  今天是美好的一天,而不是拆开来翻译
      

  3.   

    获取字符编码判断是否处于汉字的字符编码区域内,是就取出来
    以gb2312编码为例汉字都从第16区B0开始,这就是为什么GB2312字符集都是从16区开始
    借鉴http://www.cnblogs.com/flyfish/archive/2006/04/27/386440.html
      

  4.   

    想要翻译页面,可以把页面的链接地址提交到GOOGLE,然后读取GOOGLE的翻译结果页面。 
    再就是根据WebBrowser的DocumentText获取页面的HTML内容,然后逐字检查该字符是否是汉字,记录汉字字符串的开始与结尾索引,再获取汉字字符串进行翻译,
      

  5.   

    本帖最后由 viena 于 2008-09-09 13:11:38 编辑