Write a Java program to calculate the words and characters found in this XHTML document.
(假设已经存在home.html文件了)Java 程序员测试要求中文补充说明:
1. 附带的 home.html 文件是一个 XHTML 文件,如果你了解 XML 文件是什么,你应该知道这是什么文件格式。统计字数时不计 XHTML 文件中的 tag(代码)。
2. 文件内的文字中英文混合,字数统计应该考虑字符集的影响。
3. 要求中提到分别计算 word(单词)数和 character(字符)数提供两个统计值。由于本文件是中英混合文件,中文本身没有所谓单词的概念,在本测试中,我们要求将每个中文字各视作一个单词,标点符号不计为单词,每个英文单词视为一个单词,每个数字视作一个单词。例如“Heartsome Release 7 版本即将推出,支持GMX-V!”视为 12 个 word。
4. 字符数统计时每个空格也视为一个字符。
5. 注释中的字数不计(例如 <!-- Start of section 0 -->)本编程测试可以直接使用记事本类的文本编辑程序写程序代码。同时您的测试机器上已经安装了 Windows 或 Linux 版的 Eclipse Java 编程环境,如果需要使用,请向安排测试的人员咨询。提示:测试中如果有需要可以上网查资料。