UTF-8格式的文本文件 例如csdn blog保存网页的html文件
其中有中文 想要将其中特定的中文替换为其他的中文(UTF-8 或者 GBK格式)
怎么办才能象GBK格式替换那样 中文在UTF-8中长度不固定
结果总不能如意,
要替换的含中文的内容格式转化为UFT-8以后搜索不到。。
用Reader/Writer的话默认是GBK encoding只能get
用流的话中文处理不好办。。
有什么其他办法么?-__-
其中有中文 想要将其中特定的中文替换为其他的中文(UTF-8 或者 GBK格式)
怎么办才能象GBK格式替换那样 中文在UTF-8中长度不固定
结果总不能如意,
要替换的含中文的内容格式转化为UFT-8以后搜索不到。。
用Reader/Writer的话默认是GBK encoding只能get
用流的话中文处理不好办。。
有什么其他办法么?-__-
Java字符串为等长的Unicode编码使用InputStreamReader的构造函数InputStreamReader(InputStream in, String charsetName) 构造Reader对象 charsetName为"UTF-8"