UTF-8文件中文替换的问题。。

UTF-8格式的文本文件例如csdn blog保存网页的html文件
其中有中文想要将其中特定的中文替换为其他的中文（UTF-8 或者 GBK格式）
怎么办才能象GBK格式替换那样中文在UTF-8中长度不固定
结果总不能如意,
要替换的含中文的内容格式转化为UFT-8以后搜索不到。。
用Reader/Writer的话默认是GBK encoding只能get
用流的话中文处理不好办。。
有什么其他办法么？－__-