我做网络爬虫时想区分中文网页和外文网页,无奈我经验不够,区分中文网页目前我能想到的方法是根据网页编码来区分,但我发现很多中文网页的html代码是没有显示编码的。有没有什么别的办法去区分?(不知百度是如何做到的)