由于公司需要,现做工作内容如下:
分析某人才网站个人会员简历,取出简历中所有数据(如:姓名:男,则“男”为有效数据),用什么方法进行最好?
我现在的方法是把简历转为文本格式,去掉空格,去掉特殊字符,然后进行分析。
有没有什么更科学的方法?比如从HTML标记入手