能不能先弄成XML文件,再往数据库里导就容易了
解决方案 »
- 求SQL表设计案例!
- 多页面传值问题,棘手呀
- 一个IP地址,怎么才能获得这个IP所在的省、市等详细地址
- =====莱鸟提问,对象释放问题=====
- ASP.NET中用过TreeView的过来看看,怎么经常出现这样的错误啊,不能访问“Microsoft.Web.UI.WebControls”
- 请问高手!
- 关于ASP.net验证控件和用户控件问题!!!
- edit狀態下datagrid columns的寬度設置
- 求助关于获取手机客户mac地址的问题
- 如何改变DataGrid行变成编辑状态时出现的textBox的宽度。
- 利用gridview控件显示数据 怎么样在一行里显示两条记录?
- 我问一个关于vs2005网站发布的问题!
<information>
<name>...</name>
<birth>...</birth>
<workyear>...</workyear>
</information>
....
</resume>
如果格式基本一致的话,我觉得XML比较好,个人意见,呵呵
---------------------------------------
正则!!如:
"姓名:(.*)出生日期(.*)......"
后面的都差不多.然后用groups(1),groups(2).......得到再插入到数据库!!
Dim address As String = "简历"
Dim name,birthday......... As String Dim m As Match = Regex.Match(address, "姓名:(.*)\r\n出生年月:(.*)........") If m.Success Then
name = m.Groups(1).Value
birthday = m.Groups(2).Value
.............................
End If
然后再插入数据库!
<Currency id="c_1">
<Description>学员学习币申请 (Member_Manage/sqxxb.aspx)</Description>
<Mail_Title>您有一封来自易课堂的系统邮件</Mail_Title>
<Mail_Content><![CDATA[尊敬的$web_sys_name$用户 $contact_name$ 先生/女士:
您好!
您的$web_sys_name$部门帐户 $user_name$ 于 $create_date$ 接收到来自本部门学员 $apply_contact_name$ 的学习币申请,请尽快登录$web_url$卓越企业培训系统 $web_url$ 查看该申请的详细信息。
衷心感谢您对$web_sys_name$的支持与厚爱! 祝您愉快!
$web_sys_name$
$create_date$
]]></Mail_Content>
</Currency>
<Advertisements>
如此松散的格式,很难保证解析的 100% 的正确
2.
先提取已知关键字标识,如 姓名 , 性别等
3.
然后一行一行的读取,
并根据关键字标识,【截取】对应信息,你样本数据中,可识别的分隔符,就是换行符、空格、关键字
4.
其实是比较的简单的,很基础的文本操作,没有技术含量,关键是分析样表数据
5.
数据源是文本文件,使用 System.IO.StreamReader 类读取是直接文本,使用 System.IO.StringReader 类读取注意其中的 ReadLine 等相关方法以及 String.Substring 等
6.
另外是,正则,但是我看不到光明的前途,等高手了
例如,基本信息和项目经验分开解析就比较容易了,
基本信息:姓 名:,出生日期:等等都可以解析出来
项 目 经 验 :起始时间,项目描述也都可以解析出来了要是格式还是多种就很难办了
你说的那小子在哪家公司阿?我也去
html格式固定 就用正则(很简单,估计你也会。)如果格式不固定 考虑分词技术+数据挖掘了。(呵呵~ 个人好象不好弄吧。)
没有别的方法,只能
先取源码,再用正则,如果不清楚怎么干
先去看看采集器的源码就知道了说得对
要不你够牛就黑了那网站,拿他数据过来,哈哈