能不能先弄成XML文件,再往数据库里导就容易了

解决方案 »

  1.   

    <resume>
       <information>
           <name>...</name>
           <birth>...</birth>
           <workyear>...</workyear>   
       </information>
       .... 
    </resume>
    如果格式基本一致的话,我觉得XML比较好,个人意见,呵呵
      

  2.   

    引用: "XML/XSLT  一般  2月"回答: 再多学几个月再来!
      

  3.   

    支持xml吧。也想不出什么好方法了
      

  4.   

    在数据库中存代码  用div显示
      

  5.   

    就是分析文本不会弄,能不能指点下?
    ---------------------------------------
    正则!!如:
    "姓名:(.*)出生日期(.*)......"
    后面的都差不多.然后用groups(1),groups(2).......得到再插入到数据库!!
     Dim address As String = "简历"
            Dim name,birthday......... As String        Dim m As Match = Regex.Match(address, "姓名:(.*)\r\n出生年月:(.*)........")        If m.Success Then
               name = m.Groups(1).Value
               birthday = m.Groups(2).Value
               .............................
             End If
    然后再插入数据库!
      

  6.   

    <Advertisements>
    <Currency id="c_1">
    <Description>学员学习币申请 (Member_Manage/sqxxb.aspx)</Description>
    <Mail_Title>您有一封来自易课堂的系统邮件</Mail_Title>
    <Mail_Content><![CDATA[尊敬的$web_sys_name$用户 $contact_name$ 先生/女士:

        您好!
        您的$web_sys_name$部门帐户 $user_name$ 于 $create_date$ 接收到来自本部门学员 $apply_contact_name$ 的学习币申请,请尽快登录$web_url$卓越企业培训系统 $web_url$ 查看该申请的详细信息。
        
        衷心感谢您对$web_sys_name$的支持与厚爱!    祝您愉快!   
                                                                                                        $web_sys_name$
                                                                                                     
                                                                                                  $create_date$
    ]]></Mail_Content>
    </Currency>
    <Advertisements>
      

  7.   

    1.
    如此松散的格式,很难保证解析的 100% 的正确
    2.
    先提取已知关键字标识,如 姓名 , 性别等
    3.
    然后一行一行的读取,
    并根据关键字标识,【截取】对应信息,你样本数据中,可识别的分隔符,就是换行符、空格、关键字
    4.
    其实是比较的简单的,很基础的文本操作,没有技术含量,关键是分析样表数据
    5.
    数据源是文本文件,使用 System.IO.StreamReader 类读取是直接文本,使用 System.IO.StringReader 类读取注意其中的 ReadLine 等相关方法以及 String.Substring 等
    6.
    另外是,正则,但是我看不到光明的前途,等高手了
      

  8.   

    哭死。  这还只是51job的一种简历格式,要是在多个中华英才网,智联招聘。  我不更得死定了。高手救命啊1!!
      

  9.   

    那就先痛痛快快哭吧难道你可以使用 Adobe Reader 打开 pdg 的文件?——格式都不一样 ....
      

  10.   

    - -!  啊?  那BOSS这不是存心让我死地很难看。。    他跟我也没仇啊!
      

  11.   

    你BOSS 让你实现这功能~?也没给出固定的格式~?那怎也给个大概范围吧~?比如都要取哪个网的简历~~~
      

  12.   

    现在就搞51job一家的简历都搞不定。
      

  13.   

    建议使用XML进行分段解析.
    例如,基本信息和项目经验分开解析就比较容易了,
    基本信息:姓  名:,出生日期:等等都可以解析出来
    项 目 经 验 :起始时间,项目描述也都可以解析出来了要是格式还是多种就很难办了
      

  14.   

    我什么不自己写模板 BOSS 是在玩人吧
      

  15.   

    个人认为 建立XML 用DOM写为DataSet 这样导入数据库很容易~
      

  16.   

    楼主明显想采集51job的人才信息
      

  17.   

    octverve(生命无色,命运多彩……) 
    你说的那小子在哪家公司阿?我也去
      

  18.   


    html格式固定 就用正则(很简单,估计你也会。)如果格式不固定 考虑分词技术+数据挖掘了。(呵呵~ 个人好象不好弄吧。)
      

  19.   

    anncesky1() 
    没有别的方法,只能
    先取源码,再用正则,如果不清楚怎么干
    先去看看采集器的源码就知道了说得对
    要不你够牛就黑了那网站,拿他数据过来,哈哈
      

  20.   

    如果是html的话,位置应该是固定的,那么你直接扒取数据就可以了