在论坛中的文章搜索的功能,站内的文章可以按标题和内容搜索.存储文章的表的"文章内容"字段是text类型的.保存了包含html标记在内的文章内容.
请问,在页面如果要做按内容搜索的功能,如何排除其html标记,只按文本内容进行搜索?我知道可以利用System.Text.RegularExpressions类的Replace方法来对文章的内容进行处理.但应如何实现这个搜索过程?
怎样把用户输入的搜索关键字仅仅匹配"文章内容"字段的文本部分? 
例如:用户输入 "fo" ,如果"文章内容"字段含有 <font> 标记,而文本内容却没有"fo"的话 ,把该记录也搜索出来了. 怎样排除掉该记录呢?请大家给点思路.

解决方案 »

  1.   

    应该是用System.Text.RegularExpressions中的match方法,一般用搜索方法我比较喜欢用dataview中的RowFilter筛选,如:dv.RowFilter = "content like '*" & key & "*'"
      

  2.   

    SQL也有replace函数的。
    你可以这样搜索
    select * from table1 where Replace(content,'<font>','') like '%fo%'
    这是个笨办法,你还可以利用正则搜索,我就不一一写出代码了。
      

  3.   

    这个问题如果用正则搜索或System.Text.RegularExpressions中的match方法,可以详细一点点地说一下吗.
    谢了