目前做一个项目,要过滤一些敏感词,敏感词的正则表达式存放在excel表中。使用Python匹配正则表达式准确无误,但是,使用C语言的regcomp以及regexec总是匹配不正确。
因为是在Linux环境下,所以使用C语言匹配的时候,通过Python将excel读出的正则表达式以utf-8的编码格式存入文本文件reg.txt,然后用C语言去读正则表达式并编译。
郁闷的是,Python去解析reg.txt仍然可以准确匹配,而C语言就是不行。各位大神,有没有好的建议或方法?