大家在用到采集的时候,会经常碰到各种奇奇怪怪的问题,导致网站错位,空格等问题,这里网十科技摘抄了网站站长分享了一篇<<织梦dedecms采集过滤万能代码>>技术文档,希望能帮助大家。
一:过滤标题中空格
经常在采集文章的时候,标题文字里面有空格,采回来后应用很是麻烦,所以需要在过滤处添加下面正则过滤。
二:过滤来源作者中连接
在采集文章的时候,有的系统里面作者或者来源处都有连接,直接采集的话将连接采集回来了,然后由于这两个字段有限制,通常会造成需要采集的内容没有采集回来,所以需要在过滤处添加下面正则过滤
三:过滤文章内容中连接以及其他广告代码
实际应用中,我们只需要对连接、动画、调用等进行过滤。
一般的只有链接,唐山网站设计唐山网站开发公司,使用二中的代码进行过滤就可以了,但是实际上一般的网站现在都在内容里面加有广告等,所以采取下面的过滤正则就可以完成过滤:
四:过滤GG广告代码
其实这个就是在上面的内容过滤,因为很常用到所以单独作为一个应用列出来:
最后终结一下,掌握了下面这个