2024年3月23日发(作者:)
龙源期刊网
垃圾广告过滤软件的设计与实现
作者:林龙 张永
来源:《商情》2012年第06期
【摘要】随着人们生活水平的提高,越来越多的人在闲暇时利用网络浏览信息、网上聊
天、看电影和网上购物。但是,在人们享受网络带来的便利时,很多网民也被许多垃圾广告困
扰。针对这一问题,设计了一款垃圾广告过滤软件,可以方便的拦截网站和一些常用软件的垃
圾广告,对FLASH、弹出广告的拦截效果非常明显。此款软件操作方便,使用简单。
【关键词】垃圾广告 拦截软件 简单方便
1引言
根据对一些网民的调查(主要是大学生),他们对垃圾广告相当的反感,但很多却苦于不知
所措。本文所设计的这款软件能让网民不再为此发愁。首先这款软件在很大程度上绿化了上网
环境,这款软件正是为了解决这个问题而开发的。这款软件可以屏蔽一些浮动广告、游戏广
告、色情广告,使得广大网民上网时能有舒适的心情,快乐上网,而不是看到广告让人头疼,
也可使得家长不再为一些可能会影响孩子身心健康的广告而发愁。另外,还可以提高电脑安全
系数。一些垃圾广告的背后往往是一些幕后黑手制造的木马、病毒,一些对电脑安全没什么全
面了解的人很有可能陷入这个幕后黑手的陷阱,使得电脑中木马、病毒,使得电脑中一些隐私
的文件泄露,账号被盗。因此,开发一款垃圾广告过滤软件应用前景十分看好。
2垃圾广告过滤方法概述
广告过滤功能在留言板上显得更为突出,近年来许多企业或个人为了提高知名度,使用了
网络广告群发软件,向留言板倾泻了大量的垃圾广告信息。这严重影响了留言板的正常使用,
管理员也为此耗费了大量的维护时间,苦不堪言。为此,迫切需要建立行之有效的垃圾广告留
言防范措施。
(1)垃圾广告留言的若干防范对策
哪些是垃圾留言,哪些是正常留言,程序很难做到百分百正确区分。但可根据垃圾留言的
一些特征信息,提出一套防范对策,尽量地避免垃圾广告留言。
(2)加入审批
留言信息需经管理员审批之后才显示。这可以让垃圾广告无法现身,但这样正常留言也没
有办法立即显示出来,降低了留言板的实时性。
(3)加入验证码
龙源期刊网
系统产生一个随机的验证码,让浏览者输入,可防止广告群发软件大量地倾泻垃圾留言。
可以让系统产生复杂的、不规则的随机验证码,让群发软件难以识别,或者可以采用正序显示
验证码,逆序输入验证码,群发软件即使识别出正确的验证码也无法得逞。
(4)建立黑名单
在数据库中建立黑名单,存入发布垃圾广告的IP等信息,下次垃圾广告发布者在同一台
计算机再次发布广告时,系统便可拒绝。
(5)限制重复内容
垃圾广告很多是重复的,有时重复几十次,甚至成百上千次。可以让系统判断留言内容是
否与已留言内容重复,如果重复则拒绝。
(6)过滤不良信息
垃圾广告都有一个网址链接,把这些网址存人数据库中,并让程序自动过滤。在提交留言
信息时,如发现有数据库中的链接网址或不良信息,便提示“你不能添加此类信息”,拒绝提
交。
3垃圾广告过滤软件设计
本文设计的垃圾广告过滤软件,首先是构建高效的敏感词库,一个高效的敏感词库能够有
效对文本进行分词,有助于文本特征项的抽取,本文针对训练文本集进行预处理,根据标记信
息和正文文本所抽取出的敏感词条,结合人工参与的方式,初步建立起不良信息的敏感词库。
其次是适当降低文本向量表示的维数,这样可以减少向量相似度计算时的复杂度,但向量维数
太少,又可能降低对文本内容表示的真实性,因此,需要选取正文文本向量表示合适的维数。
最后是减少文本匹配的规模,使用敏感词库代替通用的分词系统对训练文本和测试文本进行分
词,对于非不良信息的文本而言,根据判定阈值即可放弃进一步的匹配。通过将文本内容中的
字符串与词库中的敏感词进行比较是否匹配,若匹配,则进行过滤替换操作,当文本内容分析
过滤完毕,计算文本内容中所有敏感词的敏感值总和,当该值大于等于过滤阀值时,该文本内
容不予发布。在具体过滤实现上包括了简繁转换,中文转拼音与信息过滤,喜好词生成等功
能。能够对垃圾信息进行滤除。通过简体转繁体功能,可以将简体转换为繁体,当垃圾信息中
含有繁体敏感词时,过滤软件分析内容中的繁体敏感词。中文转拼音功能是将中文转换为拼音
字母形式,有些垃圾信息是以拼音字母形式出现的敏感词,本过滤软件采用在对内容分析时,
对其中的拼音形式出现的敏感词,先将中文转换为拼音形式,再进行分析过滤操作。本文设计
的垃圾广告过滤软件的具体实现步骤是:第一步,取出词库中第一个敏感词,与文本内容的字
符串进行比较是否匹配,若匹配,则进行过滤替换操作。第二步,将该敏感词转换为繁体,再
与文本内容的字符串进行比较是否匹配,若匹配,则进行过滤替换操作。第三步,将该敏感词
转换为拼音,再与文本内容的字符串进行比较是否匹配,若匹配,则进行过滤替换操作。
龙源期刊网
运行软件后,进入软件的主界面,选择自己要过滤什么方面的垃圾广告,也可以两个一起
过滤,既过滤网站广告又过滤运行软件出现的广告。
进入网站垃圾广告过滤功能后,可以根据用户的要求选择要过滤的广告类型,比如热门网
站广告、漂浮、弹窗广告、动漫类网站的广告和热门小说网站广告,也可以按照软件推荐的方
式过滤广告。
用户选择软件垃圾广告过滤功能后,进入软件广告过滤选项,可以拦截运行软件出现的广
告,减少用户关闭广告的烦恼,适用的软件有QQ、飞信、YY等软件。
4小结
本文设计的垃圾广告过滤软件在一定程度上抑制了非法信息在网络上的传播,净化了网络
环境,为网络用户提供了一个良好健康的信息资源环境。


发布评论