反垃圾邮件的战争永不会停息,而本文在此给出了一些反垃圾邮件的实用技巧。
2004年之初,比尔·盖茨做出了一个轻率的承诺:凭借微软的强大实力,垃圾邮件在两年内将被彻底清除。我们都已经习惯了微软发布新软件时的“跳票”行为,但垃圾邮件解决方案的跳票则更加离谱。垃圾信息与日俱增,几年前似乎能拦截多数垃圾信息的过滤技术再也无法奏效,而且,很多人在过滤信箱垃圾信息上花的时间比以前更多了。
是否出现了新的技术?能否采用这些技术来帮我们赢得对收件箱原有的掌控呢?是要将垃圾信息的发送者告上法庭吗?或者,我们是否应该勇敢承认,互联网电子邮件在设计时就没有考虑到要防止这些骗子、诈骗者和铤而走险之徒?有人甚至认为,应放弃为互联网电子邮件系统提供基础架构的开放标准,进而采用能将垃圾邮件拒之“箱”外的下一代标准。
我们来看看,为什么有如此多的垃圾信息,始终把握垃圾信息动态的最佳方法是什么,同时我们将提供一些策略供你选择,使之在反垃圾邮件之战中发挥应有的作用。
为什么会出现垃圾邮件
虽然你可能从来没有碰到被垃圾邮件内容所欺骗的这类受害人,但是这类受害群体的确存在。因为发送数以百万计的邮件几乎不需任何成本,所以,只要有那么几个人上当受骗,不法分子就有利可图。
即使正规公司有时也认为,大量群发邮件是合乎常理的营销策略:可结果是,连他们自己也成了那些不那么有良心的电邮营销公司的牺牲品,而且自己毫不知情。如果你从个人邮箱地址中收到了来自某个公司的那些“不请自来”的电子邮件,打电话礼貌地告诉他们,你不会购买、也不会推荐他们的产品。我们发现,这种方法比较有效。
僵尸部落
然而,发送垃圾邮件越来越有利可图的这种情形,并不是在很短的时间内形成的。时下,垃圾邮件数量如此巨大的一个原因在于,宽带接入用户的绝对数量庞大。除此之外,便是使用电脑但对安全威胁没有足够防护的用户数量太大。
垃圾邮件出现之初,互联网的多数邮件服务器都欣然接收任何邮件,并将其发送到其目的地,跟处理其他电子邮件没什么两样。SMTP(简单邮件传输协议)的设计初衷就是要解决邮件传输问题,使你能够通过方便实用的SMTP服务器轻易地发送和转发处理电子邮件。不过,SMTP协议中并没有内置认证机制。由于有人开始滥用这种方便的协议,多数此类“开放式的中继站”最后都关闭了。因此,现在的邮件服务器往往仅接收那些它事实上能处理其地址的电子邮件,或仅接收那些有备份地址的电子邮件。而且,服务器也有其他方式的防护,如对来自一个来源发往邮件接收者或连接的最大数量限制。所以,垃圾邮件发送者再也无法找到一个开放式的SMTP中转站,再也无法以百万计的邮件轰炸中转站而任由它花时间将邮件发送出去。
在这种情形下,大量的垃圾邮件就直接发到了每个邮件地址的邮件接收服务器,这意味着要接入世界各地大量不同的服务器。如果要从某一个地方完成发送,这要花很长时间,更不用提这要占用相对大量的带宽了—而这类行为很容易被监测其网络的ISP(互联网服务提供商)所发现。

包含在图片中的营销信息和随意的文本内容,都想骗过贝叶斯分析蒙混过关。许多收件箱中这类图片信息已逐渐发展为大家所熟悉的“风景”。
“得益于”很多家用电脑使用的宽带和落后的安全防护,所谓的“僵尸网络” “解决”了上述问题。“僵尸网络”是一组被感染的pc(也叫僵尸电脑)网络,能够被远程控制,用来发送垃圾邮件,而用户甚至都没有意识到。在这种情形下,由于成百上千的电脑从世界各地发送垃圾邮件,所以,要识别互联网流量模式就变得更为困难,而且,垃圾邮件发送者能在非常短的时间内就将垃圾邮件发给大量的邮件接收人。
真实情形
在开放式中转站如此少的情况下,如此大量的垃圾邮件是怎样被发送的呢?上文的解释可能为我们提供了答案。然而,上文并没有说明,有多少垃圾邮件究竟如何进入了你的收件箱。几年前,我们在杂志中读到那些反垃圾邮件工具的时候,其中有些工具特别有效,删除或标出垃圾邮件的比例非常高。
而如今,垃圾邮件情形则完全变了。一个典型的收件箱不仅包括各种分门别类的过时的促销商品广告,而且充斥各种商品,如高级手表,还有近来出现的买进股票的建议。不用说,高级手表极有可能是赝品,买进的股票肯定要赔钱。问题是,所有那些垃圾邮件到底是如何绕过你设置的垃圾邮件过滤器的?
垃圾邮件发送者很狡猾。好几年前,Bayesian filtering(贝叶斯)被捧为垃圾邮件识别的最强大的工具之一。这种工具不是仅仅查找信息中的关键词和短语从而加以过滤,而是分析所有单词过滤垃圾邮件,允许你用好或坏的信息对系统进行“训练”。其构想是,某些单词组合在一起使用是垃圾邮件的典型特征,而在其他语境中,同样的单词组合却可能并非如此。通过谨慎地分析其概率,Bayesian filtering能捕捉大量的垃圾邮件。
然而,过不了多久,垃圾邮件发送者就弄明白了这个道理,这就是为什么很多垃圾邮件都包含看上去是任意组成的部分文本—你可能没能看见这些白底白色的文本,但是这些文本的确存在—而Bayesian filtering读到的则是垃圾邮件之外的文本。 因此,如果在邮件中放进大量的随意组成的常见单词和短语,那么垃圾邮件成为过滤器漏网之鱼的机遇还是不小的。
当然,也还有其他的方法:诸如Cloudmark和DCC这样的系统,能够计算垃圾邮件的校验和或“指纹”,并在服务器上与其他机器共享。邮件服务器能利用其指纹来识别垃圾邮件,而且,这类系统在设计时还设置了一定程度的模糊性,包容信息中通常出现的个性化内容。然而问题是:由于僵尸网络使发送者具备了强大的计算处理能力,因此,对数以百万计的垃圾邮件进行分别设置,对一台机器来言,是一项耗时费力的工作,发送过程由此变得缓慢,因此,仍然有足够的垃圾邮件能混进信息之中,因而“指纹”就不再那么可靠了。
但同时,垃圾邮件也有了最新的招数:图片垃圾邮件。虽说垃圾邮件发送者也常常利用图片来推广其产品,但近来,使用图片的垃圾邮件数量显著上升:根据McAfee的说法,图片垃圾邮件占到了所有垃圾邮件的40%以上,而且比例还在上升,这是去年图片垃圾数量的四倍。这种图片垃圾邮件在“炒股诈骗”式的骗局(该骗局的目的,就是骗你去购买某公司股票,从而抬高该公司的股价)中最为常见。由于没有真正的文本可以扫描识别,而且信息都是从大量不同的IP地址发送过来,因此,当它们达到邮件服务器时,就很难识别出来。从理论上讲,你可以在信息中运行字符识别程序,但这样做会耗费大量的处理时间。你也不能看到带有图片的信息就加以阻止,因为如此多的个人都通过邮件共享照片,或将他们公司的标徽贴在信息中作为署名。
到处都是垃圾邮件,数量如此巨大,难怪也有人在想,互联网是否也该需要新的邮件系统了。然而,这种情况却不太可能会发生。首先,就是因为有太多的人在使用现有的标准,沟通交流由此变得更为容易。其次,还有那些僵尸部落的存在:由于如此多的系统都被感染,进而受到控制,因此,用不了多久,垃圾邮件发送者就会找到方法去攻击那些系统。如此看来,可能只有从技术和法律层面提供解决方案了:从技术层面看,可以采用新技术,将其融入现存系统,以此来验证邮件;从法律层面来看,只要这些邮件发送者利用垃圾邮件的行为触犯法律,那么就将其告上法庭。
同时,要保持收件箱干净,你能采取什么措施呢?很明显,对于桌面反垃圾邮件软件而言,有效的清除工作十分困难,清除图片垃圾邮件更是如此。当然,就清除其他各类垃圾邮件而言,只要通过查找关键字、阻止已知的垃圾邮件域名或将已知联系人放进“白名单”中,这些桌面反垃圾邮件软件仍然发挥着作用。但是,看起来,要有效地解决这个问题,真的有必要,在全球的电子邮件服务器上展开对垃圾邮件的战争。
传统做法中的“黑名单”就是反垃圾邮件的一项工具。黑名单就是一个已知的垃圾邮件发送者的IP地址列表,因此,只要邮件发送者试图接入,邮件服务器就会拒绝这种垃圾邮件。虽然这种名单能够阻止商业电子邮件营销公司来骚扰你,但正如Spamhaus(www.spamhaus.org )这类组织发现的那样,当具商业目的的垃圾邮件发送者污染我们收件箱的“权利”受到侵犯时,他们会付诸法律,和受害人对簿公堂。 |