网络营销知识仓库-第44章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
usiness 遭封看 302 重定向)Business是网上最大的商业搜索引擎和分类目录,以专业提供商业信息而享负盛名,包括近 19 万网页。若以“business ”为关键词在Google 中进行搜索,该网站名列第一。不过在9 月5 日,Business 遇到一件蹊跷之事:它的首页由PR8 变成了PR0,而且Google搜索结果中找不到首页。好在被“蒸发”的只是首页,并且庆幸的是第二天首页又回到了Google 的搜索结果,但PR 仍旧为0。 Business的问题出在它的重定向命令上。该网站让 business 跳转到business/,这种重定向本该是永久性的。而 302 则属于临时性重定向,只有当一个网站或网页在 24到 48小时之内临时移到其它位置的情况下才能使用该命令。但Business 却错误地使用了“HTTP/1。1302 Object Moved”状态码。 其实网站重定向极为普遍,譬如不满意原来的域名而申请了一个新域名;买下容易被人 错拼的域名,防止客户因为拼错 URL 而找不到网站,等等。可是,很多人却会由于使用了 错误的重定向状态码而遭“灭站之灾”,就像Business。尽管他们的重定向理由充分合 理,然而若使用不当,就可能被 Google 误认为是利用多个域名指向同一网站,那么你的网 站就会被封掉,罪名是“利用重复的内容来干扰 Google 搜索结果的网站排名”。大多数使 用错误重定向参数的网站没Business 这么幸运,一个小小的重定向就可能使网站前功尽弃,只能从头来过:重新申请新域名,重新发布新网站,等等。记住:Google 绝不会同情任何人,即使是无心犯下的错误。2、302 重定向和网址劫持(URL hijacking) 从网址A 做一个302 重定向到网址B 时,主机服务器的隐含意思是网址A 随时有可能改主意,重新显示本身的内容或转向其他的地方。大部分的搜索引擎在大部分情况下,当收到302 重定向时,一般只要去抓取目标网址就可以了,也就是说网址B。如果搜索引擎在遇到302 转向时,百分之百的都抓取目标网址B 的话,就不用担心网址URL 劫持了。 问题就在于,有的时候搜索引擎,尤其是 Google,并不能总是抓取目标网址。比如说, 有的时候A 网址很短,但是它做了一个302 重定向到B 网址,而B 网址是一个很长的乱七八糟的URL 网址,甚至还有可能包含一些问号之类的参数。很自然的,A 网址更加用户友好,而B 网址既难看,又不用户友好。这时Google 很有可能会仍然显示网址A 。 由于搜索引擎排名算法只是程序而不是人,在遇到 302 重定向的时候,并不能像人一样的去准确判定哪一个网址更适当,这就造成了网址URL 劫持的可能性。也就是说,一个不道德的人在他自己的网址A 做一个302 重定向到你的网址B,出于某种原因,Google 搜索结果所显示的仍然是网址A,但是所用的网页内容却是你的网址B 上的内容,这种情况就叫做网址URL 劫持。你辛辛苦苦所写的内容就这样被别人偷走了。 302 重定向所造成的网址URL 劫持现象,已经存在一段时间了。不过到目前为止,似 乎也没有什么更好的解决方法。在正在进行的大爸爸数据中心转换中,302 重定向问题也是 要被解决的目标之一。从一些搜索结果来看,网址劫持现象有所改善,但是并没有完全解决。四、404 重定向1、404 设置 在 IIS中设置 404 网页:点击网站属性→自定义错误信息→找到 404了→双击→选“URL ”→在下面输入自定义的404 页面URL 。 一般而言,从技术上设置404 错误导航并不复杂,关键是404 错误页面本身的设计。 比较理想的情况下是给出出错提示,列出站点主要内容导航,及给予用户一个错误URL的提醒,同时方便用户浏览页面,增加用户友好程度。这一点可以学习dell(如下图)。对于已经不存在的目录可以用robots 文档限制搜索引擎抓取。2、可能导致错误的404 定义 404 错误页面,切记还需要禁止搜索引擎对该错误页面进行抓取。具体见 robots协议。因为404 错误不能直接定向到站点的每一页面,而是需要按照上面的参考案例精心设计页面。以下抓图是某站点,因为错误页面直接重定向到站点首页,而站点首页是没有禁止收录,导致搜索引擎重新收录了这些页面。产生了大量类似页面。 在yahoo 收录的页面中,我们发现了yahoo 收录了大量已经不存在的页面,而且收录的这些页面跟首页都是一模一样的。 这些不存在的页面都定制了401 错误页面,而这个错误页面恰好就是 9tour 的首页。这些页面以前都存在,在变成404 错误页面后,Yahoo 继续把定义的错误页面当作了内容抓取。这样的后果是,对于Yahoo 而言,该站点存在大量完全一样的页面,有非常严重的堆积页面的嫌疑。五、其他重定向 1、JS 这一代码被黑帽 SEO 广泛使用。JS 的主要作用是将一作弊页面优化上去后,迅速重定向到目标页面,由于搜索引擎对JS 的识别有限,这种代码能避免被搜索引擎惩罚。 一般情况下,这种代码有两种方法:一种是直接将Javascript 代码放在页面的Html 代码中,另一种是将Javascript 代码放到外部JS 文件,而在Html 代码里调用该JS 文件了。 这种Javascript 代码种类非常多。下面是一段Javascript 代码。我们将其存放在跟页面处于同一目录的abc。js 文件里。 bName = navigator。appName; if((bName Netscape )|| (bName Microsoft Internet Explorer ))window。location= abc ; 而在Html 代码中,可以通过下面这样的代码来调用这个外部js 文件: script language=”javascript” src=”abc。js” /script 2、Flash 制作一个 swf 动画文件,该动画文件没有什么功能,一打开就是直接转向某一 URL 。 之前由于搜索引擎对于 swf 文件识别有限,大部分的博客、免费空间等禁止编辑Html 文件,但允许插入动画,因而这种跳转也被黑帽广泛使用,将他们的免费空间、博客转向到目标客户站去。3、meta fresh 在2000 年前比较流行,不过现在已很少见。meta fresh 通过网页中的meta 指令,在特定时间后重定向到新的网页,如果延迟的时间太短(约5 秒之內),会被判断为 spam。 〈meta http…equiv=″refresh″ content=″2; URL=root″〉 这段代码可以使当前某一个网页在 2 秒后自动转到 root 页面中去,这就是meta 的刷新作用,在content 中,2 代表设置的时间(单位为秒),而URL 就是在指定的时间后自动连接的网页地址。 第六节 垂直搜索引擎优化概览(图片搜索、移动搜索等) 一、图片搜索 搜索引擎对网站图片的抓取能力和图片搜索排名表现。 这样你的视频也会被搜索引擎快速地收录和在YOUTUBE 上得到宣传;
第十三章 几个重要的问题
第一节 搜索引擎排名作弊 一、什么是搜索引擎作弊?1、什么是搜索引擎作弊 搜索引擎作弊,或 SEO 作弊,SEO spam,搜索引擎垃圾等,是指为了提高在搜索引擎中展现机会和排名的目的,欺骗搜索引擎的行为。2、SEO 与搜索引擎作弊的区别 最大的区别在于,SEO遵循搜索引擎制定的一些规则,维护良好的搜索体验。搜索引擎优化更侧重改善站点本身的结构和内容,使得搜索引擎更容易理解站点,使得站点的质量提升,更能满足搜索引擎使用者的搜索需求。而搜索引擎作弊更多的是违反搜索规则,为了获取排名和流量,抛弃了用户体验,也影响了搜索引擎的使用体验。3、作弊与非作弊是个渐变过程 网页作弊的多样性和搜索引擎优化的各种策略使得作弊呈现一个渐变的趋势,而不是一个非0 即 1 的问题。搜索引擎会给网页的某些参数进行评分,在一定的分值内,搜索引擎会认为在合理范围内,而超过一定分值的网页则可能彻底封杀(不收录),或实施其他的进行惩罚性减权(比如排序往后)。 当然,在目前 SEO 市场及不规范的情况下,搜索引擎优化手段参差不齐,有的优化纯粹就是作弊,这值得引起高度重视。二、搜索引擎排名作弊的常见形式1、隐藏文本或隐藏链接 一般指网页专为搜索引擎所设计,但普通访问者无法看到的文本内容或链接。在形形色色的隐藏技术中,最常见的就是把文本或链接文字的字体颜色设置为与背景色相同或十分接近。 隐藏文本内容(Invisable/hidden text) 意欲在不影响网站美观的前提下通过包含大量 关键词的网页提高关键词相关性得分,从而达到改善搜索引擎排名的目的。 隐藏链接(Invisable/hidden links)意欲在不影响网站美观的前提下通过在其它页面添加指向目标优化页的隐形链接,通过提升链接得分而改善搜索引擎排名。 现在大多数搜索引擎都能检测隐藏技术,并视为作弊,包含隐含文本的网页面临被搜索引擎降低排名甚至删除列表等惩罚的风险。虽然在 Google 上不乏使用隐形技术而侥幸逃脱的网站,但多数人还是认为不值得冒这个险。其实通过添加可视文本内容并保证一定的关键词密度即可达到相同的优化效果。2、恶意更换页面内容 一般发生于先向搜索引擎提交一个网站,等该网站被收录后再以其它页面替换该网站。 “诱饵行为(Bait…&…Switch )”就属于此类偷梁换柱之举:创建一个优化页和一个普通页, 然后把优化页提交给搜索引擎,当优化页被搜索引擎收录后再以普通页取而代之。3、误导性或重复性关键词 误导性关键词(Misleading Words)在页面中使用与该网页毫不相干的误导性关键词 来吸引查询该主题的访问者访问网站。这种做法严重影响了搜索引擎所提供结果的相关性和 客观性,为搜索引擎所深恶痛绝。 重复性关键词(Repeated Words) 这种作弊技术也被称为“关键词堆砌欺骗(Keyword Stuffing)”,它利用搜索引擎对网页正文和标题中出现的关键词的高度关注来对关键词进行 不合理的重复。类似的其它做法还包括在 HTML元标识中大量堆砌关键词或使用多个关键词元标识来提高关键词的相关性。这种技术很容易被搜索引擎察觉并受到相应惩罚。4、隐形页面(Cloaked Page) 对实际访问者或搜索引擎任一方隐藏真实网站内容,以向搜索引擎提供非真实的搜索引擎友好的内容提升排名。典型的方式为使用Frame 技术,通过调用另一页面,隐藏实际页面的内容。5、欺骗性重定向(Deceptive redirects) 指把用户访问的第一个页面(着陆页)迅速重定向至一个内容完全不同的页面。在 SEO 从业人群中,有一部分人很擅长使用群发工具在互联网上到处留下带有其目标关键词的垃圾 链接信息,并且目标网页上大量堆积关键词,一旦某一个页面快速获得好的排名,他们将会 向客户出售或者租用这个页面,而把它转到客户的站点页面。对于上述做法,搜索引擎是不 赞同的。不过,如果不是恶意欺骗性重定向,比如目前被很多站点使用的根据客户IP 地址, 自动转向对应的本地频道首页的方式,是被搜索引擎认可的。6、鬼域(Shadow Domain) 这是最常见的欺骗性重定向技术,通过欺骗性重定向使用户访问另外一个网站或页面。 一般利用HTML 刷新标识(Meta Refresh )来实现。大多搜索引擎都不会索引使用该标识的页面。如果你使用刷新标识来检测浏览器或分辨率,那么就请使用 Javascript,且尽可能延长重定向时间。如果一定要使用重定向功能,那么请务必确保刷新周期不少于 10 秒钟。 还有一种情况就是当用户打开一个网站,该网站声称其网站已移至新域名下,并请用户点击新域名链接进入网站。但当用户进去后才发现,这个链接是一个“会员”链接。这也属欺骗性重定向行为。7、门页(Doorway Page) 也叫“Bridge/Portal/Jump/Entry Page”,是为某些关键词特别制作的页面,专为搜索引擎设计,目的是提高特定关键词在搜索引擎中的排名所设计的富含目标关键词的域名,且重定向至另一域名的真实网站。搜索引擎的Spiders 往往忽略对那些自动重定向到其它页的页面的检索。8、复制的站点或网页 最常见的当属镜象站点(Mirror Sites )。通过复制网站或卬页的内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引。现在大多数搜索引擎都提供有能够检测镜象站点的适当的过滤系统,一旦发觉镜象站点,则源站点和镜象站点都会被从索引数据库中删除。9、作弊链接技术或恶意链接(Link Spamming) 链接工厂(link farms)指由大量网页交叉链接而构成的一个网络系统。这些网页可能来自同一个域或多个不同的域,甚至可能来自不同的服务器。一个站点加入这样一个“链 接工厂”后,一方面可得到来自该系统中所有网页的链接,同时作为交换它需要“奉献”自 己的链接,籍此方法来提升链接得分,从而达到干预链接得分的目的。如今搜索引擎发现它 们已然不费吹灰之力。只要发现,不管属有意还是无意,“链接工厂”中的所有站点都难逃 系。 群发链接(针对 BBS,blog等)指为了提升站点的外部链接,采用人工或者程序的方式在其他站点的文章评论、留言板,或者 wiki、Blog上留下大量指向垃圾站点的链接。这种方法也被Google 形象地描述为“Google 炸弹”。目前各搜索引擎对于群发的行为都给予了严格的惩罚。10、其它 日志欺骗行为通过对一些页面等级较高的站点进行大量的虚假点击以求名列这些站 点的最高引用者日志中,从而获得它们的导入链接。Google已然意识到这种行为并将对利 用这种途径获得导入链接的站点采取相应措施。 门域(Doorway Domain)专为提高特定关键词在搜索引擎中的排名所设计的富含目 标关键词的域名,然后重定向至其它域名的主页。由于搜索引擎一般忽略自动重定向至其它 页的页面的检索,所以不提倡使用这种技术。 群发链接作弊目前的主流搜索引擎在考虑结果排序时仍然会参考链接关系,虽然它只 是上百个参数中的一个。但是,由于业界对链接关系的公关宣传效果,使得网站管理员们在 制作网站时舍本逐末,纷纷采用基于链接的作弊方式试图提高网站在搜索结果的排名。为保 证用户的搜索体验,大部分搜索引擎已经对这些通过“人造恶意链接”获得排名的网站,包 括对通过留言本、论坛、以及Blog 等群发URL 试图获得排名提高的网站进行了降权或对这些链接不计于任何权重,以遏制群发作弊软件的泛滥,还互联网一个干净公平的“搜索环 境”。 三、常见的作弊载体1、博客 博客得出现,为搜索引擎作弊重新营造了一个天堂。作弊者在大量博客网站申请自己的博客,然后在博客页面堆砌大量关键词,所有关键词都链接到自己的页面,或者干脆自动弹出自己的网站窗口。 博客诞生早期,Blog的PR 值普遍较高,在百度和 Google的权值都很大。搜索引擎非常青睐这些Blog 群,它们更新速度非常快,搜索结果排名比较靠前。如果你申请一个Blog,发表的内容有的会出现在 Blog 站的首页,根据权值传递说,那么你发表的内容在搜索引擎的权值比较