Archive.org: 浏览网站历史

Archive.org 是一个互联网资料馆网站,提供互联网上的图像,视频,音频等资料。我们应该最熟知的应该就是 web.archive.org 这个服务了,从这里可以查询到网站的历史页面存档。对了解域名历史,网站历史等等很有帮助。

简单介绍

下面是archive.org官方页面上的介绍:

Internet Archive 是一个非盈利性的机构,目的是建立一个互联网资料馆。它的目的包括为研究者,历史学家,学者,残障人士及其他大众提供数码形式的历史收集。我们位于旧金山,成立于1996年。我们的这些资料来源于Alexa及其它服务商的捐赠。在1999年的后期,我们开始收集更全面的信息。至今我们拥有文字,音频,电影图像,软件和网页,并为盲人及其他残障人士提供专业的阅读及信息服务。

还在等什么,立刻来尝试一下吧:Internet Archive

使用帮助

  1. 打开Internet Archive网站,如果打不开,请自行学习翻墙技术!
  2. 在“The Wayback Machine”字样的输入框中输入域名,然后回车即可看到历年来所提供的网页存档
  3. 搜索之后可以看到一个列表,当中列出所该网站在所列出时间点的页面存档。很详细,我在里边看到以前我做的一个网站,还有当时的logo存档,顿时感慨万千。
  4. 如果需要更高级的搜索功能,建议使用 Advanced Search 功能来查找,可分时间段、文件类型、重复页面选项来过滤,甚至可以把历史页面输出为PDF文档保存下来!

Search Status: firefox下的seo插件

Search Status 是一款 firefox 浏览器下的 seo 插件。可以显示 PageRank, Alexa Rank 等 seo 相关数据,同时,他还可以查询到同ip下的域名、显示robots.txt、sitemap等功能。

插件概况

  1. 名称:Search Status
  2. 网址:https://addons.mozilla.org/en-US/firefox/addon/321/
  3. 作者:Craig Raw
  4. 授权:免费
  5. 系统:Windows、Linux、Mac等
  6. 语言:英文

安装

  1. 使用 firefox 打开网址后,点击“Add to Firefox”,按照提示进行即可
  2. 安装成功后在Firefox的最下方状态栏会出现一个@标志,同时旁边会有PageRank 和 Alexa Rank 等数据。这个时候可以对@点击右键选择option进行属性设置

右键菜单设置详解

    点开右键之后出现一系列菜单,现在就来进行逐条详解:

  1. About Quirk Searchstatus:插件的版权声明等信息,感谢一下作者吧
  2. Options:设置界面
  3. Enable:在状态栏等处显示的信息。可选的项目有:PageRank, Alexa Rank, Compete Rank 和 mozRank。此处建议选择前两项,因为PageRank 和 Alexa Rank 是比较常用的站点数据依据。
  4. Highlight Nofollow Links:高亮显示使用“Nofollow”属性的链接。关于 Nofollow 属性,您可以查看这篇文章:《博百优比赛潮流:去掉nofollow是好是坏?》。这样在浏览其他人的站点的时候,就可以很轻松地看到别人是如何运用 Nofollow 属性的。
  5. Link Report:显示当前页面的链接报告。能统计出 总链接数、外部链接数、内部链接数、外部跟随连接数、Nofollow 链接数 和 加密链接数
  6. Meta Tags:显示当前页面中 head 里 meta 标签的相关内容。
  7. Show Other Domain on IP:显示当前ip上的其它域名。
  8. Show in Archive.org:在 Archinve.org 上显示相关的历史内容。链接有可能被墙,推荐大家自行学习翻墙技术
  9. Show Whois:显示域名的注册相关信息
  10. Show Robots.txt:显示 Robots.txt 的内容。显示搜索引擎指导文件的内容。
  11. Show Sitemap.xml:显示 Sitemap.xml 的内容。显示站点地图的内容。
  12. Show Keyword Density:显示关键词的密度,因为对中文分词支持的问题,统计效果并不好,密度统统为零。汉字的两个词之间没有空格,无法统计词语数量。
  13. Highlight Keyword:高亮显示关键词。
  14. Show Indexed Pages:显示搜索引擎索引数量,就是我们常说的收录情况。可选项有四个:All,Yahoo Site Explorer,Google,Ms Live
  15. Show Backward Links:显示搜索引擎反链数量,就是我们常说的反链。可选项有四个:All,Yahoo Site Explorer,Google,Ms Live

推荐设置

  1. PageRank 和 Alexa Rank 设置到菜单栏上。firefox很多插件都要在状态栏上放个图标,导致我的状态栏不够用,经常链接提示显示不完整。而 PageRank 和 Alexa Rank 也并非每个站点都要看的,所以放到菜单栏后边,需要的时候抬头看一下
  2. Only get ranking after clicking on the toolbar: 这项不要勾上。 如果勾上了,每次都要点击一下才会显示出相应的数值,不太合适。

去掉nofollow是好是坏?

博百优开赛已经有一段时间了,至此各路高手竞相展现自己的实力。在苏囧的博客上发现一个声明,声称在自己博客上去掉了评论中 nofollow 属性[1]。作为解释自己博客留言人数众多的原因。原文:

在首页前三的站中很多站长留言,而我也观察了其他两位的,第二位 bobeiyou中的留言,评论添加了跳转,在第三位zuihaoting中为死链!而我的博客未用任何提转,nofollow,等不利搜索引擎的函数!效果也是最好,所以留言的人要多。

什么是nofollow

nofollow 简单的说是一个链接属性声明,标注此链接并非是作者所留下的链接,适用于不可信赖的内容付费链接内容优先级排序等等。关于此属性的更多内容可以查看 Google 站长工具箱里的《关于 rel=”nofollow”

nofollow 应用实例

Matt Cutts 先生是 google seo 方面的专家,是 seo 界内人所皆知的一位人物。他的博客 Matt Cutts 可以在这里作为一个实例来作为讲解。

大家可以和我一起来做,打开他的这篇文章《Live-buzzing Day 2 of the Google I/O keynote》,查看源代码,发现 nofollow 属性应用的地方可分为两种类型,不可信赖的外部链接内容优先级的应用。

  1. 博客Rss链接我们所知道,Rss是一种订阅方式,所输出的内容基本与web网页上的内容完全一致,只是可能在用户体验上稍有不同。重复的内容指向就很不利于搜索引擎的收录,所以在这里需要用到 nofollow 属性来告诉搜索引擎,这个不需要收录
  2. 评论者的链接博客是一种互动性的内容,而作为评论则是用户产生的内容UGC(User Generated Content)。评论中自然不缺乏有价值的内容,作为博客的第二灵魂。但是从对用户负责的态度来看,任何评论者都可以留言并有可能得到审核通过。而且因为这些网址的不可控制性,很难保证现有的健康的链接以后不会变成有害链接。不管从内容相关度等seo优化的角度,还是保护读者浏览体验的角度来说,都要用 nofollow 属性来告诉搜索引擎:“这个不是我的站点,属于外部链接,是不可信赖的内容”。
  3. 表单、内部链接在评论表单锚(#respond)和固定链接锚(Permalink to this comment)中,也有 nofollow 的应用。这些其实是基本无用的内部链接。评论表单和固定连接都是在本页内有出现的内容,也就是说属于重复内容,在收录的过程中没有必要收录,准确地说是没有很高的优先级。
  4. nofollow属性的细分如果和我一起动手的朋友可能会发现, 在源码中 Matt Cutts 先生还把 nofollow 属性进行了细分。Rss 链接中的为“nofollow”,而评论中则使用了”external nofollow”。”external nofollow” 是外部链接的意思,进一步详细告诉搜索引擎这个链接的不可信赖等级。

大家在自己博客写作过程中可以借鉴参考一下 Matt Cutts 先生的做法。他对 nofollow 属性的应用非常细致。

nofollow 和博百优比赛

博百优大赛做的是百度的搜索引擎优化。从这点来说,以上所分析的不一定准确。《关于 rel=”nofollow”》文中也提到,“其他搜索引擎对 nofollow 的处理方式与我们可能略有不同”。不过从苏囧声明本身来看,还是有不少站长对这个是非常在意的。下面来说一下此次博百优比赛中所遇到的使用 nofollow 属性来处理链接的情况。

  1. 友情链接的nofollow处理这种做法由来已久,相信各位对 seo 有所了解的朋友也会对此深恶痛绝。在05年在落伍者站长交换个人博客链接的时候就发现有这种情况。双方做上链接,也就是常见的链接互换之后,一方耍小聪明,把链接加上 nofollow 属性,等于告诉搜索引擎:“这个链接不是我加上的,是不可信赖的,请忽略掉”。在pr更新之后另一方发现自己的没有更新,泪流满面…… 这种行为从seo角度上来说,不算作弊,因为搜索引擎没有道德观念。最严重的实际损失也不过是被撤下链接。但是,作为一个站长,所谓的友情链接都要作弊,还能指望站点有多好么?
  2. 评论中链接的nofollow处理这点来说,不管是国外的wordpress还是国内的一些asp的博客程序,都已经非常好地做到处理评论者的链接。51bobaiyou.com 用的是国内的(大概是zblog)asp程序,评论链接中使用了”nofollow”;而google上排名第一第四的博百优测试网柳城对在这方面做得很不错。
  3. Rss及其它nofollow链接处理同样还是博百优测试网柳城这两位的博客,在rss上都做了 nofollow 处理,大概是wordpress天生的优势所在。柳城对 nofollow 属性的使用则是到了极致,一些内页,比如链接页都做了处理,以至于我都有些怀疑柳城是否过滥地使用了。

博百优比赛中去掉nofollow属性的得与失

2010年6月3日更新( :苏囧在网站被降权以后已经重新在评论链接里加上了nofollow属性,并且权重得以恢复。至此,我认为,这个话题已经可以画上句号了,评论链接里的nofollow是必须的。

百度是支持nofollow属性的了,已经由百度seo方面的权威ZAC很明确的说过了。“不可信赖的内容,付费链接,内容优先级排序”是nofollow属性的三个应用,友情链接里的就应该是“不可信赖的内容”,因为这个链接不是站长留下来的,也是超出了站长的控制范围之外的。万一链接里有spammer留下质量低的网站(带木马、采集站等等),首先,没有nofollow的话,搜索引擎就认为这个链接是站长加上的,无论在页面相关性和用户体验方面,在搜索引擎里你的得分都会被降低;另外,搜索引擎就算不做惩罚,质量低的网站因为这个链接而排名靠前了,那对网民来说是个祸害,间接的站长就成了帮凶。所以,评论中的nofollow是无论如何都要保留的

本次博百优比赛确实给我们耳目一新的感觉,就光从诸多高手的参赛站本身来说看点就已经很多。各位如果到此觉得苏囧的做法不是很明智,我倒觉得这个结论为时尚早:

  1. 内容相关性苏囧几篇关于博百优的文章我记得在众多参赛者评论方面引起很大关注,留言者所带的链接很多都是与博百优相关的站点。从这点来说,内容相关性极高。不过现在再去看的时候,什么乱七八糟的留言都有,而且苏囧本人似乎大度过头了。他一直在强调的用户体验在评论中没有丝毫体现,看他博客评论的时候真想一巴掌把自己拍死。斗胆向苏囧建议一下,是不是可以考虑一下 Akismet 这个插件来做一下 anti-spam?
  2. 用户体验刚才说了,在做seo的人中,强调用户体验的非常少。苏囧能坚持这点非常难得([2])。此次比赛中,在某些其他竞争对手一直在过分强调链接,甚至不惜用nofollow作弊来达到单向链接的氛围下,苏囧去除掉nofollow,这种大度的做法赢得了一致好感。留言赞美的人不在少数,这何尝不是一种用户体验?通过牺牲链接的属性,来提升用户体验(增加好感),很可能降低bounce rate,增加pageview,何尝不是一种积极的手段和尝试?

当然,这些高手所作的这些努力,都是值得我们认真分析的。至于结果如何,meet us in July!

注释

  1. [1]苏囧关于去掉nofollow的原文链接
  2. [2] 从这个意义来说苏囧根本就不是一个市面上常见的seo者,那些人只会用低劣的手段增加外链,毫不顾忌文章内容和用户体验

文章更新历史

  1. 2010年6月3日:文章修正,增加了苏囧试验的结果,明确指出nofollow在评论中是必要的。
  2. 2010年5月22日:文章第一稿发布。