• Google PR值 - [魔傑-游戏人生]

    2009-01-04

    版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明
    http://www.blogbus.com/mo-jie-logs/33367955.html

          短短两个月不到的时间,用心经营的博客PR值已经升为3了,让我小小的惊讶了下,呵呵,不过还是蛮开心的,2009年已经来到,希望在新的一年我的博客能发展的很好,还有我的博友们也能很好的发展下去,大家一起进步!

    附:Google PR算法

    一、简单算法:
    例如一个由4个页面组成的小团体:A,B, C 和 D。如果所有页面都链向A,那么A的PR(PageRank)值将是B,C 及 D的和。

    PR(A) = PR(B) + PR(C) + PR(D)

    继续假设B也有链接到C,并且D也有链接到包括A的3个页面。一个页面不能投票2次。所以B给每个页面半票。以同样的逻辑,D投出的票只有三分之一算到了A的 PageRank 上。

    风采依扬觉得,根据链处总数平分一个页面的PR值。

    最后,所有这些被换算为一个百分比再乘上一个系数q。由于下面的算法,没有页面的PageRank会是0。所以,Google通过数学系统给了每个页面一个最小值1 − q。

    所以一个页面的 PageRank 是由其他页面的PageRank计算得到。Google 不断的重复计算每个页面的 PageRank。如果您给每个页面一个随机 PageRank 值(非0),那么经过不断的重复计算,这些页面的 PR 值会趋向于正常和稳定。这就是搜索引擎使用它的原因。

    二、完整的算法:

    这个方程式引入了随机浏览的概念,即有人上网无聊随机打开一些页面,点一些链接。一个页面的PageRank值也影响了它被随机浏览的概率。为了便于理解,这里假设上网者不断点网页上的链接,最终到了一个没有任何链出页面的网页,这时候上网者会随机到另外的网页开始浏览。

    为了对那些有链出的页面公平,q = 0.15(q的意义见上文)的算法被用到了所有页面上, 估算页面可能被上网者放入书签的概率。

    所以,这个等式如下:

    p1,p2,…,pN是被研究的页面,M(pi)是链入pi页面的数量,L(pj)是pj链出页面的数量,而N是所有页面的数量

    PageRank值是一个特殊矩阵中的特征向量。这个特征向量为

    R是等式的答案

    如果pj不链向pi, 而且对每个j都成立时,等于 0

    这项技术主要的弊端是,旧的页面等级会比新页面高,因为新页面,即使是非常好的页面,也不会有很多链接,除非他是一个站点的子站点。

    这就是 PageRank 需要多项算法结合的原因。之前石头也说了wikipedia.com在google的一些关键词内表现很好整体的访问量超过一些门户网站,另一方面也是数万网民的共同努力。

    Google对维基百科情有独钟之一,风采依扬想应该是:PageRank 似乎倾向于维基百科页面,在条目名称的搜索结果中总在大多数或者其他所有页面之前。原因主要是维基百科内相互的链接很多,并且有很多站点链入。

    Google 经常处罚恶意提高 PageRank 的行为。Google 究竟怎样区分正常的链接交换和不正常的链接堆积仍然是商业机密。

    相信看完以上内容后对PageRank了解更深入。

    我们可以知道搜索引擎用来评估网页质量的一种方法,就是PageRank,它经常被用来当作对Google搜索引擎网页要素评分之一。

    你可以找到任何网页的PageRank分数,通过使用你的浏览器去浏览网页,并下载GOOGLE工具栏。将你的鼠标放在绿色的PageRank栏上,马上就会显示出一个从0到10之间的数字,这就是PageRank值,是google对该页面的重要性的分配。工具栏按照PageRank比例范围显示出网页的PageRank,但是在现在的PageRank算法中就是不单单是0到10的数据了,在google的服务器中,PageRank的分配数有可能是0精确到100,甚至是到1000的数值。

    PageRank是平均每三个月更新一次的,它不是按照一般的线性刻度计算,而是按照一种指数刻度。这是一种非常繁杂的数学术语(之前文章也有提到),意思是PageRank4不是比PageRank3好一级—而是会好6到7倍。因此一个PageRank5的网页和PageRank8的网页之间的差距会比你可能认为的要大很多。

    PageRank值在这几天要更新了,我们谈谈现在PR的算法吧!当一个网页链接到你的网页时,搜索引擎是怎样转移这个网页的权威性到你的网站的(也就是PageRank的转移)。因此你希望从有最高PageRank得分的网页上获得链接,去不断的寻找高PR的站点,是不是呢?

    这种方式在以前还管用,但是现在实际情况比这复杂了很多,一个权威性的转移与网页上存在的链接数量有关—链接越少,每个链接所转移的权威性就越高,因些,通常PageRank5网页上唯一的链接要比PageRank7上一百个链接中的一个要有价值。当然这也是有前提的,就是站于站之间的链接内容相似度要高一些。
    如:
    A(SEO资料站)站同时链向B(SEO服务网站)、C(企业服装网站)
    那么A站的PageRank转移到B、C那个站所得的分高呢,在众多的实验证明B站获得A站的PR转移得分比C站高,原因很简单:A、B二站的相似度很高,所得的得分也自然高。

    之前所讲的大家都知道PR值的重要性,但是真的一提的是,不要落入PageRank的诱惑陷阱中。对于你的网页来说,最重要的是被链接到那些能为你的站点带来流量的站点,而不是见到PageRank就链。要将PageRank作为工具来验证你自己对一个潜在链接来源质量判断,而不要在做你的链接来源列表时盲目跟从PageRank。

    分享到:

    历史上的今天:

    诱惑的曲线 2009-01-04
    世界时钟 2009-01-04

    评论

  • 好深奥,恭喜了,我的也是3了,哈哈
    回复林晨说:
    呵呵 同喜哈~
    其实那个算法我也看不懂...
    2009-01-04 14:47:02
  • 恭喜升3了,新年快乐!
    回复daniel说:
    呵呵,谢谢,新年快乐!!
    2009-01-04 13:27:38
  • 恭喜恭喜!
    回复新鲜人说:
    谢谢哈 一起为新创意主义奋斗 呵呵
    2009-01-04 11:47:40
  • 支持博主~~
    回复byte.crawl说:
    谢谢!欢迎常来~
    2009-01-04 10:40:28