认真从计算方法角度阐述PageRank机制2篇文章:
一篇来自日本,
Google の秘密 - PageRank ?氐捉庹h
http://www.kusastro.kyoto-u.ac.jp/~baba/wais/pagerank.html
一篇来自德国:
http://pr.efactory.de/
里面有更详细的PageRank算法说明和各种清晰的小型个案分析
比如:子页中导航条的重要性
B <=> A => C
Vs
B <=> A <=> C
页面数量因素:
B <=> A <=> C
Vs
F <=\ /=> G
B <=> A <=> C
D <=/ \=> E
一个意想不到的结论:
(B <=> A <=> C) ( E <=> D <=> F)
Vs
(B <=> A <=> C) <=> ( E <=> D <=> F)
PageRank升高的只是被链接的2个首页A和D,而网站子页面的PageRank平均会略有下降。同时:一个网站进入Google的索引量越大其受类似因素影响越小。
PageRank不对称的页面互链:
Google会用BadRank之类的算法进行纠正,而且一个网页着有来自“与其自身不相称”的高PageRank站点的链接,而自身又缺少足够数量和质量的反相链接的话,其PageRank会自动降低为0,A(pr=7) <=> B(pr=0)
简单的说就是:偶尔要被权威站点反相链接不算数,要被足够多的权威站点引用才能提高自身网页的PageRank。
-------- ...
2篇文章: 一篇来自日本, Google の秘密 -... 一篇来自德国

发表评论