说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732
全网监测海量数据按需发布监测预警
实时把握舆情动态精准追溯信息源头
pagerank算法 pagerank算法是什么
在做网站的过程当中,相信许多人都遇到过pagerank算法,然而这种算法究竟是一种什么样的说法,这种说法又该如何使用呢?接下来我们就一起来好好的了解一下吧。
pagerank算法——pagerank算法是什么
PageRank的创始人拉里佩奇(LarryPage)和谢尔盖.布林(SergeyBrin),在1998年提出了该算法,并应用在Google搜索引擎的检索结果排序上,该技术也是Google早期的核心技术之一,是Google用来衡量一个网站好坏的标准。
PageRank是一种在搜索引擎中根据网页之间相互的链接关系计算网页排名的技术。Google用该技术来标示网页的等级或者重要性。PageRank的级别从1级到10级,PR值越高说明该网页越受欢迎(即越重要)。
PageRank近似于一个用户,是指其在Internet上随机地点击链接将会到达特定网页的可能性,是一个概率。通常,能够从更多地方到达的网页更为重要,因此具有更高的PageRank。
查看某网页的PageRank值可以安装Google工具条并启用PageRank特性,或者在firefox安装SerchStatus插件,或者在http://pr。chinaz。com中查询。
pagerank算法如何使用
下面将介绍网页重要程度的定量计算,也就是计算PageRank的值。
1.PageRank简单计算模型
假设一个有只有四个页面组成的集合:A,B,C,D。如果所有的页面都链接向A,那么A的PR值将是B,C,D的和:
继续假设B也有链接到C,并且D也有链接到包括A的三个页面。每次链接都相当于对其所连接页面重要性的一次投票,一个页面不能投票两次。所以B给每个页面投半票。以同样的逻辑,D投出的只有三分之一给了A,那么
换句话说,根据链接出的总数,平分一个页面的PR值:
其中PR(A)表示页面A的PageRank值,L(B)表示页面B链接出的总数。
PageRank简化模型:
可以把互联网上的各网页之间的链接关系看成一个有向图。假设冲浪者浏览的下一个网页链接来自于当前网页。建立简化模型:对于任意网页Pi,它的PageRank值可表示为如下:
PRi:网页i的PageRank值
PRj:网页j的PageRank值
Lj为网页j的对外链接数
Bi为所有链接到网页i的网页的集合
在实际的网络超链接环境下没有那么理想化,PageRank会面临两个问题:RankLeak和RankSink。
1.RankLeak:一个独立的网页如果没有外出的链接就会产生等级泄露。
解决办法:
(1)将无出度的节点递归地从图中去掉,待其他节点计算完毕后再加上。
(2)对无出度的节点添加一条边,指向那些指向它的顶点。
2.RankSink:整个网页图中的一组紧密链接成环的网页如果没有外出的链接就会产生RankSink
以上就是pagerank算法如何使用的所有内容,对于一个网站来说了解和学会pagerank算法是一个非常重要的知识点,所以大家一定要重视,请各位还想了解更多与之有关的内容,欢迎关注我们文军营销的官网。
推荐阅读
说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732