一个文科生对PR算法的研究
  • 更新时间:2024-09-28 07:18:34
  • 网站建设
  • 发布时间:1年前
  • 670

最后给大家的忠告是珍惜生命,作为一名文科生。远离公式!

所有假设均基于对用户行为的分析。算法制定这些分析。所有算法都有一个假设。

PR算法主要基于数量假设和质量假设两方面

定量假设:页面接收到的传入链接越多(从其他网页到本页面的链接称为传入链接),网站建设越重要。也就是说,一个好的页面肯定会被很多其他页面推荐。

高质量的网页会通过链接传递更多的权重,质量假设:指向本页面的传入链接质量不同。越优质的网页指向本页,本页越重要。也就是说,一个好的网页一定会得到其他好的网页的认可。

PR算法一开始会通过以上两个假设,选择一批网页作为种子网页,分配较高的PR,通过迭代递归算法计算更新每个页面节点的PR分值。直到分数稳定,就是当前页面的PR分数。

作为页面排名的因素之一。但是PR是一个全局算法,PR计算的结果就是对网页重要性的评价。它与特定查询无关,即与相关性无关的高PR 并不意味着该页面是相关的。如果搜索引擎只使用PR算法进行排序,那么无论你输入什么查询词,输出的结果都是一样的,谁的PR高,谁就排在第一位。

公关重要吗?公关不重要吗?去果园!过分追求公关效果往往得不偿失。

高不高,为了公关。我们高的时候真的很高!

假设网页A有两个出站链接,分别指向网页B和网页C。如果A网页的PR值为1,那么根据概率均等分布的原则计算PR就很简单了。页面B 和C 的平均交付值为0.5。该计算方法基于随机游走模型。随机游走模型的意思是假设这个网页有3个外链,用户点击每一个外链的概率是一样的,所以传递的PR值也是一样的。

否则,所有网页的PR值最终都将是无限的。因此,PR算法引入了衰减因子的概念。由于网页是相互连接的,因此无法连续发送PR。也就是说,传输次数越多,距离种子页面越远,传输的PR值越少,直到传输值为0,分数稳定。计算最终的PR 分数,并将其添加到排名结果的计算中。

有些网页只有传入链接而没有传出链接。那么积累的PR值会越来越高,无法转入,这就违背了PR设计的初衷,影响公平。这种结构称为链接陷阱。

即PR传输不局限于出站传输,远程跳转是解决链路陷阱的通用方式。也可以一定概率将PR传到任意页面

它在反作弊中早已被广泛应用,PR算法是谷歌的标志性算法。即选择一批作弊网页作为种子网页(选择可信网页也是如此)并给予一定的作弊分数(或信任分数)以与PR算法相同的方式进行传输,设置惩罚阈值,并如果达到了,那就是作弊网页。

这种反作弊是基于以下假设:

那么这个网页很可能也是一个作弊网页。 1. 如果网页指向作弊网页。

那么就不能说明这个网页是作弊的。第二,如果网页被作弊网页指向。

这取决于这个算法解决了什么问题。当然,这只是最原始的反作弊思路。研究搜索引擎算法不能只盯着公式看。基于什么假设,这个假设是不符合用户行为的。只有了解了算法的来龙去脉,才能更好地理解搜索引擎是如何解决问题的。这就是学习SEO的方法!

防止违规行为受到处罚。了解规则,才能更好地利用规则。

本文发表于北京网站建设公司推来客http://www.tlkjt.com/

我们专注高端建站,小程序开发、软件系统定制开发、BUG修复、物联网开发、各类API接口对接开发等。十余年开发经验,每一个项目承诺做到满意为止,多一次对比,一定让您多一份收获!

本文章出于推来客官网,转载请表明原文地址:https://www.tlkjt.com/web/13146.html
推荐文章

在线客服

扫码联系客服

3985758

回到顶部