为您提供网站建设行业资讯、网站优化知识、主机域名邮箱、网站开发常见问题等
网站建设之搜索引擎HITS算法
发表日期:2009-10-07 资讯来源:佰牛科技 浏览:129

近来发现百度等搜索引擎的算法更新越来越频繁,导致很多网站的关键字排名也漂浮不定。但你知道他们为何要如此频繁地更改算法呢?恐怕并不是想完善算法那么简单吧?因为核心算法早已成熟,下面就跟大家来谈谈HITS算法。
HITS算法是Web结构挖掘中最具有权威性和使用最广泛的算法。其基本思想是利用页面之间的引用链来挖掘隐含在其中的有用信息(如权威性),具有计算简单且效率高的特点。HITS算法通过两个评价权值——内容权威度(Authority)和链接权威度(Hub)来对网页质量进行评估。
内容权威度与网页自身直接提供内容信息的质量相关,被越多网页所引用的网页,其内容权威度越高;链接权威度与网页提供的超链接页面的质量相关,引用越多高质量页面的网页,其链接权威度越高。
HITS算法认为对每一个网页应该将其内容权威度和链接权威度分开来考虑,在对网页内容权威度做出评价的基础上再对页面的链接权威度进行评价,然后给出该页面的综合评价。然而HITS算法也有其明显的不足。
首先,它完全将网页的内容或文本排除在外,仅考虑网页之间的链接结构来分析页面的权威性,这与现实网络中的权威页面相比,其不科学性显而易见。因为权威页面必须针对某一主题或关键词而言。某一页面对一确定主题的具有较大权威性的页面并不意味在其他与其无关的主题方面同样具有权威性。
其次一个页面对另一页面的引用有多种情况,其中包含了一页面对另一页面的认可,但除此之外也有其他目的链接,如为了导航或为了付费广告。而HITS算法在实现过程中均没有考虑以上情况.导致了结果与目标的差距。就HITS算法的思想与实现过程做了细致的研究与概括。
针对前面第一种不足,就有相关的学者提出了一种利用超链文字及其周围文字与关键字相匹配而计算超链权值的方法,并引入系数对周围文字和超链文字进行权值的相对控制,很好地将页面文本信息引入到HITS算法,提高了算法的可靠性,并在现实中取得了很好的效果。
对HITS算法的第二个不足,即非正常目的的引用。在HITS算法看来,也误认为是正常引用,导致实际结果与目标的出入。后来,经过不断的改进。HITS算法又引入了时间参数,即利用对一链接引用的时问长短来评价是否为正常引用。因为非正常链接其引用时问肯定不会很长(如交换链接、广告链接),相反,如果一页面对另一页面的链接时间较长,则必然反映此页面就是用户的寻找页面。即目标页面或至少是正常引用。
如果设定时间阀值,则可以将非正常引用的链接在HITS算法的实现过程中筛选出来。如设定访问时间少于1分钟者为非正常引用。另外可构造时间访问函数,控制权威页面的相对大小。如随访问时间的增大而其权威性也逐渐非线性增大.这样可为HITS算法的权威页面提供更合理、更科学的解释。链接稳定性,在外部链接的建设中,占据非常重要的地位。链接越稳定,对排名的帮助就越大。
佰牛网络【深圳网站建设】从HITS算法的这些特征,我们大概就能想到各大搜索引擎为何每隔一段时间又要更新其算法的原因了。
- 内容标签:
- 网站建设
- 搜索引擎HITS
- 广州网站seo
- 深圳网站建设
- 相关资讯
-
联系我们-新盛娱乐客服开户注册电话15559858555
首页-新盛娱乐公司-电话【15559858555】【微信】新盛公司微同步【在线客服-15559858555】开户电话-客服开户-热线开户-咨询-联系-代理开户-在线开户-开户网址-注册开户-开账号-开会员
日期:2025-06-25 浏览:100 -
浅谈Seo工作中执行力的重要性
总的来说’PDCAR法则”就是制定好计划马上实施,计划实施完毕后,将整个计划执行的过程回顾一遍,仔细考虑每个细节,确认哪些部分成功了,哪些部分是失败的。
日期:2016-05-16 浏览:120 -
SEO大牛是如何“原创”网站文章的?
首先是收集长尾关键词,你可以去百度指数、百度相关搜索栏、百度知道问答或者软件等等地方收集到长尾关键词。有一点要注意的是,我们收集好关键词后要进行整理,把明显不相关的长尾词筛选,比如搜索钢管时会出现"钢管舞"这跟做钢管这一产品词没有帮助。
日期:2016-05-16 浏览:123 -
外链建设如何影响网站关键词排名
再次是外链的相关性远比数量重要,很多SEOER做外链基本不注重相关性,在他们看来,只要悬挂外链的网站有高权重即可,并且觉得外链做的越多越好,也就是说十分注重外链的数量,忽略的质量。
日期:2016-05-16 浏览:122 -
如何识别SEO中的水货?
百科中原理写的是向百度发送数据包。大哥,你发了也得人家接收执行才行。这边如果写成『缓存溢出可执行漏洞』,那还具有一定可行性。而忽悠大师是不会这么深入研究的,他们最擅长的就是抛出一套理论,让你觉得很高深,很有效,其实具体怎么执行,往往他们都说不出个所以然来。
日期:2016-05-16 浏览:120 -
精简优化代码是做好SEO优化必须的一个步骤
尽量采用局您的页面,局的益处是让搜索引擎爬虫能够更顺遂的、更快的、更友好的爬完您的页面局还可以年夜量缩减网页巨细,这在SEO优化工作中起到很大的浸染,不仅提高浏览的速度,更使得代码更精练、流利、更轻易放置更多内容。
日期:2016-05-16 浏览:121 -
对于于门第上网站seo优化的网站操作
网站题目:关于一度新站来说是很首要的,第二天你网站题目就成为了呵呵,这可是举例,百度引擎可没有喜爱网站题目没有断变来边去,新站要安靖做兴起,就要想好一度面前的题目,假如斯后需求批改,也最好正在网站有所根底的状况下,遏制修正。
日期:2016-05-16 浏览:130 -
SEO优化 文章隐藏的文本和链接算是作弊?
在网站底部添加闪动的友情链接,只需要拉动到网站底部就可以看到一排闪动,从源代码里面可以看到,也有添加到其他地方的(这个情况一般都是网站被黑了,网站怎么预防请看:网站被黑预防措施)
日期:2016-05-13 浏览:122