说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732
全网监测海量数据按需发布监测预警
实时把握舆情动态精准追溯信息源头
搜索引擎是怎样判断原创文章的呢?
作为文章内页,文章的内容占页面的大部分面积,首先我们来看搜索引擎是如何判断的。
网页的大致构成:
<html>
<head>
<title>网页标题</title>
网页基本信息描述(CSS、JS、RSS、keywords等基本描述)
</head>
<body>
网页的主题内容
</body>
</html>
上面是一个网页的基本元素,<head></head>是网页的基础描述,无论是搜索引擎还是用户(搜索结果),这是了解该网页基础的信息。
一个网页的重点应该是<body></body>之间的内容,这里是记录该网页详细的信息,用户通过浏览器也只能看见<body>元素里面的内容,所以,搜索引擎重点处理的内容包含在<body>元素里面。
了解了网页的大致构成后,我们来看看搜索引擎是如何对网页建立索引的。
搜索引擎建立索引和返回结果
首先我们要明白一点,搜索引擎不是智能,当然也不具备分析文章内容的能力,这也是为什么一些我们认为是牛头不对马嘴的文章,搜索引擎确收录的很好。
再来看文章,一篇文章是由很多句子构成的,句子又是由很多词语来组合而成的。
搜索引擎在对网页建立索引的时候,应该选择基础的方式,那是将文章拆分为若干词语,再将这次词语进行转换“二进制(不敢确定具体单位)”,在搜索引擎的算法里面,这些“二进制”将用于各种计算。根据用户的关注度,这些“二进制”和对应的算法结果将被预先储存,以便及时向用户展示算法结果(搜索结果),一些关注度不高的,及时返回数据。由于涉及的数据不多,处理速度完全可以满足。
通过上面的分析和目前搜索引擎的变化,热门关键词排名相对稳定(一段时间更新一次),长尾关键词的排名不稳定的大致情况了。
说明:如果您有任何疑问或想咨询其他业务请拨打电话 400 685 0732