WJMonitor舆情之声

企业大数据智能舆情监测管理解决方案

全网监测海量数据按需发布监测预警

实时把握舆情动态精准追溯信息源头

获取验证码

企业采购 个人使用

首页 > 网络营销 > 网络营销动态 > 搜索引擎是怎样判断原创文章的？

搜索引擎是怎样判断原创文章的？

时间:2011-03-10 09:03:00

搜索引擎是怎样判断原创文章的呢？

作为文章内页，文章的内容占页面的大部分面积，首先我们来看搜索引擎是如何判断的。
网页的大致构成：

<html>

<head>

<title>网页标题</title>
网页基本信息描述（CSS、JS、RSS、keywords等基本描述）

</head>

<body>
网页的主题内容

</body>

</html>
上面是一个网页的基本元素，<head></head>是网页的基础描述，无论是搜索引擎还是用户（搜索结果），这是了解该网页基础的信息。
一个网页的重点应该是<body></body>之间的内容，这里是记录该网页详细的信息，用户通过浏览器也只能看见<body>元素里面的内容，所以，搜索引擎重点处理的内容包含在<body>元素里面。
了解了网页的大致构成后，我们来看看搜索引擎是如何对网页建立索引的。
搜索引擎建立索引和返回结果
首先我们要明白一点，搜索引擎不是智能，当然也不具备分析文章内容的能力，这也是为什么一些我们认为是牛头不对马嘴的文章，搜索引擎确收录的很好。
再来看文章，一篇文章是由很多句子构成的，句子又是由很多词语来组合而成的。
搜索引擎在对网页建立索引的时候，应该选择基础的方式，那是将文章拆分为若干词语，再将这次词语进行转换“二进制（不敢确定具体单位）”，在搜索引擎的算法里面，这些“二进制”将用于各种计算。根据用户的关注度，这些“二进制”和对应的算法结果将被预先储存，以便及时向用户展示算法结果（搜索结果），一些关注度不高的，及时返回数据。由于涉及的数据不多，处理速度完全可以满足。
通过上面的分析和目前搜索引擎的变化，热门关键词排名相对稳定（一段时间更新一次），长尾关键词的排名不稳定的大致情况了。

产品与服务

WJMonitor舆情之声 WJInsight品牌洞察 SEO搜索引擎优化网络口碑营销信息流推广

WJMonitor舆情之声

搜索引擎是怎样判断原创文章的？

相关资讯

产品与服务

最新文章

热门文章