百度是怎么进行核心检索词,切词、提权及倒排索引的?

2019-10-28 18:34| 发布者: | 查看: |

当前位置:主页 > 新闻资讯 > 推广资讯 > 百度是怎么进行核心检索词,切词、提权及倒排索引的?
今天看完一份百度专利,名字叫《检索词核心权重确定方法和装置》,对比了一下我最近网站内页排名好的一个案例来看,发现了一些有用的信息,分享给大家,这篇文章标题就是百度怎么知道我们一个文章的主体核心词的,怎么给予这些检索词的权重,然后按照切词完的权重大小记性排序,然后在百度词典中进行查找对比,然后再返回到索引库进行排序,就怎么一个原理!
 
以下是我通过这个专利通过自己的理解和白话总结出来的,贡献给大伙!
 
主体大意:根据这种装置来确定核心词的权重,进行提权!
1.计算核心词的权重,如果第一词典中没有找到核心词,那么就会继续切词重新来计算,在从第一词典中寻找,如果还未找寻。
2.那么就会继续对第二检索词切词计算,获得第二检索词的各项词权重,在第一词典中寻找,如果还未找寻继续下一步!
3.然后会在线下核心计算生成的第二词典中进行分析,根据第二检索词切词后的权重进行关联分析,加权!按照切词后的权重大小排序,选取一定数量的关联检索词和关联检索词核心成分组成特定的第一向量特征FV!
4.然后计算每个切词对应关联检索词和关联检索词核心成分的第二特征向量FVn,与第一向量FV的夹角余弦值,该值作为每个切词的权重!
5.按照我们切词完的权重大小进行排序,然后选出切词中权重最大的作为核心切词Tc
6.然后将核心切词T与其他切词Ti与其粘接,获得粘接切词Tp
7.粘接切词Tp对应的核心切词和粘接切词Tp对应的核心切词成分组成第三特征向量
8.计算第三特征向量FVp与第一特征向量FV的夹角余弦值,作为粘接词Tp的权重,并将链接词Tp修正,作为第二检索词的核心权重
9.将预定时间内的检索日志汇总,然后对于汇总的检索词进行编码,然后对于这个编码后的检索词进行关联,获得关联检索词,然后根据关联检索词生成倒排索引,然后根据倒排索引的关联词进行核心分析,获得第一词典文件和第一数据文件,然后对于倒排的检索词进行切词,然后进行核心分析,得到第二词典和第二数据文件!


 
可能看这个你不太明白,在来看看我们这个页面参与排名的案例或许你就能清楚一些了!
 
 ASO关键词优化案例截图

这个是这篇文章的主要核心词,百度是能分析出来的,那么为什么这个有排名呢?继续接下来往下面看!
 
 
aso关键字优化案例截图
 
看同义词的排名,关键字和关键词是同义词,但是确实排名在第三页了,这又是为什么了呢?
 
 aso关键词排名优化案例截图
 
再看看这个加了个排名在里面,发现排名还是在第三页,但是在不同的地区可能有的在首页上,有的地区没有在,因为地区的原因和用户点击的原因!
 
 aso关键词优化方案案例截图
 
后面再加个方案依然是在第三页,之前是看在首页的,可能由于点击少或者跳出率高的原因造成的排名下滑,毕竟文章不是纯原创的,也是copy过来的,可能用户体验度不是很高,没办法解决他们的主要疑惑!
 
在来看我们这个文章的整个篇幅,你可以发现是比较长的,长页面对于排名来说更占据主要优势,这点是做过论证的,图文都是比较合适的,文字标题都还ok,在页面美观度的程度上是合格的!
 
 
 
在回到今天的主题百度是怎么对检索词进行切词提权的,可以看到我们这个站的主体就是以关键词优化业务为主而搭建的,对于关键词优化这个词出现的频次更高,所以这个排名也就越好越稳定!
 
 
 
可以看到我们做这篇内容的时候找了很多关于ASO关键词优化相关的东西,相关度这块做的还是比较ok的,对于内容稀释度也是做的还好,所以才有了今天这篇文章的大量排名!
 
 
 
所以说一个网页之所以有排名,一定是有原因的,一个网站也是,你核心关键词没有排名到首页上肯定是因为自己网站某一部分原因比不过人家,比如网站的信任度、网站内容质量、网站框架、网站速度、代码整洁度、网站外链质量与数量、标题的匹配度、描述的编写、或者用户体验度(即有用的快排)等等原因,还有看这个词的竞争难度,有多少家在竞争了,竞争力度越大的词,那么做起来就越困难,可能这些数据指标都有趋于完美才有可能做到上去,如果竞争难度小的词,没什么竞争就可能某一项达标即可上首页了!
 
就比如我们这个词首页都是内页排名,那么我们也能用内页关键词排上去,如果都是首页在竞争排名,除非你的网站信任度很高了,那么也可以用内页做上去哦!
 
好了对于百度关于检索词核心权重确定方法介绍就到这里了,这个其实跟tf-idf算法有着很紧密的联系,一个是确定检索词权重方法和确定核心词频次的方法,都是相通的!

热门文章:
随机文章:

本文链接:http://www.paishanglai.com/xwzx/tgzx/356.html

排上来是一款搜索引擎霸屏营销系统,轻松实现百度霸屏推广,关键词排名推广,万词排名推广等,不再为无客户而发愁!网站地图 网站导航

“排上来”是上海万词信息科技公司旗下运营的一个seo优化外包品牌,六年网站关键词优化经验,精通最新百度算法研究,优化的服务模式有单词优化、整站优化、精准长尾词霸屏服务。其中独立自主研发的万词排名工具,3-7天可达成千上万个关键词排名百度首页,关键词排名稳定安全,让企业获取搜索排名流量不在难!百度、360、搜狗等全搜索引擎24小时全网霸屏展现,排名不达标全额退款!目前排上来排名系统已经广泛应用于众多行业领域,服务客户数量、市场渠道数量不断增加,累计核心代理商数百家,覆盖全国上百十个省市。 我们的目标:让中国每一个城市都有我们的存在! 我们的愿景:让天下没有难做的生意! 我们的使命:为推广中小企业发展而存在!

联系我们

上海市金沙江西路1555弄35号楼502室

400-670-9770(服务时间:9:00-18:00)

1543559791@qq.com

申请试用 QQ咨询 微信咨询 电话咨询400-670-9770 返回顶部
返回顶部