seo网站关键词分词技巧都有什么呢?

时间:2019-02-08 人气:151

  一个比较理论的网站SEO优化技术,那就是搜索引擎分词技术。说道搜索引擎分词技术,感觉挺高大上的,但是,细心的朋友都不陌生,当你在各大搜索引擎搜索的关键词的上海,搜索引擎都会自动把你想要的关键词相关网站,进行关键词划分,那么seo网站关键词分词技巧都有什么呢?

  中文分词一般为:字符串匹配、统计分词、词义分词。

  第一种:字符串匹配分词

  这种分词技术又称之为机械分词方法,直白说就是扫描字符串,查询页面中字符串的子串和词相同,则视为匹配,该类分词一般会加入启发式规则,例如:正向/逆向最大化匹配、长词优化等方法。

  优势:匹配速度快,实现过程简单

  劣势:难以区分歧义词,匹配不精准

  案例:庖丁解牛分词器就是基于字符串匹配的分词

  例子:成都网络推广公司

  “成都、成都网、推广、公司”“成都、推广网、公司”

  正向最大值匹配:把关键词从左到右进行匹配

  逆向最大值匹配:把关键词从右到左进行匹配

  最短路径分词法:搜索引擎提取文中词数最小值

1548749671870596.jpg

  第二种:统计分词

  这类分词基于人工标注的词性和统计特征,对中文进行建模,即根据观测到的数据(标注好的语料)对模型参数进行估计,即训练。 在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果。常见的序列标注模型有HMM和CRF。

  优点:很好处理歧义和未登录词问题,效果比基于字符串匹配效果好

  缺点:需要大量的人工标注数据,较慢的分词速度

  相邻的字同时出现的次数越多,就越有可能构成一个词。因此字与字相邻共现的频率或概率能够较好的反映成词的可信度。

  可以对语料中相邻共现的各个字的组合的频度进行统计,计算它们的互现信息。定义两个字的互现信息,计算两个汉字X、Y的相邻共现概率。互现信息体现了汉字之间结合关系的紧密程度。

  第三种:词义分词

  词义分词法:通过机器语音判定的分词方法,主要用以处理歧义现象。

  如果关键词过多也可以利用分词思维来布局更多的关键词,比如云南seo要做的关键词为SEO优化,石家庄SEO,网站SEO优化,作为专业的我们不可能反复去堆砌关键词,当然关于关键词的排序:越排在靠前的关键词越容易获得比较好的排名。


相关阅读