电话:13161612018(同微信)
微信
咨询
电话:13161612018(同微信)

关键词主要分类有哪些?

点击量: 553 2021-03-02 13:18:30


关键词主要分类有三种:核袭心关键词、拓展关键词。

关键词源于英文“keywords”,特指单个媒体在制作使用索引时,所用到的词汇。是图书馆学中的词汇。关键词搜索是网络搜索索引主要方法之一,就是访问者希望了解的产品、服务和公司等的具体名称用语。

①核心关键词就是网站的主题,整个网站是做什么的,也就是网站的核心思想是什么,然后概括成几个关键词的形式。例如一个做网站优化服务的网站,那么核心关键词可以有“网站优化”“网站seo”“网站推广”等,选取1个(最好是1个,但是别超过3个)。再比如肥料厂的核心关键词选择,可以有“肥料”“化肥”“肥料公司”“肥料供应”等,也是选取1个作为网站的核心关键词。

②拓展关键词是相对核心关键词而言的,除了核心关键词外的关键词都叫拓展关键词。虽然不是网站的核心主题,但是也与这个主题非常有关,通过核心关键词而拓展出来的相关关键词,通常不放在首页。

③目标关键词和长尾关键词不能列入分类中,他们只是一些相对的概念,他们既可以是核心关键词也可以是拓展关键词。

如何实现关键词的自动分类

如何实现关键词的自动分类

分类一直是一件比较痛苦的事,特别是当关键词的规模很大的时候,人工分类往往要做好久。

曾经写过一篇基于情感分析算法的评论分类处理,其实机器化进行语义分析还是具有可操作的,当然,人工干预是最好的,最为精准的,但是在此之前,我们可以先进行机器的预处理,以减少人工的工作效率。

对关键词进行自动分类,要有一个基础词库表,词库表里要有个分组字段,作为每个词根的分组。

还有建立一个关键词的分组表,分组表是建立在基础词表上的。

这个分组才是指未来进行长尾或文章进行分组的主表,组ID代表着基表里词根的分组ID的集合。

接下来就可以进行自动分组了,比如一个长尾词:tomtomgpsnavi,首先进行分词,根据词库,应该被分成tomtom|gps|navi三个词(备注:tomtom是一个品牌,在自有词库里认为是一个词,如果是普通词库,则可能被分成两个tom,不用纠结)。

然后在词库表中匹对,发现在分组1中出现了1个次,在分组2中全部出现,这时候,我们将词库的项数做为DF,讲匹配的次数当作TF,则根据TF/IDF的计算,则分组1的TF/IDF=1*1/3<分组2的TF/IDF等于3*1/7,那么这个词被分在了分组2里。

如果这个分组我们分的足够细,那么对于这个分组表,我们还可以建立第三层的聚合表,将分组再进行一次聚合,实现非垂直内容的聚合,这个在做相关性内容的获取和内链分配时是有一定的作用的。

那么说了后面实现的方法,这个基库和分组的库该如何建立呢?

首先,你需要采集关键词,从google或,好处是,当你拉回来的时候,这些词本身相关性是比较强的,你要做的就是进行分词,分词是分两步工作,一个是找词,一个是统计词频,找词分词的思路是这样的,先把所有词组合起来,采用正向最小逐步的切分,这个词的长度阈值你可以根据行业特性自己设置,从最小的词开始匹配,统计词频,然后逐步增加词数,比如一共个词,任何的切分的词如果词频统计超出70%(阈值),我们认为是有这个词的,然后逐步增加,如果少于30%,则认为没有这个词,经过循环处理下来,得出的高频词,进行去重,就是我们所需要的基础词库。

有了基础的词库就要进行分组,分组就是就要统计之前采集的每个长尾词在词库里的同时命中的了,将大量同时命中多个长尾词的词根统计出来,这些词根基本具有一个分组,思路如同上面的自动分组是一样的,只是做基础词库的分组,还是需要一定的人工干预,才能确保数据的准确性。


首页 电话