从搜索引擎的分词算法浅谈做站关键字选择

在搜索引擎的输入处理中,中文字符串是由一个个含有各种词性的分词组成的,不同的词性在搜索引擎的算法里有着不同的优先级,极端的例子如“的”(助词),“我”(代词)这样的词和“谷粉搜搜”(名词)这样的名词的权重是完全不同的,搜索引擎会认为像“的”之类的助词在判断页面相关性的作用微小,在搜索结果的排序时候这类词通常不是作为主要的排序判断依据的,因此在选择页面关键词的时候,可以尽量选择以名词,英文字符串等权重明显偏高的分词为主的关键字。

在面对以制作一个有几百万高质量内容规模为目标的内容网站时,为了让搜索引擎能够更完整的收录,必须要进行非常多的分类和标签引导(翻页这种结构对收录非常不利),在这个时候,面对的往往是相当大规模的关键字数量,上述的选择思路将可以大大节约人力成本。

本文由谷粉搜搜博客(http://www.jwss.cn)的cjx原创,本人目前正在学习搜索引擎算法,记录一些微薄的个人心得,转载请注明出处 ,同时也欢迎到谷粉搜搜搜索各种资料。

7 条评论

发表评论

电子邮件地址不会被公开。

  • 匿名 2015 年 01 月 16 日 15:32 星期五 回复

    请问怎样在谷粉搜搜里实现主题rss订阅?

    • cjx 2015 年 01 月 16 日 15:32 星期五 回复

      我去研究下。。。

      • 匿名 2015 年 01 月 20 日 11:10 星期二 回复

        期待啊,实现了通知一声哦!

        • cjx 2015 年 01 月 20 日 11:11 星期二 回复

          博客右上方已经可以订阅了。

        • cjx 2015 年 01 月 20 日 15:26 星期二 回复

          通过QQ邮件列表的方式我发现不是很好用,暂时先去掉这个菜单栏目。

  • Etiers外贸自媒体 2015 年 01 月 17 日 11:54 星期六 回复

    太精辟了,这SEO人员很有帮助。。

  • 匿名 2015 年 02 月 03 日 01:22 星期二 回复

    呵呵(^_^)

从搜索引擎的分词算法浅谈做站关键字选择_GFSOSO_谷粉搜索_九尾搜搜GLGOO西南科技大学教务处|潍坊学院聊城