注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

风轻扬

活着就是为了追求幸福

 
 
 

日志

 
 
关于我

关注互联网应用架构、分布式与海量数据处理技术、云计算、数据库技术

网易考拉推荐

自动关键词提取  

2009-10-31 13:37:53|  分类: WEB应用 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
基于内容的文章推荐一般基于自动关键词提取实现的,如果能自动提取出一篇文章的关键词,那么最简单的,使用提取出的关键词做一下全文搜索就可以找出相关的文章。

自动关键词提取又称自动标引,50年前就有人研究了。目前比较实用的方法是甚于TF*IDF模型,具体的实现方式有很多种,但基本思想是一致的,如果一个词在一篇文章中经常出现,但在其它文章中不常出现,那么这个词就可能就是这篇文章的关键词。这很好理解。

自动关键词提取的效果据一般报道是80%左右(1,2),这不是指自动提取的关键词与人工标注的结果有80%的重合(如果提取5个关键词时,重合的一般只有1个),而是指人工判断自动关键词提取的结果时,认为其中80%是可以接受的。
  评论这张
 
阅读(1581)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017