当前位置: 产品

中文信息处理是对中文信息定向采集、分词、网页净化、结构化数据抽取、文本分类等中文内容进行处理的总称。

 

它主要有如下功能特点:

 

1、 能够根据指定的关键词集进行某方面内容、某些网站的定向采集,并能对采集的网站内容根据定义的分类自动进行分类与排重;

2、 能够根据定义的内容抽取规则进行某一类文本的内容抽取,并按定义的格式进行内容输出;

3、 文本内容过滤,能对文本内容进行分析,有效过滤广告、不良信息;

4、 内容推荐,根据用户查看的内容,自动查找相关或类似的内容推荐给用户,增强内容对用户的粘度。