资源介绍

        天据英眼 - 分词和分类检索平台

        • 导入文本数据,系统自动分词不用安装软件,直接在界面里导入文本数据,就会自动分词,得到词语列表和分词效果表;
        • 筛选词语,系统自动匹配原文本把词语列表按照词频大小排序,点击词语可以查看样本数据,筛选出有用的词,系统会自动把词语与原文本进行匹配,得到选词结果表和打标结果表;
        • 下载数据结果表完成前面两步后,就可以同时下载到选词结果表、打标结果表、分词效果表三张数据表。
        操作说明
        1. 登录进入系统,点击【新建任务】,导入要做分词处理或者是要分析的数据文件。


        2. 筛选词语,系统会把切出来的词语,按词频从大到小排序,勾选会用到的词语,具体选哪些词语要根据研究主题来定,每一页选完点击【确定】提交就会切换到下一页。


        3. 如果需要补充词语,可以直接点【添加词语】来补充,或者回到筛选词语那里勾选。


        4. 最后下载数据,前面的选词会与原数据进行匹配关联,最多可以下载到7张数据表。点击【下载】按钮,可以下载到切词表、分词效果表、选词结果表、打标结果表这4张表; 然后,还可以【下载匹配矩阵表】、【下载分词效果表】、导出分类数据。

        (1)切词表

        (2)分词效果表

        (3)选词结果表

        (4)打标结果表

        (5)匹配矩阵表

        (6)分词效果表

        (7)分类数据表

        应用举例
        一条条文本变成对应于每个特征词的矩阵,就能用量化计算对文本内容进行分析。例如,对消费者对手机使用体验的亚洲成人电影信息进行分词打标,得到这样一个矩阵


        针对这样的数据表,通过统计运算和数据挖掘运算,可以得出很多量化的结论。


        []

        用户亚洲成人电影

        评分:

        1. ym 2016-11-15 11:16

          欢迎大家试用体验,有问题都可以亚洲成人电影反馈

        2. shenzhenwan10 2016-11-15 11:19

          试下对微博亚洲成人电影分词打标

        3. 84479774 2016-11-20 09:17

          正在测试微博内容 期待中

        4. Fuller 2016-11-20 10:09

          新产品上线,有什么问题提出来大家一起讨论改进

        5. linteck 2016-12-23 10:57

          EXCEL文件是怎么生成的?

        广告
        V8.9 版权所有 © 2007-2019 GooSeeker 深圳市天据信息技术有限公司
        粤ICP备08108565号-1 粤公网安备44030502004363号