快捷导航


        我的论文要分析微博数据,针对当前的事件做量化分析。我看到人大新闻系公众号里面有篇文章《议题、情绪和话语》,他们使用了清博大数据。
        我想问这个网络图是怎么生成的?我有没有办法在自己的论文中也做这样的图?

        举报 使用道具
        | 回复

        共 16 个关于本帖的回复 最后回复于 2020-3-12 10:25

        沙发
        微舆情 高级会员 发表于 2020-3-11 16:19:56 | 只看该作者
        首先是源数据的准备吧: 确定要分析哪个时间段的微博数据, 然后用微博工具箱获取到这些数据
        举报 使用道具
        板凳
        发誓学好内容分析 中级会员 发表于 2020-3-11 16:22:40 | 只看该作者
        微舆情 发表于 2020-3-11 16:19
        首先是源数据的准备吧: 确定要分析哪个时间段的微博数据, 然后用微博工具箱获取到这些数据 ...

        这个我会了,我用集搜客微博亚洲杏吧工具箱的关键词搜索亚洲杏吧工具、话题广场亚洲杏吧工具、杏吧入口和转发亚洲杏吧工具、博主的微博亚洲杏吧工具,已经亚洲杏吧了很多数据,从1月初就开始亚洲杏吧了
        举报 使用道具
        地板
        ym 版主 发表于 2020-3-11 16:36:11 | 只看该作者
        本帖最后由 ym 于 2020-3-11 18:28 编辑

        要生成这个网络图,关键是要统计出词语两两共现次数的共词矩阵表,而集搜客有一系列配套的文本处理工具,按以下几个步骤来做就可以获得这个共词矩阵表。
        (1)获取微博数据,推荐用集搜客的微博工具来搜集数据
        (2)对微博的文本做处理,包括文本切词、选出高频词或特征词,这个用集搜客的分词和分析平台的分词选词功能就能满足
        (3)然后用集搜客的分词和分析平台的社会网络功能,启动共词匹配,不仅可以得到共词矩阵表,还可以直接生成网络图


        举报 使用道具
        5#
        微舆情 高级会员 发表于 2020-3-11 16:37:11 | 只看该作者
        数据准备好了, 下一步可以使用集搜客的分词工具: 新建一个分析任务, 把样本数据加载进去
        举报 使用道具
        6#
        微舆情 高级会员 发表于 2020-3-11 16:44:28 | 只看该作者
        ym 发表于 2020-3-11 16:36
        要生成这个网络图,关键是要统计出词语两两共现频数的共词矩阵表,而集搜客有一系列配套的文本处理工具,按 ...

        我看清博大数据的这个话题网络图的说明:取50个高频词,做出共现矩阵
        这一步如果是用集搜客分词工具来做, 第一步应该是先从词频统计里挑选出50个高频词。
        第二步,怎么只生成这50个高频词的共现矩阵?
        举报 使用道具
        7#
        Fuller 管理员 发表于 2020-3-11 16:48:43 | 只看该作者
        虽然用图看起来挺酷,但是我在论文中要准确得到每个词的中心度,以及按照中心度的排序,集搜客软件能帮我做这个工作吗?
        举报 使用道具
        8#
        lan_1985 高级会员 发表于 2020-3-11 18:07:25 | 只看该作者
        微舆情 发表于 2020-3-11 16:44
        我看清博大数据的这个话题网络图的说明:取50个高频词,做出共现矩阵
        这一步如果是用集搜客分词工具来做 ...

        我也在试着做这个图,选词这里有个疑问,如果我按顺序,整页选择是否合理。

        举报 使用道具
        9#
        ym 版主 发表于 2020-3-11 18:22:10 | 只看该作者
        Fuller 发表于 2020-3-11 16:48
        虽然用图看起来挺酷,但是我在论文中要准确得到每个词的中心度,以及按照中心度的排序,集搜客软件能帮我做 ...

        集搜客分词分析平台的网络图是一个无向图,中心度越大,词语的圆点就越大,把鼠标悬放在词语上面,就能看到该词的中心度数值。导出共词矩阵表,表里的词语是默认按中心度从大到小排列
        举报 使用道具
        10#
        Fuller 管理员 发表于 2020-3-11 18:23:58 | 只看该作者
        ym 发表于 2020-3-11 18:22
        集搜客分词分析平台的网络图是一个无向图,中心度越大,词语的圆点就越大,把鼠标悬放在词语上面,就能看 ...

        是的,能导出按照中心度排序的数据表很有用,就可以用数据做下一步的分析
        举报 使用道具
        您需要登录后才可以回帖 登录 | 立即注册

        精彩推荐

        • 关于食品安全的美国联邦法规文件的网络爬虫
        • 怎样更有效率地搜索互联网和整理知识—使用
        • 阿里巴巴外包询价网站用集搜客网络爬虫能采
        • 在限定论域的时候,为什么“任何一个”表示
        • 数理逻辑是讲什么的?

        热门用户

        GMT+8, 2020-3-23 01:33