数据分析与知识发现
    主页 > 期刊导读 >

电影大数据的多角度构建与可视化分析

研究中国用户电影数据,有助于窥探中国电影市场发展背后的规律,理解其来龙去脉,获知未来走向。如今互联网上中国用户的电影数据集缺失,缺少如MovieLens、Kaggle等独立机构完成长期收集电影数据工作,研究人员只能自行收集或下载来自国外的公共电影数据集,不具有本地属性。本文针对此问题,搭建了一个涵盖超过6万部电影基础信息、2000个用户信息、200万条评论信息及5万个影人信息的电影数据库,信息全部来源于国内互联网。并根据此数据库进行了可视化分析,从中提取出大量数据背后信息,多维度分析了电影在公映时间、观众分布、类别占比、各国市场情况的关系,从评论词云、文本情感角度挖掘单部电影呈现的规律。