
3.1 电影产业数据类型及特点
电影产业线上和线下不同终端,产业链不同环节每天都在产生不同类型的各种数据。数据类型按生命周期分,包括电影投融资数据、电影生产制作数据、电影宣发数据、电影放映数据及电影衍生品数据等;按数据生成形式可分为图片、语音、文字及视频等类型;按平台分可以分为互联网、电视端和手持终端的电影相关数据等;按数据特点,分为结构数据、非结构数据及半结构数据等;从应用角度,有来自视频网站、社交网络和搜索引擎的收看数据、媒体热议数据、搜索数据、社交网站提及数据、视频网站用户数据、在线购票数据及影院观众消费数据等。对电影产业相关数据进行梳理,可以为电影产业的数据汇聚和挖掘提供方向指导,本章对电影产业基础数据进行分类整理,在此基础上进行基础数据挖掘。
1.按电影生产周期划分
电影产业链各环节相关数据信息如图3.1所示,具体如下所述。
电影投融资相关数据:投资方、日期、投资事件、投资总额、回款周期、投资收益、融资方、金额及轮次等数据。
电影制作相关数据:电影制作数据包括电影设计和规划、出品、承制、顾问、制片人、剧本、剧本作者、导演、监制、编剧、片长、演员、场务、场记、场地管理、布景、灯光、造型、服装、化妆、道具、拍摄地点、摄影导演、艺术导演、分镜插画家、音效指导、音效设计、武术指导、特技人员、作曲、剪辑、配乐、配音、设计字幕、电影剪接、预告片、宣传及影片拷贝等数据。
电影宣传相关数据:软文宣传、社交宣传、视频宣传和话题宣传等相关数据。其中软文宣传包括新闻、论坛和点评数据;社交宣传包括微信、微博、贴吧、知乎和SNS等宣传数据;视频宣传包括影片花絮、发布会、宣传会、明星视频和视频首页推荐等数据;话题宣传包括演员海选、广告、明星探班、微博热搜和微博推荐等数据。
电影发行相关数据:发行商、发行渠道、发行海报、广告宣传、国际发行及参加电影节活动等数据。

图3.1 电影产业链各环节相关数据信息
电影放映相关数据:放映单位、排片、放映时间、场次、票房(日票房、周票房、累计票房等)及电影放映不同平台等相关数据。
电影衍生品相关数据:玩具、音像制品、图书、电子游戏、纪念品、邮票、服饰、海报及主题公园等数据。
2.按平台划分
不同平台电影相关数据如图3.2所示,具体如下所述。
互联网端:网站、影片名称、上映时间、上映地区、电影类型、片长、播放方式、发行公司、导演、编剧、演职员、剧情、预售票房、实时票房、今日票房、票房占比、累计票房、排片占比、上映天数、上座率、平均票价、场均人次、口碑、媒体关注度、网络关注度、获奖次数、评分、评分人数、影评(长影评、短影评)、想看人数、粉丝数、视频、图片、新闻、标签。
电视端:直播频道和点播频道的收视率、电视端电影播放信息、收视用户收视行为数据,包括收视率、收视人数、收视时长等基础指标信息以及到达率、忠诚度等派生数据信息。

图3.2 不同平台电影相关数据
手机端:APP、影片名称、播放量、热度、评分、上映时间、地区、时长、导演、主演、播放量、简介、看点、电影类型、花絮、预告片及评价等相关数据。
通过融资数据信息的汇聚对齐也可以解决中国金融领域和电影市场的信息不对称问题。通过电影投资数据计量分析,可以宏观指导和监测电影市场的结构;基于投资方信息和融资数据汇聚分类,为各投资方的综合实力、盈利模式等进行评估。
基于电影制作数据可以进行电影信息的标签标注,进而进行电影广域的画像和分类,使电影机构、电影人才和设备等实现最佳匹配,组建契合的制作班底。
基于电影营销数据的在线搜索、关注和评论等数据信息,基于数据挖掘、统计建模和机器学习等手段进行电影营销能力分析预测,可以为电影营销策略的制定提供智能决策。
基于电影放映终端的数据,可以进行影院排片的最优方案设计,电影票房预测并挖掘受众的喜好,指导后续类型电影的制作等。
基于不同终端的数据分析,可以系统评估电影各营销渠道,不同终端的用户群及喜好,扩大宣传、销售渠道以及电影的影响力等。
3.按数据类型划分
从大数据类型角度,数据可以分为结构数据、半结构数据、“准”结构数据和非结构数据,如图3.3所示。结构数据包括预定义数据类型、格式和结构的数据;半结构数据具有可识别的模式并可以解析的文本数据文件;“准”结构数据为不同平台和接口不一致的数据和格式的电影在线点击数据等,非结构数据包括文本、图像、视音频等数据。电影产业数据以结构数据以及非结构数据中的文本数据和视音频数据呈现为主。

图3.3 电影产业数据类型
结构数据:上映时间、片长、预售票房、实时票房、今日票房、票房占比、累计票房、排片占比、上映天数、上座率、平均票价、场均人次、口碑、媒体关注度、网络关注度、获奖次数、评分、评分人数、想看人数、粉丝数、热度等。
文本数据:网站、影片名称、上映地区、电影类型、播放方式、发行公司、导演、编剧、演职员、剧情、影评(长影评、短影评)、新闻、标签等。
音频数据:预告片、花絮等。