1引言
随着我国电影行业的蓬勃发展,目前已积累了大量的行业数据,使用大数据技术对这些数据进行有效地处理,将在电影投资、制作、营销、发行管理、票房分析、战略决策等多个方面找到有价值的应用,并有可能成为中国电影行业升级转型、可持续发展的一支新的驱动力量。
1.1大数据技术对未来社会发展将产生重大影响
2012年3月,奥巴马政府宣布美国将投资2亿美元启动 “大数据研究与开发计划”,以帮助解决国家在科学与工程、国家安全、社会治理中最紧迫的诸多挑战问题,大数据研究从此上升到美国国家发展战略层面。这是继1993年美国宣布 “信息高速公路”计划后的又一次重大科技发展部署。美国政府认为,大数据是 “未来的新石油”,将大数据研究上升为国家意志,对未来的科技与经济发展必将带来深远影响。大数据正在改变我们的生活以及我们理解世界的方式,成为新发明和新服务的源泉,将引发一场生活、工作与思维的大变革。它将变革公共卫生、变革商业、变革思维,它帮助我们分析预测以前我们不能掌握的问题。“十二五”规划中明确提出了 “两化融合”的目标,对大数据的发展进行了部署,鼓励广大企业广泛运用信息化的手段、信息消费的形式,推进行业的精细化管理,以取得更大经济效益。
2013年 《国务院关于促进信息消费扩大内需的若干意见》出台,物联网、云计算、大数据等新兴信息技术及应用被视为转型升级的重要支撑力量。全国信息技术标准化技术委员会已经开展了大数据标准化的需求分析、标准体系框架研究及相关标准研究制订工作,并向国际标准化组织提交了大数据研究提案,利用各种手段进行大数据前沿部署,支持关键技术产品的研发和产业化。
1.2大数据对电影行业的影响已经逐渐体现
2013年被称为 “大数据元年”,源于互联网领域的大数据概念在影视行业迅速升温。特别是美国Netflix公司运用大数据投拍的电视剧 《纸牌屋》大获市场成功,更使得全球影视界对大数据的运用刮目相看。我国电影行业已经拥有大量的数据,但行业整体工业化体系尚处于起步阶段,正确利用大数据将为行业带来重要的价值。近两年国内电影行业已涌现出多家基于电影大数据的市场分析、资讯、营销策划公司。在互联网对电影行业的加速影响下,这些公司所提供的服务已经在国内电影市场发挥了明显的作用。售票数据是电影行业核心数据之一,本文所介绍的系统充分利用售票数据,同时结合包括互联网在内的多种数据来源,旨在帮助企业、政府迅速准确把握市场,创造价值。
2系统概述
本系统基于大数据技术在电影行业制作、营销、管理、放映、监管等多个方面提供不同的应用点。
大数据具有量大、多样、多变的特征,基于高效的大数据智能处理算法和问题模型,在充分发掘电影大数据的商业和社会价值的基础上,建立起电影大数据分析决策系统。其中具有特色的是,系统设计实现了一个综合应用大数据智能处理技术的影院管理应用,从而将大数据应用于具体的票房预测、电影排产决策、影院排产预警等环节。
3系统设计
3.1系统架构
针对电影行业大数据分析的需求,本系统的架构图如上所示:大数据应用的关键是数据,本系统的数据来源包括影院售票系统、手机售票客户端、互联网售票、专业电影网站、网络社交媒体以及本系统自身等各种数据来源。通过对数据的存储、处理和分析,建立起大数据指标管理体系和数据资源管理体系,从而加速应用软件、数据和数据分析三者间的联动作用,有效地挖掘和利用大数据带来的价值。
3.2技术架构
系统所运用的大数据开发技术包括数据采集、数据预处理、数据存储及管理、数据分析及挖掘、数据展现和应用服务等方面。
“数据采集”主要是通过影院FTP方式定时获取影 院 票 房 数 据,互 联 网 数 据 的 抓 取 则 是 基 于Nutch开源框架运行的搜索引擎或专门开发的网络爬虫,爬取互联网中系统所需要的信息,并通过Chukwa技术展示、监控和分析已收集的数据。“数据预处理”环节通过Sqoop技术将Hadoop和关系型数据库中的数据相互转移。“数据存储”使用的是HDFS分布式文件系统,HDFS有着高容错性的特点,并且设计用来部署在低廉的硬件上。而且它提供高吞吐量来访问数据,适合处理超大数据集。“数据分析及挖掘”主要使用MapReduce、Hive、Ma-hout等开源技术进行分布式计算,对复杂的数据清洗、分析、挖掘等业务逻辑工作进行编程处理。“数据应用展示”主要使用Cognos数据可视化工具进行多维度数据展示,并自主开发基于Web的图形展示用户界面。
4系统主要功能和特点
4.1电影投资制作的评估
针对电影行业传统的制作、投资、营销等领域,大数据可以提供一种更深入的视角和洞察能力。相当于显微镜和放大镜,大数据可以为客户提供更多的信息,有助于帮助客户更好地决策。因此,大数据分析对剧本选择、主创阵容选择、拍摄和后期制作等电影创作环节都能够产生积极的影响,并提供有效的分析决策手段。本系统设计了电影投资制作评估功能,此功能不仅可以分析对比不同导演、演员以往所拍摄的影片票房,而且能够基于千万互联网用户的数据分析,结合影片目标观众的性别、年龄、区域分布等特征,判断目标观众对影片内容和人物主演的感兴趣程度,挖掘出目标观众所期望的导演和喜欢的演员。通过以上大数据分析,建立以指标为参数的数学模型,为电影制作方、投资公司提供准确、科学、能够量化的决策工具。
4.2电影票房的预测
2013年,谷歌公布了一份名为 《用谷歌搜索量化电影魔力》的白皮书,宣称利用其电影票房预测模型,能够提前一个月预测电影上映首周的票房收入,准确度高达94%。谷歌的票房预测模型主要是基于电影相关搜索量与票房收入之间的关联性建立回归模型,根据搜索次数的多少判断票房成败,次数越多意味着票房越有可能成功。本系统提供的票房预测模型,不但可以在影片上映前预测票房,而且能够充分利用售票数据,随着影片上映在影片公映期间做到票房的动态预测。通过国内历史票房数据、网站影片点击量、影片评分数据、网站影片的评论文本、搜索引擎影片搜索量、影片影人搜索指数、微博和微信中的话题活跃度等,预测新上映影片在国内的整体票房趋势。
4.3辅助影院智能排片
本系统能够根据影院自身特征、历史票房与排片数据、互联网影片相关数据等,对当前影片的具体排片数量以及场次规划给出最优化建议,做到影院或院线票房收益最大化,达到精细化管理的目的。
利用大数据技术,对影院特征进行学习,实现影院自动分类。同类影院的排片与票房数据可以相互参照,结合单位时间内的客流情况,建立面向影院的基于影片的推荐系统,给出黄金时段和电影日常场次编排的合理建议。
在数据分析的基础上,建立不同时段、不同影片类型的消费能力指数,给出各个时段场次价格的定价建议。根据影片场次占比、座位占比、票房占比、上映期间卖出速度和当天卖出速度,对已排影片场次的合理性进行分析,给出调整预警,指导影院经营管理者增加或减少某影片的场次,调整影片在不同影厅的安排。
4.4实现影片精准营销
本系统通过梳理网络社交媒体数据,衡量出人们对影片积极、消极或中性的观点信息。在获得人们对影片的看法、人气的变化以及舆情信息等数据的基础上,得出科学的预测结果,用于调整营销和广告策略。
电影营销包括两个方面,线下营销和线上营销。线下营销的目标主要是争取更多的影院排片场次,在影院提高观影人次。院线市场化经营、影院商业自主运营离不开最优化的影片选择和场次安排,排片率悬殊直接导致影片票房收入的巨大差异。本系统利用大数据分析,排除传统的经验、人情以及其他主观的因素,为排片提供决策支持。系统根据不同城市、不同区域、不同档次、不同社会热点、不同人群进行数据挖掘和分析,从而得到更加科学的影片选择和更具弹性与变化的排片场次,做出更加符合市场预期的放映结果,进而提高影院收入和整体票房的收入。
采取有针对性的社会化营销,才能发挥影片推广的最大作用。线上营销通过运用大数据分析,精准定位影片目标观众。通过对精准人群的精细化营销,将巨大网络流量引导至在线购票平台,可以实现大数量的电影票在线预售。根据观众的响应度动态调节影片票价,可以使票房收益与票房人次最优。也可以根据在线预售情况改变排片率,进而达到间接影响影院排片的目的。
4.5帮助电影票房的监管
目前我国电影市场监管机制还不够完善,票房“偷漏瞒报”现象仍较严重。当前监管的主要手段是靠监票公司的人海战术,需要监票人员在影院现场进行抽查或由观众进行举报。通过技术上升级完善售票系统及票房上报平台可以增强票房监管能力。
但在完善票房监管机制的同时,整合各种业务系统的数据,通过大数据分析也有助于遏制 “偷漏瞒报”。具体手段主要有以下两个方面:
1)结合售票系统和TMS系统发现非正常播放场次影院包场不上报、整场退票等违规操作,能够通过分析销售和放映数据来查出。
2)通过售票系统数据特征对双系统违规操作进行预警
影院使用双系统进行销售时,上报数据会使用其中的一套售票系统,数据为后补录的数据。通过对影院上报的影票销售数据进行特征分析,结合同区域同类型影院票房情况的相似性对比分析,建立双系统数据上报分类学习模型,自动判断影院是否具有双系统的违规操作迹象,为监管提供预警。
5结束语
除了以上介绍的五大功能特点外,大数据在电影行业其他领域或环节同样存在可能的应用点,如影院投资、发行管理、政策决策等。大数据在电影行业的应用需要我们不断地挖掘和创新。与此同时,企业与政府应努力做好行业内数据的共享,构建面向大数据产学研用的学术交流、技术合作与数据共享平台,推动大数据的行业应用。
当今,大数据技术炙手可热,我们应保持冷静的思维和理性的决策。大数据虽不是万能的,但大数据给予我们的特殊洞察力需要我们充分地利用。
我们正处于一个数据爆炸性增长的大数据时代,让我们一起做好准备,积极面对数据时代给电影行业带来的挑战和机遇。
参考文献
[1](英)迈尔-舍恩伯格,(英)库克耶.大数据时代 [M].盛杨燕,周涛.浙江:浙江人民出版社,2013.
[2][美]Anand Rajaraman, [美]Jeffrey David Ullman.大数据:互联网大规模数据挖掘与分布式处理 [M].王斌.北京:人民邮电出版社,2012.
[3]刘军.Hadoop大数据处理 [M].北京:人民邮电出版社,2013.[4]姚宏宇,田溯宁.云计算:大数据时代的系统工程 [M].北京:电子工业出版社,2013.