透过日播放量超过6亿的《延禧攻略》,看2018视频网站格局

浏览: 2619

作者介绍:徐麟,目前就职于上海唯品会产品技术中心,哥大统计数据狗,从事数据挖掘&分析工作,喜欢用R&Python玩一些不一样的数据

个人公众号:数据森麟(ID:shujusenlin),知乎同名专栏作者。


前言:

随着《延禧攻略》的播出,魏璎珞、富察皇后等各位后宫小主的命运时刻牵动着各位观众的心。同时爱奇艺也因为该剧的大火,收获了单日超过6亿的播放量。我们此次将对比各大视频网站2018年截止到8月18号的电视剧和综艺节目的播放情况,大家可以据此选择购买会员的视频网站(壕er可以无视,直接购买所有会员)。

01

数据来源

猫眼APP提供了每日各大视频网站的播放量,截图如下:

我们通过Fiddler分析得到数据接口地址, 以优酷网8月11号电视剧播放量为例: 

http://maoyan.com/proseries/api/seriesTopRank.json?platformType=1&seriesType=0&dateRange=0&date=2018-08-11

其中platformType=1表示平台为优酷,SeriesType=0表示类型为电视剧,dateRange=0表示为数据日榜,最后的date则为具体日期,代码如下:

play_data = pd.DataFrame(columns=['date','name','play_num','type','platform','monopoly'])
for i in range(03):
    for j in range(0,7):
        for date in pd.date_range('2018-01-01','2018-08-18',freq='D'):
            try:
                time.sleep(0.5
                url= 'http://box.maoyan.com/proseries/api/seriesTopRank.json?platformType='+str(j)+'&seriesType='+str(i)+'&dateRange=0&date='+str(date)[0:10]
                html = requests.get(url=url, cookies=cookie, headers=header).content
                data = json.loads(html.decode('utf-8'))['data']['seriesDailyRankList']
                for item in data:
                    play_data = play_data.append({'date':str(date)[0:10],
                                                  'name':item['name'],
                                                  'play_num':float(item['playCountDesc']),
                                                  'type':i,
                                                  'platform':j,
                                                  'monopoly':item['platformInfoDescV2']},
                                                 ignore_index=True)
                print(str(i)+' '+str(j)+' '+str(date)[0:10])                 
            except:

02   整体播放量

通过猫眼接口我们可以获得各大视频网站每天TOP30电视剧、TOP30网剧(我们统一为电视剧)和TOP30综艺节目的日播放量,以此对比视频网站2018整体的播放量,我们用R语言的ggplot完成数据可视化的部分:

可以看到在猫眼提供的七个视频网站中,搜狐、乐视、PP视频占比非常小。我们在后面的内容中将重点对比腾讯、优酷、爱奇艺和芒果四大视频网站。首先看一下整体播放量:


下面看一下剧集和综艺分别的播放量:

可以看到无论是剧集还是综艺,2018年迄今为止腾讯视频都处于领先地位。芒果视频在剧集的播放量相较于其他网站,播放量偏低,但在综艺方面已经超过了优酷,与爱奇艺基本持平。

03

月度播放量

在前言中我们提到了《延禧攻略》最近大火,我们通过月度数据看一下其近期是否带动了爱奇艺整体的电视剧播放量份额:

可以看到在1-7月电视剧播放量一直落后于腾讯,大部分时间落后优酷的爱奇艺在8月通过《延禧攻略》的播出实现了反超,由于同类型的《如懿传》已经定档在腾讯播出,爱奇艺能否继续保持优势也值得期待。

我们同时看一下综艺的月度数据:

腾讯从4月份开始,随着《创造101》等节目的播出,在综艺节目的播放量上遥遥领先于其他的视频网站,下半年能够延续该势头与其能否继续找到有爆点的节目息息相关。

04

独播数据

独播视频一直以来都是视频网站最为重要的资源,我们首先看一下整体独播占比随月度变化情况:

综艺节目的独播占比要高于电视剧,这与视频网站大力投入到自制节目有关,也使得喜爱综艺节目的用户对于网站会员的需求变大。同时可以看到6月以来的独播占比开始持续增加,都已经超过50%,这或许也将成为未来视频网站的一大趋势。

下面看一下各大网站分别的独播占比情况:

各大网站6月以来的独播占比都在显著提高,优酷的综艺节目独播占比基本上超过了9成。芒果随着新版《流星花园》的播出,独播占比也在快速提升,未来可能也会在电视剧播放量占到更高份额。

05

剧集对比

首先我们看一下平均日播放量(我们选取每个电视剧最高的五天进行评价)TOP25的对比及网站分布

《延禧攻略》在爱奇艺单个平台的单日平均播放量已经超过了除《恋爱先生》和《谈判官》外所有多平台播放的电视剧,并且与上述两部多平台总体剧集也十分接近。我们也更加深刻地理解了选取剧集对于视频网站的整体影响。

我们同时选出所有的独播剧集,对比独播剧集TOP25:

从数量上对比,优酷和腾讯处于明显的领先地位,并且都有爆款电视剧。而爱奇艺的《延禧攻略》和芒果的《流星花园》排名靠前,也相应提高了其在电视剧播放量上的份额,或许这也会促使这两个网站加大独播剧集的占比。

最后看一下综艺的情况:

显然腾讯在综艺节目方面处于明显的领先地位,无论是整体播放量还是独播资源播放量和数量都领先于其他的竞争对手。整体的发展趋势未来或许会促使更多的《创造101》诞生。

由于可视化代码比较多,而且重复性比较强,我们选取其中的独播剧集绘制部分语句来进行展示:

##绘制TOP25独播剧集数据

drama_agg_mon <- ddply(drama_stat_mon,.(name,monopoly,type),summarise,
                   total_play=sum(play_num))
drama_agg_mon <- drama_agg_mon[order(drama_agg_mon$total_play,decreasing = T),][1:25,]
drama_agg_mon$rank <- 1:25
drama_top_mon <- merge(drama_stat_mon,drama_agg_mon,all.x = FALSE,all.y = TRUE,by=c('name'))
ggplot(drama_top_mon,aes(x=reorder(name,-rank),y=play_num,fill=platform))+
  geom_bar(stat='identity',position = 'stack')+ggtitle('TOP25独播电视剧平均日播放量(亿)')+
  theme_wsj()+coord_flip()+
  scale_fill_wsj()+
  theme(legend.position = 'top',
        legend.title = element_blank(),
        legend.text = element_text(size = 25),
        panel.grid = element_blank(),
        axis.text.x = element_text(size=15),
        axis.text.y = element_text(size=20),
        strip.text.x = element_text(size=20),
        strip.text.y = element_text(size=20,angle = 0),
        plot.title = element_text(size=25,hjust=0.5))



往期回顾:

卫视实时收视率对比 | R爬虫&可视化第1季

当古代文人参加“中国好诗人”节目 | R爬虫&可视化第2季

同花顺股票分数可视化 | R爬虫&可视化第3季

近三十年6000部国产电视剧告诉了我们些什么 | R爬虫&可视化第四季

R爬虫&可视化第五季-图解欧洲足球五大联赛

爬虫告诉你, 互联网大数据行业有多赚钱!

公众号后台回复关键字即可学习

回复 爬虫            爬虫三大案例实战  
回复 Python       1小时破冰入门

回复 数据挖掘     R语言入门及数据挖掘
回复 人工智能     三个月入门人工智能
回复 数据分析师  数据分析师成长之路 
回复 机器学习      机器学习的商业应用
回复 数据科学      数据科学实战
回复 常用算法      常用数据挖掘算法

推荐 0
本文由 R语言中文社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册