MMP现在学生做作业还能这样抄答案!?谈教育行业的数据应用

浏览: 436

作者:挖数  腾讯数据产品经理 & 段子手

个人微信公号:washu66


说说我最近了解的在线教育行业的大数据应用。

教育行业主要有2块数据:

1、题库数据:比如初高中阶段,大概有3000多个考点,而每个考点下面又有几百上千道例题,这样就构成了一个上亿条的例题数据库;

2、学情数据:简单地说,就是学生在每一个考点下面形成的个性化的强弱程度的评分,比如全国初高中学生大概有1亿人,这1亿人在3000多个考点下面又各自有自己的强弱评分,这样就构成了一个几千亿条的学情数据库。

如果构建了这2块数据并进行打通,对学生的成绩提高,及对学校教学资源分配效率的提高是巨大的。

过去,这2块数据是这样构建的:

1、题库数据:简单地说,就是各种辅导书、参考书、上课笔记等,这些纸质的书散落在各个地方,查看不方便,各种书之间的知识点也不能互相打通,同时你也无法把市面上所有书都买下来,题库数量有限;

2、学情数据:简单地说,就是考试,学生通过每个阶段的考试,获取自己的学情反馈,但考试获取的是一个总体的分数,无法精细到每个知识点反馈你的学习情况,同时考试的时间成本太高,没法天天进行,因此无法实时反馈你的学习情况,再者纸质的试卷难以保存,容易丢失更难以结构化地构建个性化的学情数据。

从以上可以看到,传统的数据构建方法,有非常大的提升空间。

因此最近2年在线教育的大数据应用,主要在于:

1、如何更高效地构建题库数据;

2、如何让用户更高效地获取题库数据和学情数据。

由此而萌生的创业公司,规模较大的有小猿搜题、作业帮、学霸君3家。

在第1点,如何更高效构建题库数据方面,3家都是通过

1、向出版社及民营教辅出版机构购买试卷和答案

2、用户上传

通过以上方式不断积累题目的同时,又通过人工或者智能匹配的方式,给题目挂上各种知识点、难易度、中高考真题、类型题、时间、区域等标签,形成一个庞大的,每道题都有各自多维标签的题库。

而在第2点,如何让用户更高效地获取题库数据和学情数据方面,3家主要通过让学生对着教辅书的题目拍照这个操作,让学生在几秒内,就能获取到该题目的答案、知识点,甚至是跟该题目相似的关联题目,而这就涉及到机器学习方面的技术,因为在识别学生上传的照片的过程中,需要对字符、公式等进行定位、切分,然后再对应地在题库里进行关联匹配。

打着拍照即得答案这个卖点,3家公司迅速圈得一批用户。

用户有了,接下来是如何盈利,这些公司主要有以下2个盈利方式

1.发展线上教育,卖课程

2. 卖打包的题库

势如破竹的发展,和清晰的盈利模式,也让这些公司能够轻易地开展融资:

2017年1月,学霸君宣布获得1亿美元C轮融资;


2017年5月,小猿搜题宣布获得1.2亿美元E轮融资;


2017年8月,作业帮宣布获得1.5亿美元C轮融资。

这种规模,跟2017年1月获得D轮1亿美元融资的知乎是相当的。

靠着开放二胎的风口,未来的互联网教育公司会越来越多,相信大数据在这个行业会有越来越多的应用场景。

=THE END=

关注我,了解数据分析的奥秘


一套SVIP课程,15选8,每套课程均价112知识付费的时代,一次旅游的钱便能收获8大全方位、多体系的课程

更有全场六折优惠课程,为你加油助力!

扫描下方二维码点击上面文字的蓝色字即可学习

SVIP.jpg

推荐 0
本文由 人工智能爱好者社区 创作,采用 知识共享署名-相同方式共享 3.0 中国大陆许可协议 进行许可。
转载、引用前需联系作者,并署名作者且注明文章出处。
本站文章版权归原作者及原出处所有 。内容为作者个人观点, 并不代表本站赞同其观点和对其真实性负责。本站是一个个人学习交流的平台,并不用于任何商业目的,如果有任何问题,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本站拥有对此声明的最终解释权。

0 个评论

要回复文章请先登录注册