《用户订阅转化率跟踪与数据分析:实战案例解析》难度:Easy - Free communications icons语言:Mysql - Free computer icons预计用时:2小时

《用户订阅转化率跟踪与数据分析:实战案例解析》

Marketing Analysis Isolated 3d Conversion Funnel For On White Background  Backgrounds | JPG Free Download - Pikbest

案例描述

通过分析平台上观看视频的学生中,有多少人在开始观看课程后最终购买了订阅,即免费转付费的转化率。

数据包括学生注册日期、参与日期以及购买订阅的日期。

通过这个项目,你将深入了解学生行为模式,并为公司提供有价值的洞察和建议。

项目要求

项目目标

7d170147ac38fb3892c7cb65038af9c9.png

  1. 在平台上观看了讲座的学生的免费转付费转化率是多少?

  2. 注册日期和学生首次观看讲座的日期(首次参与日期)之间的平均间隔时间是多少?

  3. 首次观看讲座的日期和学生首次购买订阅的日期之间的平均间隔时间是多少?

  4. 我们如何解释这些结果,它们的含义是什么?

第一步:子查询

导入db_course_conversions数据库

然后,创建一个新的结果数据集,包括以下列:

提示:研究MySQL中的DATEDIFF函数。

注意以下的Venn图

e2d1384152d2c3f48a095bcb06bfbe76.png

你检索到的结果集应该包括进入图中阴影区域的学生ID。此外,你的目标是确定已观看过讲座的学生的转化率。

因此,过滤你的结果集,使得首次参与讲座日期早于(或等于)首次购买日期

检查:结果集中的记录数应为20,255。

首先,记得导入db_course_conversions数据库,并刷新。使用USE关键字将命名数据库用作默认(当前)数据库。

  1. 使用MIN聚合函数找到首次参与和购买日期。

  2. 应用DATEDIFF函数查看各自天数的差异。

  1. 考虑如何将三个表格连接起来,检索出Venn图中突出显示的记录

  1. 应用MIN聚合函数需要适当地对结果进行分组

  1. 过滤数据(having)

    1. 记得保留从未购买过的学生

    2. 排除首次参与日期晚于首次购买日期的记录

总结


第二步:主查询

应该使用你创建的子查询,计算以下三个指标:

  1. 免费转付费转化率:计算已观看过讲座的学生中购买了订阅的比例。

  2. 平均注册后首次观看时间:计算学生注册后首次观看讲座的平均时间。

  3. 平均观看后首次购买时间:计算学生首次观看讲座后首次购买订阅的平均时间。

  4. 免费转付费转化率

    • 这个指标衡量了在平台上观看讲座的学生中,选择购买订阅以获得完整课程访问权限的比例。它通过以下比率计算:

      • 购买订阅日期与观看讲座日期相同或之后的学生人数。

      • 所有观看讲座的学生人数。

    • 将结果转换为百分比,并将字段命名为conversion_rate

  5. 注册后首次参与的平均持续时间

    • 这个指标衡量了注册日期和首次参与日期之间的平均持续时间。它告诉我们学生注册后平均多长时间才会观看讲座。该指标通过以下比率计算:

      • 所有这些持续时间的总和。

      • 这些持续时间的数量,或者更简单地说,观看了讲座的学生数量。

    • 将字段命名为av_reg_watch

  6. 首次参与后首次购买的平均持续时间

    • 这个指标衡量了个人在观看讲座后订阅平台的平均时间。它通过以下比率计算:

      • 所有这些持续时间的总和。

      • 这些持续时间的数量,或者更简单地说,已经购买了订阅的学生数量。

    • 将字段命名为av_watch_purch

这些指标帮助我们了解学生在平台上的行为模式,并可以指导我们在吸引学生、提高转化率以及改善用户体验方面采取何种措施。

任务:将你在前一部分(创建子查询)中创建的子查询用括号括起来,并给它一个别名,比如a。 (当然你可以使用cte)

计算刚刚描述的三个指标。结果四舍五入到两位小数,不要忘记将conversion_rate指标转换为百分比


你现在应该已经检索到了已开始观看讲座的学生的免费转付费转化率,注册日期和首次参与日期之间的平均持续时间,以及首次参与日期和首次购买日期之间的平均持续时间~

第三步:数据洞察

当我们谈论免费转付费转化率时,我们其实是在说有多少人在观看了课程后决定花钱购买订阅。这个比例告诉我们有多少人愿意为全面课程访问付费。我们可以把这个数字拿去跟行业标准或历史数据做比较,看看我们的表现如何。

然后,我们看到了注册后多久学生第一次观看课程。

最后,我们观察到学生在观看了课程后多久才决定购买订阅。

我们可以使用Python等工具计算了一些额外的指标,比如中位数和众数,帮助我们更好地理解数据的分布情况,以及其中可能存在的模式或异常值。

免费转付费转化率指标

免费转付费转化率注册后首次参与的平均持续时间首次参与后首次购买的平均持续时间
11.29%3.4226.25

从观看讲座的学生中购买月度、季度或年度订阅的比例约为11%

也就是说,对于每100个来到平台的学生,大约有11个会购买订阅。乍一看,这个数字似乎相对较低,但让我们深入挖掘一下。

很多人只是出于好奇而注册了我们的平台,但大部分人却没有真正利用我们的计划。其中一个原因可能是我们的目标用户群比较广泛,而不是专门针对那些渴望开始数据科学之旅的人。

其次,因为我们的平台是为初学者设计的,所以学生可能不清楚应该从哪里开始学习。他们可能会纠结于应该先学习哪种编程语言,比如Python,还是应该学习查询语言,比如SQL,或者是学习数据可视化软件,比如Tableau?

而且每种工具学起来是否存在前置依赖呢?我们应该通过一个合理的学习顺序来简化学生的学习路径,为每个学生创建一个个性化的学习计划,这样他们就可以清楚地知道从哪里开始学习以及如何继续学习。尽管如此,一些用户可能需要更多的时间才能开始他们的数据科学之旅。他们可能是刚开始考试的大学生,或者是不能花太多时间在学习上的职场人士。

最后,我们必须考虑到一些用户可能不喜欢我们的平台,而选择在其他地方开始他们的数据科学学习之旅。无论原因是什么,与用户沟通是非常重要的,找出任何问题并努力改进我们的产品。

注册后首次参与的平均持续时间

免费转付费转化率注册后首次参与的平均持续时间首次参与后首次购买的平均持续时间
11.29%3.4226.25

第二个指标的结果显示,平均而言,学生在注册平台后大约需要三到四天才开始观看课程。

理想情况下,一个新学生应该在第一天就开始观看课程。平台提供的其他内容(考试、项目、职业发展路径)需要更多关注,而课程却是很容易了解的。因此,值得进一步深入分析这个结果。

但是平均值很有可能受到异常值影响,这是因为平均值是所有数据点的总和除以数据点的数量,而异常值通常是远离数据集其他值的极端值。当存在异常值时,它们的值会显著影响总和,从而导致平均值偏离数据集的大部分。

举例来说,考虑一个小班级的学生年龄数据集:

学生年龄:18,19,20,21,22,23,24,25,45

在这个数据集中,大多数学生的年龄都集中在18到25岁之间,除了一个异常值45岁。如果计算这个数据集的平均年龄,将所有年龄相加并除以学生人数:

平均年龄=(18+19+20+21+22+23+24+25+45)/9=23

但是,由于异常值45岁的存在,平均年龄被推高到了23岁,而这并不代表大多数学生的真实年龄。因此,异常值会使平均值失真,不再反映数据集的中心趋势。

这就是为什么在分析数据时,除了平均值,还要考虑中位数和众数等指标,以更全面地理解数据的分布情况。

中位数告诉我们数据集中间的数字是什么——假设它是有序的,而众数是数据集中出现频率最高的数字。在SQL中计算这些并不像直观,所以可以用Python

当然用MySQL计算也不是不行(咱们刷题里面有这个计算中位数的题)

结果如下:

数据中重复出现最多的数字是0。此外,数据集中位数也是0。这样的指标值表明数据呈右偏态——即,我们可以在数据分布的右侧找到异常值,朝着更高的值。这意味着数据集中一些学生注册了平台,但是很晚才开始观看课程。为了更深入地了解情况,让我们也直观地研究一下数字的分布。

c7f919ae16952c14f3e9afcaefb77b3b.png

几乎所有的学生都在注册后立即观看了一堂讲座。很少有人在注册后几天甚至一年后才返回平台开始课程。返回的原因可能是因为营销活动、免费试用活动等。

首次参与后首次购买的平均持续时间

免费转付费转化率注册后首次参与的平均持续时间首次参与后首次购买的平均持续时间
11.29%3.4226.25

平均而言,学生在熟悉产品后大约需要26天才能购买订阅。再次强调,我们应该对这个结果持保留态度,并研究其他相关的指标:中位数和众数。例如,使用Python,我们可以计算出这三个指标,结果如下:

平均值明显高于其他两个指标。这表明在这个数据集中存在更极端的异常值

最常出现的值再次是0,因此购买订阅的学生往往在同一天购买。而在数据集的中位数是1,这意味着在第一次购买的所有用户中,购买当天的人数不到一半。更具体地说,大约有49%的人在第一次观看讲座后的当天购买~

c0842fbd6a0d3b2c7794d4340e82ca5b.png

再次观察到数据向右倾斜,这一点我们可以从众数小于中位数,而中位数又小于平均数这个事实推断出来。

大多数用户在观看讲座后的一两天内购买了订阅。然而,也有一些人几个月后才购买。一个可能的原因是,他们喜欢平台上的内容,但一直在等待价格下调。

其他分析视角

我们可以继续研究数据集中的其他方面,以深入了解用户行为和平台表现。比如,可以进行用户留存分析、内容参与度分析、订阅计划分析、用户分群分析、漏斗分析、预测建模和A/B测试等。

(1)注册人数最多的前3个月份以及对应的注册数

答案:

c3ba166043b73e8f62b1ce50c823499d.png

(2)每周的每一天(星期一到星期日)的注册人数分布

答案:

7aef8f27c30901e507aae25020d5f654.png

(3)每个月的注册累积数和增长速率

答案:

cff09bb4b8690d158a6eb672630a50e9.png

(4)创建一个透视表来分析每个月份

答案:

3c50ec35b8ea0dd74e50eef1082f9135.png

(5)计算注册后当天、1-7天、7-30天和30天以上的观看比例

答案:

11e54c817c19007ac22e8fc26e303d6a.png

(6)计算观看后当天、1-7天、7-30天和30天以上的付费转化比例

答案:

aa3298622f23cd742a095b37d35906d2.png

更具体地说,大约有49%的人在第一次观看讲座后的当天购买~ 跟前面的分析结果一致

(7)每个月转化的累积数和增长速率

答案:

8ead724e71ad6deebd5dfb0feea633c5.png