Step 1 界定业务问题 • What:用户的购买趋势是怎样的? a) 选择什么变量? 1. 购买行为:字段 type 中 order 的数目即为下单数量 2. 行为时间:字段 action_date,按连续的月份划分时间维度 b) 呈现怎样的数据关系? 呈现不同月份的订单数量变化趋势 c) 可以选择怎样的图表? 折线图 • Why:影响用户购买行为的因素都有哪些 a) 选择什么变量? 1. 购买行为:type 2. 影响因素可思考维度: a. 用户维度:年龄,性别,城市等维度 b. 商家维度:商家评分/粉丝数/商家类别等维度 c. 漏斗分析:从页面访问->存购物车->下单->关注,可以结合多者之间的转化关 系得出订单量和页面访问之间的转化关系 b) 呈现怎样的数据关系? 1. 比较关系 c) 可以选择怎样的图表? 饼图和环形图呈现用户的,年龄和性别组成,用直方图比较不同维度城市的购买行为 数量,用直线图比较商家评分和商家类型对购买行为的影响,用漏斗图刻画客户从浏览网 页到购买完成的转化率。 • How:京东的业务部门可以怎么做,提升订单量? a) 问题拆解 1. 京东的用户都由哪些群体组成?他们具有怎样的特征? 2. 如何识别出更容易产生购买行为的用户? 3. 什么样的类别的产品比较热门 b) 模型选择 聚类分析模型 c) 变量选择 1. 用户维度聚类 2. 店铺维度聚类 3. 店铺评分,VIP 会员数对销售额的回归预测 d) 模型建立与解读 1. 你会如何建立你的模型?关注什么输出的结果? 2. 使用 Tableau 进行模型建立,并尝试进行业务解读。 Step 2 数据收集与评估 数据收集已经完成,并且导入 tableau 进行分析 Step 3 数据整理与清洗 1.选择唯一的标识统计付费订单量,用 tableau 清洗数据发现,客户 id 和行为编码在 表中不唯一,因为一个客户可以有多个购买行为,一个行为可以包含多个客户,这是多对多的关系,所以计算付费定单量,要选择计数 type 字段,并且把 type 放到筛选器中,选 择 order 2.发现数据中有,不符合常理中的选项,如性别中有 u 这一项,店铺评分有-1 分,在使 用这些字段时,应该用筛选器把其的错误数据筛选掉。
|