启明办公

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 80|回复: 0

数据分析快速上手(Excel)——淘宝天猫婴儿产品销售情况 ...

[复制链接]

2

主题

7

帖子

11

积分

新手上路

Rank: 1

积分
11
发表于 2023-1-18 18:35:33 | 显示全部楼层 |阅读模式
一般来说,数据分析包括如下5个步骤:
1. 明确问题 ——2. 理解数据——3. 数据清洗——4. 数据分析或构建模型 ——5. 数据可视化
在第二关,前两步已完成,现在继续完成后面数据清洗和构建模型两个步骤,实现初步的数据分析。仍用以下数据集做练习:
数据名称:淘宝和天猫婴儿用品。数据来源:Baby Goods Info Data-数据集-阿里云天池
一、数据清洗

包括7步:
选择子集;列名重命名;删除重复值;缺失值处理;一致化处理;数据排序;异常值处理
1. 选择子集

隐藏用不到的字段(注意不是删除)
2. 列名重命名

原英文缩写列名,最好改为便于自己和读报告的人容易理解的名字


(由于B列-购买行为编号、E列-商品属性,在这里缺少明确解释,不好做进一步分析,暂且隐藏掉)
3. 删除重复值

表1购买商品信息和表2婴儿信息,通过数据-数据工具-删除重复值检验,并未发现完全重复的行
4. 缺失值处理

ctrl+G定位空值/确认每列非空单元格总数(右下角状态栏),并无缺失值
5. 一致化处理

对购买日期、出生日期通过分列方法实现日期格式的一致化处理



日期格式一致化

6. 数据排序

7. 异常值处理

个人认为3-7步在数据清洗时是在循环进行的。
通过对购买量一列数据筛选,发现有部分单笔订单量异常大的,后面准备就这部分异常值根据现有情况分析后,做删除处理。



结合数据透视表分析决定异常值去留:



去掉购买量大于10的

二、数据加工

主要有4大数据加工技巧:数据抽取;数据计算;数据分组;数据转换 这次主要用到前3个
1. 数据抽取

数据抽取有这样几种:字段分列;字段合并;字段匹配; 这里通过vlookup函数实现跨表的字段匹配,将表1的购买信息和表2婴儿信息通过[用户id]这一桥梁,搭建起联系(复习:数据库中通过SQL查询语句union指令实现多表关联合并)



摘自:谁说菜鸟不会数据分析[入门篇]

2. 数据计算

包括简单计算、函数计算(数值类的描述统计量、日期类) 年龄可以用:=iferror(IFNA(DATEDIF(H2,G2,"Y"),"未知"),"未出生") 涉及的函数:

  • DATEDIF(start_date,end_date,unit)——计算年龄
  • IFERROR——处理#NUM!计算异常值(如日期相减为负的时候)
  • IFNA——处理#N/A空值,上述是将单元格替换为“未知”



年龄计算,分组

3. 数据分组

针对年龄字段,先输入如下分组对应表,然后通过vlookup的近似匹配进行数据分组(上图最右列)



分组用到的对应表

三、数据分析或构建模型

解决某一类问题的方法都可以叫模型
数据透视表、分析工具库,后者用于对数值项做描述统计量的分析, 针对上一关提出的问题
这里主要用到透视表
1)你想从该数据集中分析哪些业务问题?
1、宝宝性别/年龄对于同一产品的需求比例对比;



男宝购买量略高于女宝





2、不同产品的销售量差异;


3、不同季节销售量走势;(再去找原因)



由于2015年2月只有5天数据,数据量太少,未避免干扰,这里不做考虑

——如果想提高过年期间销量,可能要再关注下线下销售推广渠道

4、同类产品不同属性销售量对比(属性含义不明,不做分析了)
2)你想从该数据集中得到哪些描述统计信息? 不同季节销量均值,不同产品的总销量均值;男女宝宝对应销量均值; (这些上述都已提及)
<hr/>

  • 过程中遇到的问题及解决办法:
1、[已解决]excel2010分析工具库无法运行“ FUNCRES.NLAM! Showatpdialog"”宏
2、[解决方案]Minitab免安装版要求系统具有可临写的文件目录
3、【已解决】excel实现只替换某一列/行的内容

  • 待解决的以及关于后续学习的想法:
1、对于数据透视表的操作熟悉程度、异常值的处理方式思考[增加理论、业务学习]
2、excel VBA的学习应用到清洗数据中会事半功倍
3、python在结合数据库、可视化工具的应用(案例参考:小呆学数据分析——异常值判定与处理(一))
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|天恒办公

Copyright © 2001-2013 Comsenz Inc.Template by Comsenz Inc.All Rights Reserved.

Powered by Discuz!X3.4

快速回复 返回顶部 返回列表