维度是说明数据,例如商品层次的维度和时间维度
指标是衡量数据的,例如销量、利润、销售额。
举例:

维度这里有时间维度和商品层次的维度“品类”和“商品”,而指标就是销售情况中的销售额、销量、利润。
201701010305
2020-10-30
首先你要确定要查看的对象是谁,其次确认你所需要做的报告的用途,在这些基础上从所需要的找到维度和指标(例如1维度:商品层次的维度额时间上的维度;指标:销量,利润,销售额等),然后分层级去做,从大类到小类(就是区分维度的,而且所选择的维度所能对应的和所需要的指标也不同)例如对于商品层次维度来讲,首先是不区分维度分析总的销售额和总利润,其次对于品类来讲可以对比销售总额、利润,最后区分商品的每月销量、销售额和商品在品类中的占比。
152****4798
2020-10-30
楼上大神回答的很好
小白回复:可以设想你自己是这个数据的提供方,你开了个店给别人看数据,你希望能看到些什么,得出什么结果。
152****4798
2020-10-29
了解业务,对于业务深入的了解,有助于更好的发现分析的维度,快速锁定问题和原因。
明确分析目的,切忌照搬其他的项目的分析内容,或者随意相信组合手上的分析模型算法。
多角度观察,多个视角观察数据,这样不仅可以对数据整体有个全面的了解,也有助于发现潜在的信息。
数据分析的动机无非来源于问题、欲求。每一个问题都是一种思路,每一种想要的结果都可以倒推分析的过程。找到业务的问题和欲求,分析也就有了目标。
建议你可以多看一些相关的分析案例及分析报告,多了解一些数据分析的方法论,利用数据分析的方法论来拆解需求
常用的数据分析方法论有
PEST:结合Politic(政治)分析,结合Econconnomic(经济)分析,结合Social(社会)分析,结合Technological(技术)分析
5W2H:Why(何因),What(何事),Who(何人),When(何时),Where(何地),How Much(何价),How(如何做)
逻辑树:问题,问题1,问题1第一方面,问题2第二方面;问题2,问题2第一方面,问题2第二方面。。。
4P:Product(产品),Price(价格),Place(渠道),Promotion(促销)
用户使用行为:用户认知产品,用户熟悉产品,用户试用产品,用户使用产品,用户忠实产品
了解了方法论之后,还需要学习具体的分析方法,如对比分析,结构分析,回归分析等

方法论是宏观指导,分析方法是具体的实施过程
152****4798
2020-10-29
全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。
CDA助教老师
2020-10-29
import pandas as pd
data1 = pd.read_excel(r"D:\1600757400_452096.xlsx")
result1=pd.DataFrame()
for i in range(1,12,2):
coli=data1.iloc[:,[0,i,i+1]]
coli.columns=["序号","日期","数字"]
result1=pd.concat([result1,coli],axis=0)
result1.sort_values(by=["序号","日期"],inplace=True)
result2=pd.DataFrame()
for i in range(1,10):
temp1=pd.DataFrame(result1[result1["序号"]==i]["日期"]).T
temp2=pd.DataFrame(result1[result1["序号"]==i]["数字"]).T
temp1.index=[i]
temp2.index=[i]
temp3=pd.concat([temp1,temp2],axis=1)
temp3.index=[i]
result2=pd.concat([result2,temp3],axis=0)上面代码的问题在于,你进行两个数据框纵向合并的时候,需要要让两个数据框的列名字,一一对应
你看下现在你的result2和temp3数据框如下

如果想正确合并,你需要修改下列名字
wangxishi
2020-10-29
File "C:\ProgramData\Anaconda3\lib\site-packages\pandas\core\internals\managers.py", line 350, in _verify_integrity
"tot_items: {1}".format(len(self.items), tot_items)
AssertionError: Number of manager items must equal union of block items
# manager items: 24, # tot_items: 156
wangxishi
2020-10-29
我把代码稍微改了下,为什么最后result2 concat报错呢
data1 = pd.read_excel(r"C:\Users\wxstt\Desktop\1600757400_452096.xlsx")
result1=pd.DataFrame()
for i in range(1,12,2):
coli=data1.iloc[:,[0,i,i+1]]
coli.columns=["序号","日期","数字"]
result1=pd.concat([result1,coli],axis=0)
result1.sort_values(by=["序号","日期"],inplace=True)
result2=pd.DataFrame()
for i in range(1,10):
temp1=pd.DataFrame(result1[result1["序号"]==i]["日期"]).T
temp2=pd.DataFrame(result1[result1["序号"]==i]["数字"]).T
temp1.index=[i]
temp2.index=[i]
temp3=pd.concat([temp1,temp2],axis=1)
temp3.index=[i]
result2=pd.concat([result2,temp3],axis=0)
wangxishi
2020-10-29