liting李

能说说好的数据指标特征有哪些?

一个好的数据指标应该要符合下面的几个特征:1、准确性。这是最根本的一条原则。这个准确有二个层面的意思,一个是数据指标在技术实现过程中,是准确的,不会出现代码逻辑写错,源数据取错。二个统计源数据的源头的数据是对的,如果统计数据指标的基础数据都是错了,那就更666了!一个公司数据收集与记录的准确、完整也一定是一个持续迭代的工程,当然这属于哪一个话题,有空再论。2、有效性。数据指标的能真实反映要能衡量相

liting李

41分钟前

0.0000 0 0
  • 关注作者
  • 收藏

数据分析中经常提到的维度和指标有什么区别?

维度一般指事物现象的某种特征。从某种角度出发的度量统计,角度即为维度。指标一般指可以量化的数据,是进行统计后的结果。指标用于衡量事物发展程度,维度用于对指标多方面的进行对比,找趋势等等。在数据分析中,例如,各产品的销售额,销售额即为指标,‘产品’即为维度;各区域利润排名前三的产品,‘区域’和‘产品’即为维度,利润即为指标。当然维度不一定都是‘文本’类呈现的,维度分为定性维度和定量维度。‘文本’类维

liting李

43分钟前

0.0000 0 0
  • 关注作者
  • 收藏

dau、mau、pcu、dnu、wau、acu、uv的意思是什么?

DAU(Daily Active User)日活跃用户数量。常用于反映网站、互联网应用或网络游戏的运营情况。  MAU(monthly active users)月活跃用户人数。是在线游戏的一个用户数量统计名词,数量越大意味着玩这款游戏的人越多。  PCU(Peak concurrent users )最高同时在线玩家人数。  DNU日新增用户  WAU是周活跃用户数量  ACU (Average

liting李

1天前

0.0000 0 0
  • 关注作者
  • 收藏

dax函数-WEEKDAY如果一周第一天是星期一,需要怎么设置呢

首先来看WEEKDAY函数,返回指示日期属于星期几的数字,1 到 7 之间的数字。 默认情况下,日期范围是 1(星期日)到 7(星期六)。语法:WEEKDAY(, ) date 采用日期/时间格式的日期。应该使用 DATE 函数、计算结果为日期的表达式或其他公式的结果来输入日期。return_type 用于确定返回值的数字:返回类型:1,周从星期日 (1)

liting李

2天前

0.0000 0 0
  • 关注作者
  • 收藏

如何在sql语句中查询只带数字的字段

提取的字段只要含有数字就提出,剔除空和不含数字的字符串。select * from table where regexp_substr(check,'[0-9]+') is not null

liting李

2天前

0.0000 0 0
  • 关注作者
  • 收藏

横截面数据、时间序列数据和面板数据的区分

横截面数据是在同一时间,不同统计单位相同统计指标组成的数据列。横截面数据不要求统计对象及其范围相同,但要求统计的时间相同。也就是说必须是同一时间截面上的数据。例如,为了研究某一行业各个企业的产出与投入的关系,我们需要关于同一时间截面上各个企业的产出Q和劳动L、资本投入K的横截面数据。这些数据的统计对象显然是不同的,因为是不同企业的数据。但是关于产出Q和投入L、K的解释、统计口径和计算方法仍然要求相

liting李

3天前

0.0000 0 0
  • 关注作者
  • 收藏

mysql怎么进行行列转置

原表:怎么行列进行转换像下图这样呢?答:用case when函数select username '姓名', MAX(case course when '语文' then score else 0 end) '语文', MAX(case course when '数学' then score else 0 end) '数学', MAX(case course wh

liting李

1周前

137.2400 2 0
  • 关注作者
  • 收藏

MySQL中 DATE_SUB() 函数怎么用?

定义和用法DATE_SUB() 函数从日期减去指定的时间间隔。语法DATE_SUB(date,INTERVAL expr type)date 参数是合法的日期表达式。expr 参数是您希望添加的时间间隔。type 参数可以是下列值:Type 值MICROSECONDSECONDMINUTEHOURDAYWEEKMONTHQUARTERYEARSECOND_MICROSECONDMINUTE_MIC

liting李

1周前

137.2400 2 0
  • 关注作者
  • 收藏

MySQL 里的 DATE_FORMAT() 和 str_to_date()有什么区别

定义和用法DATE_FORMAT() 函数用于以不同的格式显示日期/时间数据。语法DATE_FORMAT(date,format)date 参数是合法的日期。format 规定日期/时间的输出格式。可以使用的格式有:格式描述%a缩写星期名%b缩写月名%c月,数值%D带有英文前缀的月中的天%d月的天,数值(00-31)%e月的天,数值(0-31)%f微秒%H小时 (00-23)%h小时 (01-12

liting李

1周前

137.2400 2 0
  • 关注作者
  • 收藏

MYSQL中str_to_date函数的用法

str_to_date函数将str转化为日期型的数据,format表示转化后的格式。format参数格式:常用:%Y 年%m 月%d 日%H 小时%i 分%s 秒大全:%a 缩写星期名%b 缩写月名%c 月,数值%D 带有英文前缀的月中的天%d 月的天,数值(00-31)%e 月的天,数值(0-31)%f 微秒%H 小时 (00-23)%h 小时 (01-12)%I 小时 (01-12

liting李

1周前

137.2400 2 0
  • 关注作者
  • 收藏

特征选择中什么是过滤式?

滤式方法先对数据集进行特征选择,然后再训练学习器。特征选择过程与后续学习器无关,这相当于先对初始特征进行“过滤”,再用过滤后的特征训练模型。过滤式选择的方法有:  1. 移除低方差的特征;  2. 相关系数排序,分别计算每个特征与输出值之间的相关系数,设定一个阈值,选择相关系数大于阈值的部分特征;  3. 利用假设检验得到特征与输出值之间的相关性,方法有比如卡方检验、t检验、F检验等。  4. 互

liting李

1周前

131.6067 1 0
  • 关注作者
  • 收藏

python如何求加权平均值的方法

#需要求加权平均值的数据列表elements = []#对应的权值列表weights = []使用numpy直接求:import numpy as np np.average(elements, weights=weights)附纯python写法:# 不使用numpy写法1round(sum([elements[i]*weights[i] for i in range(n)])/sum(weig

liting李

1周前

239.7347 1 0
  • 关注作者
  • 收藏

python如何求加权平均值的方法

#需要求加权平均值的数据列表elements = []#对应的权值列表weights = []使用numpy直接求:import numpy as np np.average(elements, weights=weights)附纯python写法:# 不使用numpy写法1round(sum([elements[i]*weights[i] for i in range(n)])/sum(weig

liting李

1周前

239.7347 1 0
  • 关注作者
  • 收藏

MySQL数据类型--日期和时间类型

日期和时间类型是为了方便在数据库中存储日期和时间而设计的。MySQL中有多种表示日期和时间的数据类型。其中,year类型表示时间,date类型表示日期,time类型表示时间,datetime和timestamp表示日期和时间。实际情况,最后2种使用的比较多。具体的日期和时间类型如下:关于上图的解释:1,每种日期和时间类型都有一个有效范围。如果插入的值超过了这个范围,系统就会报错,并将0值插入到数据

liting李

2周前

239.7347 1 0
  • 关注作者
  • 收藏

训练集、测试集、验证集有什么区别?

训练集(train set) —— 用于模型拟合的数据样本。验证集(development set)—— 是模型训练过程中单独留出的样本集,它可以用于调整模型的超参数和用于对模型的能力进行初步评估。在神经网络中, 我们用验证数据集去寻找最优的网络深度(number of hidden layers),或者决定反向传播算法的停止点或者在神经网络中选择隐藏层神经元的数量;在普通的机器学习中常用的交叉验

liting李

2周前

239.7347 1 0
  • 关注作者
  • 收藏

为什么需要交叉验证这种方式

当仅有有限数量的数据时,为了对模型性能进行无偏估计,我们可以使用k折交叉验证(k-fold cross-validation)。 使用这种方法时,数据被分成k份数目相等的子集。我们构建k次模型,每次留一个子集做测试集,其他用作训练集。如果k等于样本大小,这也被称之为留一验证(leave-one-out)。在kaggle上,一些数据集是已经对训练集和测试集进行了区分,这种情况我觉得是不用再进行数据集

liting李

2周前

239.7347 1 0
  • 关注作者
  • 收藏

SQL如何计算当前行减去上一行的值

需要用到开窗函数。具体应用如下:

liting李

2周前

92.3077 1 0
  • 关注作者
  • 收藏

python中如何去除列表中重复元素?

方法一: 用内置函数set: 1 list1 = [1, 2, 3, 3, 4, 4, 5, 6, 6, 6, 7, 8, 9]2 list2 = list(set(list1))3 print(list2) 方法二: 遍历去除重复复制代码1 list1 = [1, 2, 3, 3, 4, 4, 5, 6, 6, 6, 7, 8, 9]2 list2=[]3 for

liting李

2周前

92.3077 1 0
  • 关注作者
  • 收藏

python 如何做上下行相减?

pandas提供了一个shift方法,用来使数据在行或者列上进行移动。

liting李

2周前

92.3077 1 0
  • 关注作者
  • 收藏

Python如何将字典(dict)转化为Dataframe?

将字典转换为DataFrame主要有两种方法。第一种方法,直接使用pd.DataFrame()。需要注意的是这种方法需要先将字典变为list。>>> dict = {'a':'apple','b':'banana'}>>> dict{'a': 'apple', 'b': 'banana'}>>> import pandas as pd>>> df = pd.DataFrame([dict])>>>

liting李

2周前

92.3077 1 0
  • 关注作者
  • 收藏
12359>