数据科学专业问答社区，好文章，一字千金--CDA答疑社区

平均访问深度是什么意思？平均访问深度怎么算？

平均访问深度指用户浏览某个网站的过程中浏览了该网站的页数的平均值。网站访问深度就是用户在一次浏览某个网站的过程中浏览了该网站的页数。简称DV。用户访问网站的深度用数据可以理解为网站平均访问的页面数（平均访问深度），就是PV和uv的比值，这个比值越大，用户体验度越好，网站的粘性也越高。

liting李

2021-05-22

36.0000 1 0

excel出现值不可用错误怎么办

1、可能引用的数据为非数值格式，例如文本格式。此时应修改为数值格式2、内容中含有空格等不可见字符，用len函数查看字符长度，是否与显示相符.例如内容在A1单元格，可在B1查看其字符长度，输入“=len(A1)”，就会返回A1单元格中字符串的长度。

liting李

2021-05-22

36.0000 1 0

sql 同一条记录各个字段比较取最大值

数据是这样的要的是：同一条记录（A字段对应的值无重复的情况）取B,C,D,E,F中最大的值，A字段对应的值有重复的情况，那么取重复的x条记录中B,C,D,E,F字段的最大值答：select a,max(b)b,max(c)c,max(d)d,max(e)d,max(f)f from tb group by a

liting李

2021-05-21

36.0000 1 0

什么是SQL中的Joins(连接)?

Join用于从相关的行和列中检索数据。它在两个或多个表之间工作,并且它从两个表返回至少一-个匹配。Joins类型是:Right Join (右连接)Left Join (左连接)Inner Join (内连接)Outer Join (外连接)Self- Join (自连接)Cross Join (交叉连接).Full Join (全连接)

liting李

2021-05-21

36.0000 1 0

什么是电商黄金公式？

问：什么是电商黄金公式？答：电商黄金公式：销售额 = 流量 * 转化率 * 客单价1.流量流量分为三大块：免费流量、付费流量、活动流量免费流量主要通过搜索渠道获取，跟商品的交易排名、上下架时间（这个上下架时间是虚拟的上下架时间，不是实际货品上下架时间）、店铺综合指数、SEO标题优化等相关；付费流量主要是通过付费推广，获得平台的资源位置展现；活动流量则是通过参与平台618、双11等活动，在活动

liting李

2021-05-21

36.0000 1 0

importance_type (str, 默认值为 'weight') – 选择输出的哪一种重要程度。可选的5类重要程度如下所示：(1)"weight"：在所有的树中，一个feature总共多少次被用于分割数据。分析：这个指标是一个变量被用于分割的绝对次数，这就造成了这个指标的缺点。对于定类变量和定序变量，由于他们天生能用于分割的点就比较少，很容易被"weight"指标所忽略。一个简单的例子就是

liting李

2021-05-21

54.8496 2 0

有个问题请教下，xgb模型，如果importance_type="gini"，是不是就无法输出特征重要性？

问：有个问题请教下，xgb模型，如果importance_type="gini"，是不是就无法输出特征重要性？答：不是这样理解的，这个参数用默认就好，每个节点的信息是按照gini算得，也可以用别的算的，没必要再算gini，不影响结果输出

liting李

2021-05-21

54.8496 2 0

COUNTIFS函数介绍

参数：COUNTIFS(条件区域1，条件1，条件区域2，条件2，……)，最多可以有127个条件区域和127个条件。作用：多条件统计，按要求的条件统计出对应的单元格个数。知识点1：COUNTIFS后面的条件区域行、列数必须和第一个条件区域的行、列数一模一样。知识点2：如果想用该函数求某一列有多少个空单元格，公式应该写成=COUNTIFS(区域列,"")。如果写成=COUNTIFS(区域列,空单元格E

liting李

2021-05-21

36.0000 1 0

如何开展A/B测试

开展A/B测试，可以分为6个步骤：确立优化目标。分析数据。提出想法。重要性排序。实施A/B测试并分析实验结果。迭代整个流程，进行下一轮A/B测试。

liting李

2021-05-19

55.1551 1 0

什么是ab test

A / B测试，即有两个即将面对大众的设计版本(A和B)。通过小范围发布，得到并比较这两个版本之间你所关心的数据(转化率，业绩，跳出率等)，最后选择效果最好的版本。对于互联网产品来说，通过A/B测试提升点击转化率，优化获客成本已得到越来越多的关注。以获客环节为例：许多产品都会在百度、头条等渠道投放落地页广告，以完成新用户的注册转化，而落地页效果的好坏，会直接影响转化率和获客成本。以每月200万投放

liting李

2021-05-19

55.1551 1 2

MySQL中substr函数是怎么截取字符串的？

substr函数格式 (俗称：字符截取函数)　　格式1： substr(string string, int a, int b);　　格式2：substr(string string, int a) ;解析：格式1： 1、string 需要截取的字符串 2、a 截取字符串的开始位置（注：当a等于0或1时，都是从第一位开始截取） 3、b 要截取

liting李

2021-05-19

55.1551 1 0

什么是视图？作用是什么？

1. 视图 1.1. 什么是视图视图(VIEW)也被称作虚表，即虚拟的表，是一组数据的逻辑表示,其本质是对应于一条SELECT语句，结果集被赋予一个名字，即视图名字。视图本身并不包含任何数据，它只包含映射到基表的一个查询语句，当基表数据发生变化，视图数据也随之变化。创建视图的语法： 01.CREATE [OR REPLACE] VIEW view_name[(alias[, alias…])]

liting李

2021-05-19

55.1551 1 0

mysql 的CURDATE() 与 NOW() 有什么区别

SELECT CURDATE()；查询出的是当前天的开始时间点，比如今天是 2021.05.18号，那不管我在今天什么时间点查询，结果都是今天的凌晨，即今天的开始的那个时间点，因为它只具体到年月日，没有时分秒SELECT NOW(); 查询出的是当前的时间点，具体到年月日-时分秒

liting李

2021-05-18

180.0000 1 0

存储过程与函数有什么区别？

下面用一张表来区别存储过程和函数

liting李

2021-05-18

90.0000 1 0

SQL面试题什么是存储过程？用什么来调用？

存储过程是一个预编译的SQL语句，优点是允许模块化的设计，就是说只需创建一次，以后在该程序中就可以调用多次。如果某次操作需要执行多次SQL，使用存储过程比单纯SQL语句执行要快。调用： 1）可以用一个命令对象来调用存储过程。 2）可以供外部程序调用，比如：java程序

liting李

2021-05-18

0.0000 0 0

什么叫视图？

官方解释：是一种虚拟的表，即视图所对应的数据不进行实际存储，但具有和物理表相同的功能。可以对视图进行增，改，查，操作，视图通常是有一个表或者多个表的行或列的子集。通俗地理解就是，视图是从一个或多个表（或视图）导出的表。用户可以根据自己不同的需求，在物理的数据库上定义自己对数据库所要求的数据结构，这种根据用户观点所定义的数据结构就是视图。通过视图可以更改基表的数据，但必须保证视图是可更新视图，且视

liting李

2021-05-18

0.0000 0 0

如何提高用户留存率？

活动运营，刺激用户欲望活动运营是促活用户效果最好的方法之一，对于电商APP，利用节日进行促销活动、送券活动；对于金融理财类，通过活动促使用户进行绑卡、投资；对于教育APP，邀请大V线上讲课，开展线下沙龙活动等。合理做好消息推送过于频繁的push会造成用户流失，但合理适时进行push推送能起到唤醒用户的作用，push推送，要做到精准化，前提是你需要了解你的用户，给用户进行标签管理。针对不用标签的用户

liting李

2021-05-18

90.0000 1 0

mysql建立索引的几大原则

1．选择唯一性索引唯一性索引的值是唯一的，可以更快速的通过该索引来确定某条记录。例如，学生表中学号是具有唯一性的字段。为该字段建立唯一性索引可以很快的确定某个学生的信息。如果使用姓名的话，可能存在同名现象，从而降低查询速度。2．为经常需要排序、分组和联合操作的字段建立索引经常需要ORDER BY、GROUP BY、DISTINCT和UNION等操作的字段，排序操作会浪费很多时间。如果为其建立索引，

liting李

2021-05-18

0.0000 0 0

mysql报错：[Err] 29、[Err] 1290

[Err] 29解决方案：将需要导入文件路径放在mysql安装路径下[Err] 1290解决方案：在my.ini文件 [mysqld]节点下添加secure_file_priv=’’，重启mysql服务[Err] 1140 - In aggregated query without GROUP BY, expression #1 of SELECT list contains nonaggrega

liting李

2021-05-17

90.0000 1 0

什么是ODBC数据源

ODBC是1）是一种数据库的连接方式，包含数据库连接信息，机器名，用户名，密码，及要查看的使用的数据库。2）是一组数据的位置，使用ODBC驱动程序访问该位置。也是一种存储的定义。3）是微软公司开发服务结构（WOSA，windows Open Services Architeture）有关数据的一个组成部分，ODBC建立了一组规范并提供数据库访问的标准的API。这些API利用SQL完成大部分任务。4

liting李

2021-05-17

90.0000 1 0