数据科学专业问答社区，好文章，一字千金--CDA答疑社区

DecisionTreeRegressor重要参数、接口、属性能详细的说明下吗？

重要参数：criterion回归树衡量分枝质量的指标，支持的标准有三种：1 ）输入 "mse" 使用均方误差 mean squared error(MSE) ，父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准，这种方法通过使用叶子节点的均值来最小化L2 损失2 ）输入 “friedman_mse” 使用费尔德曼均方误差，这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差3 ）输

liting李

2021-04-02

133.3333 1 0

input()接收用户输入的数据都是字符串类型，如果用户输入1，想得到整型该如何操作？

问：input()接收用户输入的数据都是字符串类型，如果用户输入1，想得到整型该如何操作？答：转换数据类型即可，即将字符串类型转换成整型。int(input(1))即可。其他转换数据类型的函数还有：

liting李

2021-03-29

129.7614 1 0

Excel中的引号什么时候加，什么时候不加？

双引号用于公式中文本引用，在引用的文本两边必须加上双引号，否则excel会将文本作为函数处理而出错。单引号用在公式中的工作薄或工作表名得引用，当工作表(簿)为纯数字或者单个数字和字母的组合，或者有中划线等符号时，引用其名字，在名字的两边必须加单引号。连接符&，用于将连接不同的文本或引用使其连续排列在一个单元格中。

liting李

2021-03-29

129.7614 1 0

Power bi和excel在图表制作上有何区别

power bi针对的数据一般比较大量，而且模板都是设定好的，不够灵活（自己能做模板的话当然不在乎这个），但是画面还有排版上是比excel方便美观的，同时可以显示在手机上也比较吊。excel是比较灵活，并且使用较广，对于少量数据很合适。配合vba也可以做到很多。

liting李

2021-03-26

99.9374 1 0

pandas中两个不同索引的Series相加是怎么相加的？

eries加法运算将索引值一致的元素相加，一个数组中的索引值在另一个数组中无法找到的，未找到对应索引的数组元素值为NaN,NaN值与其他数字加减乘除均得到NaN值，按照这个规则现有代码如下：

liting李

2021-03-25

99.9374 1 0

power bi中text.middle和text.range有什么区别

text.middle和text.range都是指从指定位置开始返回指定个数字符串。b=Text.Middle([url],4,6), 相当于mid,注意，第二参数索引是从0开始。第三参数可省略，如省略则返回从索引位置开始后面所有的字符c=Text.Range([url],4,6), //同上其中Text.Middle和Text.Range基本类似，唯一的区别在于后者不能越界

liting李

2021-03-25

92.2756 1 0

pandas按照某一列从小到大的顺序排列

df.sort_values(by=['time_list'], ascending=True, inplace=True)pandas排序的方法有很多，sort_values表示根据某一列排序 pd.sort_values("xxx",inplace=True) 表示pd按照xxx这个字段排序，inplace默认为False,如果该值为False，那么原来的pd顺序没变，只是返

liting李

2021-03-24

92.2756 1 0

MySQL count(1) count(*) 比较详解

count(*) 将返回表格中所有存在的行的总数包括值为 null 的行，然而 count(列名) 将返回表格中除去 null 以外的所有行的总数 (有默认值的列也会被计入)，这点对于所有数据的 COUNT 计算都是一样的count(1) 与 count(*) 比较 :1> 如果数据表没有主键，那么 count(1) 比 count(*) 快2> 如果有主键的话，那主键 (联合主键) 作为 cou

liting李

2021-03-24

92.2756 1 0

python 如何提取多个excel表中的某行/列数据做合并

首先把所有要提取数据的excel放置到同一个目录文件夹下导入包：import os '用于提取目录下文件名'import pandas as pd '用于生成data_frame进行结果存储'提取目录文件夹中所有的文件名：只需要写到目录文件夹的路径即可，会输出目录文件夹中所有的文件名称info = os.listdir('/目录文件夹路径/') '创建空的列表用于存放提取出得数据'data =

liting李

2021-03-24

59.9593 1 0

python如何提取Excel某几列数据

import xlrddata_name = xlrd.open_workbook(dir) #打开文件，dir为文件路径table = data_name.sheet_by_index(sheetnum) #打开工作表，sheetnum为工作表的索引cols = table.ncols #获取所有的列data = [] #存储数据#举例除了第三列不提取之外，提取其

liting李

2021-03-24

59.9593 1 0

如何用Python处理Excel中的重复行

Excel表中有两条重复记录，那么如何将其去除呢？# 导入pandas包并重命名为pdimport pandas as pd# 读取Excel中Sheet1中的数据data = pd.DataFrame(pd.read_excel('test.xlsx', 'Sheet1'))# 查看读取数据内容print(data)# 查看是否有重复行re_row = data.duplicated()prin

liting李

2021-03-23

200.0000 1 0

excel回归分析的结果各项都代表着什么？

Multiple R：x和y的相关系数r，一般在-1~1之间，绝对值越靠近1则相关性越强，越靠近0则相关性越弱;R square：x和y的相关系数r的平方，表达自变量x解释因变量y变差的程度，以测定量y的拟合效果;Significance F对应的是在显著性水平下的Fα临界值，其实等于P值，即弃真概率。所谓“弃真概率”即模型为假的概率，显然1-P便是模型为真的概率。可见，P值越小越好。如P=0.0

liting李

2021-03-23

200.0000 1 0

怎么用EXCEL 做回归方程

1.打开excel，在菜单里寻找插入选项2.选中该表中的数值，点击“插入”中的“散点图”。3.点击第一个图样式，鼠标右击其中一个点，选择“添加趋势线”。4.勾选“线性”和“显示公式”即可得到回归方程。

liting李

2021-03-23

200.0000 1 0

如何利用python对Excel中的特定数据提取并写入新表

实际的问题是要从excel表中提取日期、邮件地址和时间，然后统计在一定时间段内某个人在某个项目上用了多少时间，最后做成一张数据透视表（这是问题的大致意思）。首先要做的就是数据提取了，excel中本身有一个text to column的功能，但是对列中规律性不好的数据处理效果很差，不能分割出想要的数据，所以我果断选择用python来完成。要用的库一个是对excel读写处理的，一个事正则表

liting李

2021-03-22

200.0000 1 0

PowerBI与Tableau对比分析，有什么区别？

一、PowerBI与Tableau产品明细对比二、PowerBI与Tableau功能点对比三、PowerBI与Tableau产品的定位Tableau的产品定位是“帮助人们查看和理解数据”，显然它的主要目标是可视化。然而PowerBI主要基于高级Excel功能，包括Power Query，Power Pivot和Power View。Microsoft的定位在于为其他业务应用程序的用户（尤其是Exc

liting李

2021-03-20

99.9588 1 0

Python 如何在列表添加元素

一、追加单个值： append() 方法追加单个元素：>>> list = ['crazyit', 20, -2]>>> list.append('fkit')>>> print(list)['crazyit', 20, -2, 'fkit']二、追加元组、列表等：extend() 方法追加元组中的所有元素：>>> b_list = ['a', 30]>>> b_list.extend((-2,

liting李

2021-03-20

300.0000 1 0

python 如何输出列表（list）的倒序

关于python 如何输出列表（list）的倒序有三种方法：lists = [1,3,4,5,6,7,9,2]# 切片print lists[::-1]# 函数reverse 对数组进行操作lists.reverse() print lists# 函数reversed 返回一个迭代对象，需要list化print list(reversed(lists))

liting李

2021-03-20

300.0000 1 0

power query 如何删除一行记录

powerquery是不允许删除数据的，如果有数据不需要，有三种办法可以解决：1、到原始数据里去删除。2、通过筛选，过滤掉这条错误记录，筛选条件设置为不等于（错误值）即可。3、直接用替换值来更正错误记录。

liting李

2021-03-18

109.0909 1 0

TypeError: 'str' object cannot be interpreted as an integer

python3 ，pycharm中运行page = input('please enter the page: ')for i in range(0, page):报错TypeError: ‘str’ object cannot be interpreted as an integerinput读取的类型是str（字符串），需要转换成int类型page = int(input('please en

liting李

2021-03-18

109.0909 1 0

遍历函数iterrows()和enumerate()

iterrows():说明：是属于DataFrame（数据框）的遍历函数使用：一般与循环搭配for index, row in dataframe.iterrows():返回：（index，row）对enumerate()：说明： enumerate()是python的内置函数，同时获得索引和值使用：一般与循环搭配for index,item in enumerate(data)：参数： data

liting李

2021-03-18

109.0909 1 0