重要参数:criterion回归树衡量分枝质量的指标,支持的标准有三种:1 )输入 "mse" 使用均方误差 mean squared error(MSE) ,父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2 损失2 )输入 “friedman_mse” 使用费尔德曼均方误差,这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差3 )输
liting李
2021-04-02
问:input()接收用户输入的数据都是字符串类型,如果用户输入1,想得到整型该如何操作?答:转换数据类型即可,即将字符串类型转换成整型。int(input(1))即可。其他转换数据类型的函数还有:
liting李
2021-03-29
双引号用于公式中文本引用,在引用的文本两边必须加上双引号,否则excel会将文本作为函数处理而出错。单引号用在公式中的工作薄或工作表名得引用,当工作表(簿)为纯数字或者单个数字和字母的组合,或者有中划线等符号时,引用其名字,在名字的两边必须加单引号。连接符&,用于将连接不同的文本或引用使其连续排列在一个单元格中。
liting李
2021-03-29
power bi针对的数据一般比较大量,而且模板都是设定好的,不够灵活(自己能做模板的话当然不在乎这个),但是画面还有排版上是比excel方便美观的,同时可以显示在手机上也比较吊。excel是比较灵活,并且使用较广,对于少量数据很合适。配合vba也可以做到很多。
liting李
2021-03-26
eries加法运算将索引值一致的元素相加,一个数组中的索引值在另一个数组中无法找到的,未找到对应索引的数组元素值为NaN,NaN值与其他数字加减乘除均得到NaN值,按照这个规则现有代码如下:
liting李
2021-03-25
text.middle和text.range都是指从指定位置开始返回指定个数字符串。b=Text.Middle([url],4,6), 相当于mid,注意,第二参数索引是从0开始。第三参数可省略,如省略则返回从索引位置开始后面所有的字符c=Text.Range([url],4,6), //同上其中Text.Middle和Text.Range基本类似,唯一的区别在于后者不能越界
liting李
2021-03-25
df.sort_values(by=['time_list'], ascending=True, inplace=True)pandas排序的方法有很多,sort_values表示根据某一列排序 pd.sort_values("xxx",inplace=True) 表示pd按照xxx这个字段排序,inplace默认为False,如果该值为False,那么原来的pd顺序没变,只是返
liting李
2021-03-24
count(*) 将返回表格中所有存在的行的总数包括值为 null 的行,然而 count(列名) 将返回表格中除去 null 以外的所有行的总数 (有默认值的列也会被计入),这点对于所有数据的 COUNT 计算都是一样的count(1) 与 count(*) 比较 :1> 如果数据表没有主键,那么 count(1) 比 count(*) 快2> 如果有主键的话,那主键 (联合主键) 作为 cou
liting李
2021-03-24
首先把所有要提取数据的excel放置到同一个目录文件夹下导入包:import os '用于提取目录下文件名'import pandas as pd '用于生成data_frame进行结果存储'提取目录文件夹中所有的文件名:只需要写到目录文件夹的路径即可,会输出目录文件夹中所有的文件名称info = os.listdir('/目录文件夹路径/') '创建空的列表用于存放提取出得数据'data =
liting李
2021-03-24
import xlrddata_name = xlrd.open_workbook(dir) #打开文件,dir为文件路径table = data_name.sheet_by_index(sheetnum) #打开工作表,sheetnum为工作表的索引cols = table.ncols #获取所有的列data = [] #存储数据#举例除了第三列不提取之外,提取其
liting李
2021-03-24
Excel表中有两条重复记录,那么如何将其去除呢?# 导入pandas包并重命名为pdimport pandas as pd# 读取Excel中Sheet1中的数据data = pd.DataFrame(pd.read_excel('test.xlsx', 'Sheet1'))# 查看读取数据内容print(data)# 查看是否有重复行re_row = data.duplicated()prin
liting李
2021-03-23
Multiple R:x和y的相关系数r,一般在-1~1之间,绝对值越靠近1则相关性越强,越靠近0则相关性越弱;R square:x和y的相关系数r的平方,表达自变量x解释因变量y变差的程度,以测定量y的拟合效果;Significance F对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。如P=0.0
liting李
2021-03-23
1.打开excel,在菜单里寻找插入选项2.选中该表中的数值,点击“插入”中的“散点图”。3.点击第一个图样式,鼠标右击其中一个点,选择“添加趋势线”。4.勾选“线性”和“显示公式”即可得到回归方程。
liting李
2021-03-23
实际的问题是要从excel表中提取日期、邮件地址和时间,然后统计在一定时间段内某个人在某个项目上用了多少时间,最后做成一张数据透视表(这是问题的大致意思)。首先要做的就是数据提取了,excel中本身有一个text to column的功能,但是对列中规律性不好的数据处理效果很差,不能分割出想要的数据,所以我果断选择用python来完成。 要用的库一个是对excel读写处理的,一个事正则表
liting李
2021-03-22
一、PowerBI与Tableau产品明细对比二、PowerBI与Tableau功能点对比三、PowerBI与Tableau产品的定位Tableau的产品定位是“帮助人们查看和理解数据”,显然它的主要目标是可视化。然而PowerBI主要基于高级Excel功能,包括Power Query,Power Pivot和Power View。Microsoft的定位在于为其他业务应用程序的用户(尤其是Exc
liting李
2021-03-20
一、追加单个值: append() 方法追加单个元素:>>> list = ['crazyit', 20, -2]>>> list.append('fkit')>>> print(list)['crazyit', 20, -2, 'fkit']二、追加元组、列表等:extend() 方法追加元组中的所有元素:>>> b_list = ['a', 30]>>> b_list.extend((-2,
liting李
2021-03-20
关于python 如何输出列表(list)的 倒序有三种方法:lists = [1,3,4,5,6,7,9,2]# 切片print lists[::-1]# 函数reverse 对数组进行操作lists.reverse() print lists# 函数reversed 返回一个迭代对象,需要list化print list(reversed(lists))
liting李
2021-03-20
powerquery是不允许删除数据的,如果有数据不需要,有三种办法可以解决:1、到原始数据里去删除。2、通过筛选,过滤掉这条错误记录,筛选条件设置为不等于(错误值)即可。3、直接用替换值来更正错误记录。
liting李
2021-03-18
python3 ,pycharm中运行page = input('please enter the page: ')for i in range(0, page):报错TypeError: ‘str’ object cannot be interpreted as an integerinput读取的类型是str(字符串),需要转换成int类型page = int(input('please en
liting李
2021-03-18
iterrows():说明:是属于DataFrame(数据框)的遍历函数使用:一般与循环搭配for index, row in dataframe.iterrows():返回:(index,row)对enumerate():说明: enumerate()是python的内置函数,同时获得索引和值使用:一般与循环搭配for index,item in enumerate(data):参数: data
liting李
2021-03-18