shauna570392

fit_transform分开和合在一起有什么区别?

fit和transform没有任何关系,仅仅是数据处理的两个不同环节,之所以出来fit_transform这个函数名,仅仅是为了写代码方便,会高效一点。数据预处理中方法:fit():对数据进行拟合,简单来说,就是求得训练集X的均值,方差,最大值,最小值,这些训练集X固有的属性。transform(): 在fit(拟合)的基础上,进行标准化,降维,归一化等操作(看具体用的是哪个工具,如PCA,Sta

41.4773 6 1
  • 关注作者
  • 收藏
shauna570392

为什么有时导入数据时候前面要加r呀?

在windows系统当中读取文件路径可以使用\,但是在python字符串中\有转义的含义,如\t可代表TAB,\n代表换行,所以我们需要采取一些方式使得\不被解读为转义字符在路径前面加r,即保持字符原始值的意思如:f=open(r"c:\Users\dongs\Desktop\python\drink_wine.txt",'r',enconding='utf-8')

25.3478 2 3
  • 关注作者
  • 收藏
shauna570392

anaconda安装库时报错command errored out with exit status,安装不上

这里提示缺少插件,进入后面提示的网站,下载对应的插件安装后再运行安装库的语句如果还未解决可以尝试降低版本安装其他版本的库

25.2893 1 3
  • 关注作者
  • 收藏
shauna570392

Python报错 no module name XXX

这是因为anaconda里没有这个包,所以无法导入需要在anaconda prompt里安装下 代码为pip install missingpy如果报错为其他模块,就把pip install XXX里的XXX就换成其他模块的名字

25.0032 2 3
  • 关注作者
  • 收藏
shauna570392

jupyter如何打开不同文件夹,而不是默认的工作路径?

如果点击jupyter notebook的图标打开jupyter notebook,那么打开会显示默认工作路径下的文件夹,不支持切换路径如果想打开不同的文件夹,可以试试在想打开的路径,在文件夹空白处按shift+右键,点击在此处打开命令窗口,输入jupyter notebook,跳转后就是当前的文件夹路径。可以试试看自己电脑是否支持这种打开方式

25.0690 3 2
  • 关注作者
  • 收藏
shauna570392

Python决策树画图时报错make sure the graphvi executables are on your systems' PATH

报错是环境变量的问题,确保环境变量添加的路径是graphviz安装包实际安装的路径环境变量在系统变量和用户变量都添加一下,之后在anaconda prompt里运行pip install graphviz安装graphviz。再重启jupyter notebook使用graphviz

25.0032 2 3
  • 关注作者
  • 收藏
158****6283

简单随机抽样

import random import numpy as np #简单随机抽样 data = np.loadtxt('路径') data = list(data) print(len(data)) data_sample = random.sample(data, 2000) #随机抽取2000个样本 #sample()里面的数据不能是 numpy.ndarray,可以用list print(d

40.1654 4 4
  • 关注作者
  • 收藏
shauna570392

决策树参数以及用于不纯度计算的不同参数的含义

criterion是用来计算不纯度,通常选择gini,即CART算法,如果选择entropy,则代表ID3和C4,.5算法

0.2279 3 1
  • 关注作者
  • 收藏
shauna570392

如何安装graphviz?

方法一:在线安装在Anaconda Prompt (Anaconda3)中运行下面代码pip install graphviz -i https://pypi.douban.com/simple方法一安装后如果调用出错,一般用离线安装方法可解决,离线安装前需要先卸载卸载方法:pip uninstall graphviz弹出提示时输入y,回车方法二:离线安装1. 下载安装包首先进入[官网](http

0.0000 0 4
  • 关注作者
  • 收藏
shauna570392

在jupyter notebook导入woe时,显示没有该模块,那么在juter中怎么下载安装woe模块呢?

anaconda里没有用于分箱的包,课上老师有发一个用于分箱的py文件,auto_bin.py把那个文件放在jupyter notebook工作路径下可以直接导入使用Python的包搜索路径:1. 程序所在的文件夹2. 标准库的安装路径3. 操作系统环境变量PYTHONPATH所包含的路径

0.0000 0 1
  • 关注作者
  • 收藏
liuyong2730

自定义函数的知识点

自定义函数的语法为: def 函数名(参数): “”“文档内容放在函数内部首行,并加三对引号”“” 函数语句 return 变量名比如自定义一个判断奇数偶数的函数: def num_check(x): if x%2=0: return '偶数' else:

20.1172 3 0
  • 关注作者
  • 收藏
liuyong2730

关于循环的嵌套和跳出

循环语句主要有for 循环和while。在使用循环时,可以层层嵌套。如果要跳出循环,有如下几种方法:使用continue。 continue 的作用是忽略本次循环中continue后面的语句,直接进行本层循环的下一轮。使用break。Break的作用是跳出本层循环。如果要跳出所有的循环,需要在最外层的循环中使用break。使用布尔变量控制,在循环语句中用if语句判断是否需要把该变量赋值为false

13.6228 3 2
  • 关注作者
  • 收藏
shauna570392

无标签无监督学习如何理解?

定义无监督学习,是指机器通过学习没有标签的数据,根据特征将它们分为若干类别的过程。相对于监督学习,无监督学习使用的是没有标签的数据。机器会主动学习数据的特征,并将它们分为若干类别,相当于形成「未知的标签」。比如我们向机器输入一些未经标注的樱桃数据后,机器会主动学习樱桃的特征,并将拥有相似特征的樱桃归为一类。颜色深红且果实较大的樱桃(甜的)可能会被分到一类,而颜色鲜红且果实较小的樱桃(酸的)则可能会

13.9043 4 2
  • 关注作者
  • 收藏
shauna570392

knn只能解决二分类问题吗?

不是,KNN算法不仅可以解决二分类问题,还可以解决多分类问题.下面这个是一个三分类的例子,来判断目标变量属于哪个类别:代码实现:

13.6014 2 1
  • 关注作者
  • 收藏
Zzyh12

学习Python 第二天 条件判断 与 循环使用

IF条件判断使用:根据Python的缩进规则,如果if语句判断是True,就把缩进的两行print语句执行了,否则,什么也不做。也可以给if添加一个else语句,意思是,如果if判断是False,不要执行if的内容,去把else执行了.elif是else if的缩写,完全可以有多个elif,所以if语句的完整形式就是:if : elif :

13.5415 1 2
  • 关注作者
  • 收藏
shauna570392

lstrip('\ufeff')是什么意思?

Python lstrip() 方法用于截掉字符串左边的空格或指定字符。lstrip()方法语法:str.lstrip([chars])chars 是指定截取的字符。这里就是把字符串左边的'\ufeff'删掉

13.5415 1 3
  • 关注作者
  • 收藏
开花结果02

python:什么是有监督学习,什么是无监督学习,这两类的区别是什么

1. 什么是有监督学习指对数据的若干特征与若干标签(类型)之间的关联性进行建模的过程;只要模型被确定,就可以应用到新的未知数据上。这类学习过程可以进一步分为「分类」(classification)任务和「回归」(regression)任务。在分类任务中,标签都是离散值;而在回归任务中,标签都是连续值。2. 什么是无监督学习指对不带任何标签的数据特征进行建模,通常被看成是一种 “让数据自己介

13.7337 2 2
  • 关注作者
  • 收藏
E170801110705f1

感知机对偶形式的Python代码实现

'''感知机(Perceptron)1957年由Rosenblatt提出,是神经网络与支持向量机的基础。感知机学习算法具有简单而易于实现的优点,分为原始形式和对偶形式输入为实例的特征向量,输出为实例的类别,取+1和-1感知机对应于输入空间中将实例划分为正负两类的分离超平面,属于判别模型导入基于误分类的损失函数利用梯度下降法对损失函数进行极小化'''import numpy as npclass D

34.9110 2 3
  • 关注作者
  • 收藏
shauna570392

pandas group by什么时候给列名加方括号什么时候不加

放一列作为聚合条件的时候可加可不加,如果以多列作为条件聚合,必须加如果以一个参数作为条件聚合,加不加方括号都可当有多个列作为聚合条件时,如果不加方括号,相当于传入了多个参数,不符合函数规则,所以报错了。

34.9110 2 3
  • 关注作者
  • 收藏
shauna570392

导入文件报错 no such file…..

这是因为在该路径下没有找到改文件如果省略完整的路径,只写文件名,那么需要把文件放在ipynb文件的工作路径下就可以直接读取了如果文件不在同一文件夹,那么就要写完整的路径名

24.3759 4 4
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
CDA持证人阿涛哥
480.0000
02
85691082
320.0000