CDA100984

数据分析概述

数据分析入门的一些简单知识

0.0000 0 0
  • 关注作者
  • 收藏
ermutuxia

​Python语句把上面的文本文件里面的数据的和求出来?

sum.txtPython语句方便快速的把上面的文本文件里面的数据的和求出来?import numpy as npa=np.loadtxt(r"C:\Users\Administrator\Desktop\sum.txt",dtype=np.int,delimiter=None,unpack=False)a.sum()执行过程结果截图知识点:用numpy库导入txt文件将其变为数组

0.0000 0 2
  • 关注作者
  • 收藏
心盛待花开

定义字典

为什么我的代码未执行也没有报错。答:指定的键值对中字典键和值要有对应关系,“work”对应的是字典中的值,这里如果想得到对应的键的work,将“work[i]更改成name[i]”.

0.0000 0 0
  • 关注作者
  • 收藏
心盛待花开

安装MYSQL8.0出现 【ENDED CONFIGURATION STEP: INITIALIZING DATABASE (MAY TAKE A LONG TIME)】

检查计算机名称是否为中文,如果是更改成为ZIP版本。解决方法:右键我的电脑属性——查看自己的计算机名和组名是否为中文——更改计算机名和组名-重启计算机-使用MySQL Installa安装程序安装MySQL server。

0.0000 0 0
  • 关注作者
  • 收藏
ermutuxia

在pycharm中如何运行选中的部分代码?

在打开的代码文件中选中想要运行的代码,然后右键点击,选择执行Python控制台中的选定内容。

0.0000 1 0
  • 关注作者
  • 收藏
ermutuxia

pycharm版本不稳定问题:TypeError:isinstance() arg 2 must be a type or a tuple of types

学生:老师 这里有个问题请教您一下,我用的是pycharmTraceback (most recent call last):File “”,line 9,inFile “”,line 2,in len01TypeError:isinstance() arg 2 must be a type or a tuple of typesisinstance() 的第二个参数必须是数据类型 或者是一个数据

0.0000 1 0
  • 关注作者
  • 收藏
ermutuxia

老师,请教一下,为什么空值显示有nan和NaN两种?

学生:老师,请教一下,为什么空值显示有nan和NaN两种?nan是numpy.float64格式,NaN是float格式,两者有什么不同吗?老师:你可以认为成没有区别,只要确保你的变量的缺失值是float就可以了具体一些细节尝试如下:演示数据:test3.xlsximport pandas as pdimport numpy as npdata1=pd.read_excel(r"D:\python

0.0000 1 0
  • 关注作者
  • 收藏
读童话的狼

为啥有些文件打开时就自动显示了目录,有些则没有显示呢

有这个情况,目录插件的bug,多打开几次试试

66.7322 2 0
  • 关注作者
  • 收藏
读童话的狼

pd.read_sas()读取文件,字符型变量前多一个‘b'

python3.x里默认的str是(py2.x里的)unicode, bytes是(py2.x)的str, b”“前缀代表的就是bytes若要正常显示,需要加encoding='unicode_escape'

66.7322 2 0
  • 关注作者
  • 收藏
读童话的狼

data.loc[:,'I11':'I65']为连续变量,这些列都有缺失值,用每列的平均值填充该列的缺失值

import pandas as pddf=pd.read_sas('fs_6.sas7bdat',encoding='unicode_escape')df1=df.loc[:,'I11':'I65']for i in df1.columns: df[i].fillna(df[i].mean(),inplace=True)

66.7322 2 0
  • 关注作者
  • 收藏
读童话的狼

照着视频敲的。运行的时候会报这个错误,提示没有normed属性

包更新了,移除了这个属性,换用下面代码即可import matplotlib.mlab as mlabfrom scipy.stats import normmu = 100 # 均值sigma = 15 # 标准差x = mu + sigma * np.random.randn(1000)n, bins, patches = plt.hist(x, 50, density=True)#

66.7322 2 0
  • 关注作者
  • 收藏
詹惠儿

mysql报错:Eror Code: 1054. Unknown column job' in having clause'

问:mysql报错:Eror Code: 1054. Unknown column job' in having clause'答:这是因为having用法错误,having是用于对分组后的虚拟结果聚合运算后进行筛选,having后的字段只能是聚合运算值或者分组字段,这里having子句的job字段既不是聚合汇总值,也不是分组字段deptno,不符合sql的语法,sql语句可以改成:

66.7322 2 0
  • 关注作者
  • 收藏
詹惠儿

sql 报错1064:You have an error in your SQL syntax;

问:sql 报错1064:You have an error in your SQL syntax;答:mysql中报1064错误的原因,一般都是sql的语法使用错误,需要检查sql语句中关键字有没有拼写正确,关键字与关键字的连接等,例如这里报1064错误,是因为left join 后面跟着的是on子句,关键字是on不是no,将其修改正确即可。

66.6339 1 0
  • 关注作者
  • 收藏
詹惠儿

mysql的 IFNULL() 函数怎么理解?

问:mysql的 IFNULL() 函数怎么理解?答:IFNULL() 函数用于判断第一个表达式是否为 NULL,如果为 NULL 则返回第二个参数的值,如果不为 NULL 则返回第一个参数的值。IFNULL() 函数语法格式为:IFNULL(expression, alt_value)如果第一个参数的表达式 expression 为 NULL,则返回第二个参数的备用值。例如上述代码中表示:当第一

66.6339 1 0
  • 关注作者
  • 收藏
詹惠儿

powerBI中透视表字段怎么以百分比形式显示

问:powerBI中透视表字段怎么以百分比形式显示?答:操作如下:1. 在右侧【字段】功能区中,选中需要设置百分比格式的汇总规则2.选中【建模】选项卡,在【格式设置】区的【%】即可将汇总规则修改成百分比显示。

66.6339 1 0
  • 关注作者
  • 收藏
詹惠儿

powerBI安装后打开报错:调用的目标发生了异常

问:powerBI安装后打开报错:调用的目标发生了异常答:解决方法如下:运行cmd输入regedit,按回车键打开注册表在注册表中找到HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Lsa项点击Lsa项,选择下方FipsAlgorithmPolicy,双击右边出现Enabled项,把数值数据框中的数据改为0重新打开powerBI deskto

66.7322 2 0
  • 关注作者
  • 收藏
liting李

那分表后的ID怎么保证唯一性的呢?

因为我们主键默认都是自增的,那么分表之后的主键在不同表就肯定会有冲突了。有几个办法考虑:设定步长,比如1-1024张表我们分别设定1-1024的基础步长,这样主键落到不同的表就不会冲突了。分布式ID,自己实现一套分布式ID生成算法或者使用开源的比如雪花算法这种。分表后不使用主键作为查询依据,而是每张表单独新增一个字段作为唯一主键使用,比如订单表订单号是唯一的,不管最终落在哪张表都基于订单号作为查询

66.6339 1 0
  • 关注作者
  • 收藏
liting李

MySQL数据量级多大?分库分表怎么做的?

首先分库分表分为垂直和水平两个方式,一般来说我们拆分的顺序是先垂直后水平。垂直分库基于现在微服务拆分来说,都是已经做到了垂直分库了。垂直分表如果表字段比较多,将不常用的、数据较大的等等做拆分。水平分表首先根据业务场景来决定使用什么字段作为分表字段(sharding_key),比如我们现在日订单1000万,我们大部分的场景来源于C端,我们可以用user_id作为sharding_key,数据查询支持

66.6339 1 0
  • 关注作者
  • 收藏
liting李

如何改变python的默认路径为当前的工作路径

改变python的默认路径为当前的工作路径通过os模块来进行python中路径的更改默认路径为:>>> import os>>> os.getcwd()'D:\\Program Files\\Python35'跳转到当前工作路径为>>> os.chdir("D:\Program Files\Python35\modifyPath\test02")>>> os.getcwd()'D:\\Progra

66.6339 1 0
  • 关注作者
  • 收藏
liting李

如何理解准确率、精准率和召回率

我们在在分类任务时,经常会对模型结果进行评估。评估模型好坏的指标有AUC、KS值等等。这些指标是通过预测概率进行计算的。而准确率、精准率和召回率也通过混淆矩阵计算出来的。下图是对混淆矩阵的介绍:其中,TP:样本为正,预测结果为正;FP:样本为负,预测结果为正;TN:样本为负,预测结果为负;FN:样本为正,预测结果为负。准确率、精准率和召回率的计算公式如下:准确率(accuracy): (TP

66.6339 1 1
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
ermutuxia
6496.1794
02
詹惠儿
2321.8909
03
liting李
2221.2971
04
LXM21
1778.6259
05
读童话的狼
1154.4227
06
LYY202012
720.0000
07
fs陈晓亮
491.6233
08
马锦涛
425.9382
09
M170504093621V4
342.8572
10
张07
342.8572
11
永洪科技
251.4286
12
18192654262
214.3936
13
hunter.Z
171.4216
14
心盛待花开
149.9844
15
M18758998702
85.7857
16
zgtly0723
66.6339
17
clips
66.6339