getwd() #查看工作路径 dir()#查看工作路径中存储的文件信息文件--->更改工作路径#更改工作路径(1)文本文档文件的读取:read.table(file="数据.数据类型",header=T,sep=””)str()#浏览存储类型和结构信息 names()#查看数据框的各域名 head()#前六行> str(A)
google浏览器打不开 64位提示,检查更新时出错:由于未指定的错误导致安装失败。请重新下载Google chrome 浏览器。(错误代码为:7:0×80040902:8)。西方国家字母体系分为两类:serif 以及sans serif。serif 是有衬线字体,意思是在字的笔画开始、结束的地方有额外的装饰,而且笔画的粗细会有所不同。相反的,sans serif 就没有这些额外的装饰,而且笔画的
第1题和第3题不费什么劲就做出来了,第2题琢磨了几个小时,提交完成后一看答案,瞎啦!第1题(审批通过的平均申请金额)眼瞎还是怎么回事?做的时候怎么没看到?,结果碰巧正确第3题。。。。。。嗯,还是要考虑有重复的情况的!至于第2题,琢磨几个小时都在纠结什么呢?逾期率:分子是大于30以上的剩余本金总和,那么分母呢?不应该也是大于30天的放款额总和吗?按照这个思路就是出不来结果(那个空值,筛选条件的时候真
Excel 面向的是中高级数据分析用户,以数据分析为主要目的。用 Excel 工作的一般都是统计、数据分析、财务等 Business Users。 Power BI 是以实现 Self-Services BI 为目的, 也就是提供一种用户(而不是程序员)进行数据可视化的工具。Power BI 服务器在 Azure 下,不像 Excel 那么容易安装和配置。
一、Power Query数据处理1、查询编辑器上网使用2、M函数基础(1)自定义函数例:(parameter1 as number, parameter2 as number) =>letFinal = (parameter1 + parameter2) / 2inFinal(2)if函数例:if 2 > 1 then2 + 2else if 2 = 1 then2 + 1else1 + 13、
@[TOC](本篇目录)### 一、常用EXCEL函数1. COUNTIF(range,criteria) 【如=COUNTIF(B2:K2,"b")】2. COUNTIFS(range1,criteria1,...) 【如=COUNTIFS(B2:B11,"b",C2:C11
P值的计算:一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P =
1、限于数据,动不敢动。一提用户画像,很多人脑海里立刻蹦出了性别,年龄,地域,爱好等基础信息字段,然后大呼:我们好像没这个数据,于是放弃分析了。可实际想想,知道男性占比真的有那么大意义?知道男性占比65%还是60%真的对业务有帮助?不一定的,贴用户标签有很多方式,不要限于一些难采集的基础信息。2、罗列数据,没有思路。很多人一听到用户画像分析,本能的就开始把数据库里的用户标签往外搬,在报告里码上
Power BI制作图表的过程:数据收集>数据处理>建模>创建规则>展示图形决策树:比较类图表:1、柱状图:不按照柱子的大小排序,按照横坐标轴排序2、条形图:一般按照柱子的大小排序3、雷达图注意事项:维度不能太多,否则点太多了就看不清了;把同属性的点放在同一侧上4、词云图的缺点:不能精确的展示具体的数字;特别容易忽略数据量小的细节。词云图中的颜色没有什么价值,如果是想让用户关注全局
1.变量的分类 2.影响表连接结果的三个属性:方向性、主附关系、对应关系3.连接关系的分类 判断原则:连接用关键字段里有重复值的叫多表,没有重复值的叫一表各种连接关系的比较:多对多(非主键对非主键),重复项下翻倍,得不到汇总结果一对一(主键对主键),少用(出现频率小),跟业务意义不符4.表连接本质:维度对度量的汇总。(1)汇总方式:①类型1:维度直接汇总度量。
(一)结构化数据 – 列表 列表是扩在花括号中的一组数据,列表中每个数据都有属于自己的序号以便自己能够被检索到,列表中的数据序号从0开始按照排列顺序依次整数递增,大列表内还可以嵌套子列表、记录等。 花括号除了用来括起列表内的所有数据还用来指定列表内数据的序号,通过指定数据序号可以从列表内找到并获取所需的数据值。 (二)结构化数据 – 记录记录用来定义字段和给字段赋值,一个
let源 = Excel.Workbook(File.Contents("C:\Users\liqi8\Desktop\0524-Power BI数据加工及数据汇总分析-\Power BI数据加工及数据汇总分析\Power Query数据处理\身份证号码练习数据.xlsx"), null, true),身份证号码_Sheet = 源{[Item="身份证号码",Kind="Sheet"]}[D
Power BI--Power Query思维导图
[条件格式]突出显示、数据条、色阶、图标集等,很好用要点:1.绝对引用与相对引用;2.应用区域与新建规则中公式的区域一致 [多条件求和]sumif、sumifssumif(条件区域,条件,[求和区域]):当求和区域与条件区域一致时,可省略求和区域sumifs(求和区域,条件区域1,条件1,...):条件之间的关系是and[多条件计数]countif、countifscountif(
入门级的意思是该工具是可视化工作者必须掌握的技能,难度不一定小、门槛也不一定低。相反,对于可视化大拿来说,这些工具依旧起到四两拨千斤的妙用。Excel别以为EXCEL只会处理表格,你可以把它当成数据库,也可以把它当成IDE,甚至可以把它当成数据可视化工具来使用。它可以创建专业的数据透视表和基本的统计图表,但由于默认设置了颜色、线条和风格,使其难以创建用于看上去“高大上”视觉效果。尽管如此,我
在踏实装逼的路上每天进步一点点^^💛(常用的普罗大众都知道的就不作记录了,只记可能相对生疏的或日常生活用语中不太常用的词汇。)
L0范数是指向量中非0的元素的个数。如果我们用L0范数来规则化一个参数矩阵W的话,就是希望W的大部分元素都是0。这太直观了,太露骨了吧,换句话说,让参数W是稀疏的。OK,看到了“稀疏”二字,大家都应该从当下风风火火的“压缩感知”和“稀疏编码”中醒悟过来,原来用的漫山遍野的“稀疏”就是通过这玩意来实现的。但你又开始怀疑了,是这样吗?看到的papers世界中,稀疏不是都通过L1范数来实现吗?脑海里是不
岭回归是一种可用于共线性数据分析的有偏估计回归方法,它是一种改良的最小二乘估计法,通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,对条件数很大(病态数据)的拟合要强于最小二乘法。 在线性回归问题中,最小二乘法实际上是最小化问题: a 而岭回归则是加入了L2惩罚项: a 这样参数
解决方法:1、打开开始菜单,找到命令提示符(或搜索cmd),右键选择 以管理员身份运行,打开命令提示符 2、输入dir命令,显示所有文件,再输入my.ini回车打开该文件 3、在[mysqld]下面加上 skip-grant-tables 用于跳过密码,保存后关闭my.ini文件 4、在小黑框中输入以下命令,重启mysql
1.打开电脑搜索框,搜索office,打开 2.选择 OneNote 3.将所需要提取文字的图片复制进笔记本,右键“复制图片中的文本” 识别效果如下, OneNote是一个office提供的笔记软件,用于平常上课记录笔记也是挺不错的,截图还能快速转换成文字(但对复杂文本并不十分友好),操作简单、方便快速,有需要的朋友可以试试。
关注