朝阳Tim

E-R关系图的链接关系和select的主表有关系吗?

知识回顾: ER模型,又叫实体联系模型,entity-relationship model,包含了表内字段信息 表与表之前的连接关系,是UML图表关系语言的一种。 链接关系有三种: 1:1 1:n m:n 其中1:1的对应关系在表连接中最不常见,因为不符合表和主键的设计思路 两个具有相同业务属性的表不应该同时存在 最为常见的,是1:n,或者1:*的形式,那么如何判断哪边是1,哪边是*呢?

朝阳Tim

2019-01-31

0.0000 0 5
  • 关注作者
  • 收藏

mysql truncate和delete的区别是什么?

问题描述: truncate和delete都可以快速清除表内数据,那么两者的差别是什么呢?我们以表score来一探究竟: #建表 create table score ( id int(10) unique not null auto_increment, stu_id int(10) not null, c_name varchar(20), grade int(10)

朝阳Tim

2019-01-31

0.0000 0 2
  • 关注作者
  • 收藏

取数需求?数据和数字是一回事吗?

问题描述: 数据分析师在和业务打交道的过程中,往往会涉及“取数”的需求,取的这个数到底是什么呢? “给我xxx这样一份数据”和“给我xxx这样一个数字”指代的对象相同吗? 问题回答: 数字<>数据,数字可以是构成数据的单位,也可以是数据查询的结果,两者紧密相连又不尽相同 业务角度来说,数字=感觉,常常和业务经验有着更为紧密的关系 面对“拍个数出来”的问题,业务人员往往会更得心应手,多少算好

朝阳Tim

2019-01-31

18.7453 1 5
  • 关注作者
  • 收藏

excel如何为单元格隔行填充颜色?

问题描述: 做问卷设计,或是需要打印出来的表格,如果行间距较小很容易读串行,如果能够隔行填充颜色将能更好地增加可读性,如何实现呢? 解决方法一: 条件格式-->使用公式确定要设置格式的单元格-->利用函数进行条件设置格式所在区域 隔行选择的函数:=mod(row(),2)<>0 条件格式可以快速隔行变色,但是也会造成文件大小增大的问题,隔行选取的思路还有很多,例如添加辅助列的思路

朝阳Tim

2019-01-31

0.0000 0 3
  • 关注作者
  • 收藏

excel vlookup速度过慢如何解决?

问题描述: vlookup是业务端做数据处理常用函数,但是在处理几十万的数据时候,特别是内存有限的老机器,会存在运行速度特别慢的情况,如何解决呢? 解决办法: 升级你的内存条 利用pivot将表格结构转变为表结构,再进行vlookup操作 注意勾选“我的表具有标题”

朝阳Tim

2019-01-31

0.0000 0 2
  • 关注作者
  • 收藏

当我们在谈论python可视化时,我们在谈论什么?(1)

python可视化都涉及哪些包? 较为常用的有matplotlib、seaborn、pyecharts和bokeh 先来看maplotlib,最为灵活的包,但是并不容易上手 官方手册:https://matplotlib.org/gallery/index.html 来看seaborn,很多python绘图初学者的最爱,可以轻松画出较为美观的图形 官方手册:http://se

朝阳Tim

2019-01-30

267.4849 1 3
  • 关注作者
  • 收藏

如何利用python画出一个高级的瀑布图?(1)

朝阳Tim

2019-01-30

0.0000 0 0
  • 关注作者
  • 收藏

如何利用python画出一个丰富的双环图?(1)

#构造数据 vals1 = [1, 2, 3, 4] vals2 = [2, 3, 4, 5] vals3=[1] fig, ax = plt.subplots() labels = 'A', 'B', 'C', 'D' #最外层的圆 ax.pie(vals1, radius=1.2,autopct='%1.1f%%',pctdistance=0.9,colors=['r','g','b','c

朝阳Tim

2019-01-30

0.0000 0 0
  • 关注作者
  • 收藏

如何利用python画出一个多变的柱形图?(1)

#载包和数据 import pandas as pd import seaborn as sns titanic = sns.load_dataset("titanic") #设置主题:darkgrid , whitegrid , dark , white , ticks sns.set(style="whitegrid", color_codes=True) # 调整图形大小,长10,高5

朝阳Tim

2019-01-30

8.1288 1 2
  • 关注作者
  • 收藏

python range()和np.arange()区分?

range(start,stop[,step]) 这是一个通用的函数来创建包含算术级数的列表,最常用于for循环 参数必须是整数,step默认为1 numpy.arange([start,]stop,[step,]dtype=None) 在给定的时间区域内返回均匀间隔的值 在使用非整数步长的时候,最好用np.linspace() 两者的区别: 返回类型不同,range vs ndarray

朝阳Tim

2019-01-30

0.0000 0 1
  • 关注作者
  • 收藏

excel vlookup的模糊查询如何理解

#=VLOOKUP(D4,$H$4:$I$13,2,TRUE) 模糊查询的理解,就是从下至上查找,比查找值小的第一个值,对应的信息,如图: 从下至上 比查找值小 第一个遇到的值 江雨薇的分数等级A-:88自下往上查找,跳过100、89,找到了比自己(88)小的84,且是该列碰到的第一个数字,因此找到它对应的分数等级A-,进行匹配 此外,如果是精确查找,则是自上往下查找,匹配遇到的第一个值对应

朝阳Tim

2019-01-30

0.0000 0 0
  • 关注作者
  • 收藏

python面试可能会遇到的位运算符计算?

python运算符有七大类,分别是: 算术运算符 比较(关系)运算符 赋值运算符 逻辑运算符 位运算符 成员运算符 身份运算符 其中使用较少,但是常常被用来做面试题的便有“位运算符”,下面我们来看看如何理解它 要理解位运算符,先来理解二进制: 二进制表示60,即为0011 1100,翻译过来就是-- 60=0*2**7 0*2**6 1*2**5 1*2**4 1*2**3 1*2**2

朝阳Tim

2019-01-30

0.0000 0 1
  • 关注作者
  • 收藏

K-means、系统聚类和二阶聚类的适用范围分别是?

K-means聚类:也叫作快速聚类,要求事先选好多少类,例如分3类,那么系统就会生成3个“聚类种子”,然后根据与这3个点的距离远近,把所有的点分成三类,再把这3类的中心(均值)作为新的基石或种子(原来的种子就没用了),重新按照距离分类,如此迭代下去,直到达到停止迭代的要求(比如,各类最后的变化不大了,或者迭代次数太多了) 系统聚类:也叫作分层聚类,开始时有多少点就是多少类,它先把最近的两类(点)

朝阳Tim

2019-01-30

8.1288 1 1
  • 关注作者
  • 收藏

python如何实现excel的“分列”功能?

excel的数据目录下提供“分列”功能,在python中对应的是split函数 #载入包与数据 #分列思路:生成分列后的两列-->与原数据框合并到一起 #步骤一:生成分列后的两列;以“a”为标志对“sex”进行分列,生成“sex_left”和“sex_rght” #步骤二:与原数据框合并到一起 需要注意的是,split作用对象的格式是str,即字符串格式

朝阳Tim

2019-01-30

8.1288 1 2
  • 关注作者
  • 收藏

python list中extend和append的区别?

list.append(object)是指向列表中添加一个对象object list.extend(sequence)是指把一个序列seq的内容添加到列表中 使用append的时候,['g','h','i','j','k']被视作一个整体对象,打包添加到data中 使用extend的时候,['g','h','i','j','k']依次进入data,或者可以理解为“ ”的功能

朝阳Tim

2019-01-30

0.0000 0 4
  • 关注作者
  • 收藏

主成分分析和因子分析的区别?

主成分分析是因子分析的一个特例,因子分析是主成分分析的推广。 因子分析与主成分分析的区别可以简单理解为: 结构/模型 vs 线性组合 要不要解释公因子-->目的在x还是y 公因子数量自己定 vs 公因子数量等于自变量数量 具体来说: 因子分析的因子内容比主成分单纯,社会经济含义比较明确 因子分析的研究者对原始数据的内部结构感兴趣,而主成分分析的研究者对原始变量间的线性组合感兴趣 因子分析需

朝阳Tim

2019-01-30

66.6535 1 1
  • 关注作者
  • 收藏

问题解决思路之“需根解损”(1)

数据分析师说到底是要为企业解决问题的,如果分析工具和模型是硬实力的话,分析思路和经验就是软实力,两者缺一不可。 借鉴辩论思维,为大家介绍一种问题解决思路,即“需根解损”,可以用于选择问题的解决方案。 我们可以把问题拆解为四个方面: 需要:是否是急切需要解决的问题?维持现状问题能否自然消失? 根属:如果不能,原因是什么? 解决:解决问题的方案,可以结合“根属”来判断解决力的强/弱、有/无 损益:权

朝阳Tim

2019-01-30

0.0000 0 3
  • 关注作者
  • 收藏

如何利用excel做四象限分析?(1)

老板想知道在投广告计划的表现如何?哪个最好?哪个最差? 如何利用现有数据满足老板需求呢? 四象限分析是解决思路之一。 该分析思路脱胎于波士顿矩阵,是美国著名的管理学院家、波士顿咨询公司创始人布鲁斯·亨德森于1970年首创;波士顿矩阵以销售增长率和市场占有率将产品划归四类,从而对不同产品进行差异化营销。 四象限还是时间管理理论的一个重要观念,它把事情按照紧急、不紧急、重要、不重要排列组合分成四个象

朝阳Tim

2019-01-30

0.0000 0 4
  • 关注作者
  • 收藏

【推荐】傻瓜式可视化图表——镝数

镝数等可视化模板的出现,降低了交互式图表的制作门槛,为普通人提供了零代码的制作流程 它支持的模板包括: 饼图(环图、人形饼图、双层环图、嵌套饼图) 折线图(分组折线图、阶梯线图、最值折线图、流量关系图) 柱状图(柱状图、瀑布图、玫瑰图、玉珏图) 面积图(面积图、河流图) 散点图(散点图、气泡图) 极坐标图(雷达图) 关系图(力导向图、矩形树图、弦图、旭日图) 桑基图 箱线图 漏斗图 热力图 词云

朝阳Tim

2019-01-30

0.0000 0 3
  • 关注作者
  • 收藏

【推荐】傻瓜式爬虫软件——八爪鱼

八爪鱼的出现,对于爬虫爱好者来说喜忧参半。 喜的往往是初学者,通过点击式操作即可实现数据的采集,降低了掌握爬虫技术的门槛;忧的是懂一些爬虫技术的人,辛苦学来的代码可能还不如做好的模板使用的效率更高。 当然八爪鱼也有局限,例如模板更新慢,可爬取的字段与方式较为有限,以及收费等,爬虫的高级用户可以无视这个软件。 这里仅简单介绍一下这个软件的功能,给爬虫入门者多一个工具参考。 爬虫的原理,是“可见即可

朝阳Tim

2019-01-29

66.6535 1 1
  • 关注作者
  • 收藏
<1567>