sql语句中的主外键关系 主键Primary key,唯一标示一个实体。是保证数据库的实体完整性,保证数据中数据的正确性和合理性,取值非空唯一。 外键Foreign,是用来使表与表之间联系。用来保证数据库的参照完整 ...
2018-03-13
机器学习中的概率问题 机器学习的过程可以理解为计算机通过分析大量的数据获得模型,并通过获得的模型进行预测的过程。机器学习的模型可以有多种表示,例如线性回归模型,SVM模型,决策树模型,贝叶斯模 ...
2018-03-13函数传递参数的三种方式,以及它们的区别 1.按值传递(pass by value) 使用这种方式,调用函数本省不对实参进行操作,也就是说,即使形参的值在函数中发生了变化,实参 的值也完全不会受到影响,仍为调用前的 ...
2018-03-12Python语言中函数的参数传递机制 python有两种对象,immutable 和mutable,前者如number,string,tuple,后者如dictionary,list,下面先来看两个例子。 例1: >>> def func(a ...
2018-03-12
Python的实例方法,类方法,静态方法之间的区别及调用关系 如果只看这个图,很多人可能会看的一头雾水,特别是学过完全面向对象语言的同学, Python 是双面向的,既可以面向函数编程,也可以面向对象编程,所谓面向 ...
2018-03-11Python中类、实例、方法之间的关系 类的强大与否取决于它的功能,我们改进类的方法之一就是给类添加功能。类的功能有一个更为通俗的名字就是方法,在Python中,方法定义在类的定义中,但是只能被实例所调用,调 ...
2018-03-11
用SPSS进行多变量数据分析 1.将所给的数据输入SPSS 22.0中文版。分别设置变量为温度,体重1、2、3、4;体重,温度5、10、15、20、30。 2.用SPSS进行作图(过程略)。 3.对数据进行多因素变量分析, ...
2018-03-10R通过RJDBC连接外部数据库 1、连接hive library(RJDBC) drv<-JDBC(“org.apache.hive.jdbc.HiveDriver”,list.files(“/home/hadoop/impala-jdbc-0.5.2”,pattern=”jar$”,full.names=TRUE,recursive=TR ...
2018-03-10
利用SPSS检验数据是否符合正态分布 正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。 下面我们来看一组数据,并检验“期初 ...
2018-03-09批量数据采集过程中方差的计算 最近项目用需要判断开始数据是否稳定,即采集到的数据是否符合期望,我用方差来判断采集到的数据是否稳定。有两种判断方法:第一种是数据不断的进来,我累积的进行方差计算;第二 ...
2018-03-09python实现定制交互式命令行的方法 Python的交互式命令行可通过启动文件来配置。 当Python启动时,会查找环境变量PYTHONSTARTUP,并且执行该变量中所指定文件里的程序代码。该指定文件名称以及地址可以是随意 ...
2018-03-08因素分析的基本原理&对SPSS因素分析结果的解释 因素分析的基本原理 ●因素分析就是将错综复杂的实测变量归结为少数几个因子的多元统计分析方法。其目的是揭示变量之间的内在关联性,简化数据维数,便于发现规律 ...
2018-03-08影响数据库性能的因素 对于数据库爱好者们,数据库底层的各种细节,内幕,等待事件,隐藏参数等津津乐道,对于调整好一条SQL语句使之在查询优化器/查询引擎下能高性能运转具有巨大的满足感成功感,仿佛自 ...
2018-03-07
利用R进行多元线性回归分析 对于一个因变量y,n个自变量x1,...,xn,要如何判断y与这n个自变量之间是否存在线性关系呢? 肯定是要利用他们的数据集,假设数据集中有m个样本,那么,每个样本都分别对应着一个 ...
2018-03-07
(R语言)图形过程 在Windows下用window()命令可以打开图形窗口。 12.1 高级绘图命令 高级绘图函数,由函数参数提供数据生成一幅完整的图形。其中适当的坐标轴,标签和标题 ...
2018-03-06数据挖掘的数据处理 从数据本身来考虑,数据挖掘通常需要有信息收集、数据集成、数据规约、数据清理、数据变换、数据挖掘实施过程、模式评估和知识表示8个步骤。 步骤(1)信息收集:根 ...
2018-03-06Spss的基本方法使用步骤 由于一次的调研工作,我们的数据分析采用spss的统计分析工具,然后我是一个新人,全都是一步一步从零开始操作的。在学习的过程中简单记录了一点笔记,既然写了,就觉得应该把它保存下 ...
2018-03-05python一行写不下,变多行 python里一行写不下,拆成多行, \\和() 两种方法 在一行末尾 加上“ \\”,也就是空格加上\\ a= \'sdfaf\' \\ \'test\' 注意两个对象都要独立,字符串必须都用双 ...
2018-03-05SPSS编程在Ridit分析中的应用 多样本有序分类资料(或等级资料)我们一般采用非参数检验——H检验(Kruskal-Wallis法),但其结论只得出三组或多组间总的有差别,若要知道两两间是否有差别,则没有Ridit分析只 ...
2018-03-04python中%r和%s的区别 %r用rper()方法处理对象 %s用str()方法处理对象 有些情况下,两者处理的结果是一样的,比如说处理int型对象。 例一: [python] view plain copy print \"I am %d years old.\" % 22 p ...
2018-03-04在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18小陈是某电商平台的数据分析师。老板交给他一个任务:“我们平台的注册用户已经突破1000万了,想了解一下用户的平均月消费金额。 ...
2026-05-18【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13当流量红利消退、用户需求日趋多元,“凭经验决策、广撒网投放”的传统营销模式早已难以为继。大数据的崛起,为企业营销提供了全 ...
2026-05-13 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-05-13在手游行业存量竞争日趋激烈、流量成本持续高企的当下,“拉新”早已不是行业核心痛点,“留存”尤其是“付费留存”,成为决定手 ...
2026-05-12