R二项分布检验与FDR校正 R语言二项分布检验与FDR校正 二项分布是重复n次的实验,且每次实验都是独立的,只有两种结果,并且相互对立的,生活中最常见的是投硬币~~~在生物领域内也有很多符合此类分布的,如 ...
2018-03-12R语言中执行二项分布检验 我们在做某项决定时, 我们希望证明给出的假设并不是偶然成立,而是具有统计显著性.在假设检验中存在两种假设:原假设以及备择假设(称为研究假设),假设检验的结果的目的是验证实验 ...
2018-03-12sql的三种关联查询 sql表之间的关联查询分为两种:内联,和外联。 内联接:左边有右边没有或者左边没有右边有的情况下都不显示。 外联接:又分为左外联接,右外连接和全外联接。 ...
2018-03-12函数名作为参数传递与回调函数 成员函数名不能作为参数传递,否则会发生错误,因为里面隐藏着一个this 指针 回调函数,就是由你自己写的。你需要调用另外一个函数,而这个函数的其中一 ...
2018-03-12函数传递参数的三种方式,以及它们的区别 1.按值传递(pass by value) 使用这种方式,调用函数本省不对实参进行操作,也就是说,即使形参的值在函数中发生了变化,实参 的值也完全不会受到影响,仍为调用前的 ...
2018-03-12Python语言中函数的参数传递机制 python有两种对象,immutable 和mutable,前者如number,string,tuple,后者如dictionary,list,下面先来看两个例子。 例1: >>> def func(a ...
2018-03-12互联网大数据“比你更懂你” 但是,也可能“杀熟”没商量 大数据时代,各类电商及垂直服务网站,利用大数据进行低成本高效率运营、做到千人千面地满足用户个性化的消费与选择需求,一切看起来都是那么的美好。然而 ...
2018-03-12大数据将推动零售业技术变革 建设强大的数据中台,实现线上线下数字化打通,重构“人、货场”,是新零售的重要内涵。业内人士指出,2018年将是大数据从技术阶段向应用阶段高速发展的一年,大数据未来在物联网、 ...
2018-03-12【北京酷车易美网络科技有限公司】招聘数据分析师 北京酷车易美网络科技有限公司”是一家专业的车辆历史数据查询平台,依托公司长期积累的广泛、稳定的数据渠道和强大的数据整合、分析能力,为广大二手车经销商和电 ...
2018-03-11【杭州佳航互联网金融信息服务有限公司】招聘数据分析师 杭州佳航互联网信息服务有限公司是一家杭州本土的初创期互联网金融企业,2015年11月成立,先后取得互联网金融等牌照,经营范围如下:互联网金融信息服务(由 ...
2018-03-11【杭州亦橙电子商务有限公司】招聘数据分析师 2012年12月6日,杭州亦橙电子商务有限公司旗下品牌——港仔文艺男(ARTS MAN)诞生。公司定位以男装为核心,电子商务为渠道,女装、鞋类、配饰多远化发展的战略目标,聚 ...
2018-03-11R语言自定义函数,利用QQ图和shaprio.test检验正态分布 代码 #自定义函数 norm.test<-function(data,alpha=0.05,pic=TRUE){ #alpha为显著性水平,这里的默认值为0.05 if(pic==TRUE){#画图 ...
2018-03-11使用R完成正太分布检验 什么是正太分布检验? 判断一样本所代表的背景总体与理论正态分布是否没有显著差异的检验。 方法一概率密度曲线比较法 看样本与正太分布概率密度曲线的拟合程度,R代码如下: nor ...
2018-03-11用R检验配对股票的协整性 基于统计套利的配对交易策略是一种市场中性策略。具体地说,是指从市场上找出历史股价走势相近的股票进行配对,当配对股票价格差(Spread)偏离历史均值时,则做空股价偏 ...
2018-03-11大数据就意味着更大的安全风险吗 现如今,围绕着大数据分析所涉及到的相关隐私问题存在着许多的担忧:企业和各国的政府机构是否有权获得如此广泛的个人和群体信息?同时,对于他们收集和处理这些数据信息是否 ...
2018-03-11大数据促新质战斗力生成 现代战争是体系之间的全面对抗,对手之间的博弈已经不在“视距”范围,各类武器装备必须在情报信息的引导下才能充分发挥作战效能。而大数据就是提供情报信息的重要手段。 大数 ...
2018-03-11使用R对共线性检验 高维数据常会出现共线性 、变量选择等问题 。如何消除共线性确定最佳模型,是回归分析的一个重点。 传统的最小二乘估计在处理多重共线性问题上 往往有令人不太满意的地方, 主要有两点: ...
2018-03-11R做线性回归及检验 使用R对内置鸢尾花数据集iris(在R提示符下输入iris回车可看到内容)进行回归分析,自行选择因变量和自变量,注意Species这个分类变量的处理方法 ## 将iris数据加载进 ...
2018-03-11再识大数据 如果说在工业时代,生产原料是基于大自然馈赠的各种原子的产物,那么在信息时代,最基本的生产原料就是比特。而在比特之上,是承载各种信息价值的数据。对于信息时代的人们来说,没有什么比获得数据 ...
2018-03-11Python的实例方法,类方法,静态方法之间的区别及调用关系 如果只看这个图,很多人可能会看的一头雾水,特别是学过完全面向对象语言的同学, Python 是双面向的,既可以面向函数编程,也可以面向对象编程,所谓面向 ...
2018-03-11在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30