几个大数据误区值得让你深入思考 从大数据的出现开始,对大数据的争议似乎就一直未断过,似乎每家软件厂商、每家咨询公司,以及每个思想领袖都在尝试着对“大数据”做出准确的定义。尽管目前还没有出现这样的 ...
2018-03-19本人用到了spss重要功能总结 一、SPSS篇 (1)用spss剔除异常值 异常值:一组观测值中与平均值的偏差超过两倍标准差的测定值。 一、analyze>>descriptivestatistics>>descriptives>>选择变量(列 ...
2018-03-19统计学与大数据分析 谈大数据分析之前我想应该说一说统计学。统计学到底是怎样一种学问呢。先看看我们的周围,其实有无限多的数据。所谓数据呢就是一系列数字的集合或者符号的集合体。我们傻傻的看着这些数据也 ...
2018-03-19详解Python中列表和元祖的使用方法 list Python内置的一种数据类型是列表:list。list是一种有序的集合,可以随时添加和删除其中的元素。 比如,列出班里所有同学的名字,就可以用一个list表示: >>> classma ...
2018-03-19python创建列表并给列表赋初始值的方法 这篇文章主要介绍了python创建列表并给列表赋初始值的方法,涉及Python列表的定义与赋值技巧分享给大家供大家参考。 具体如下: aList = [123, \'abc\', 4.56, [\'in ...
2018-03-19大数据遍地开花 引领新兴领域发展 大数据与我们的生活密不可分,时时刻刻在影响着我们的生活,在科技领域和产业升级中扮演者重要角色,如今大数据已经是遍地开花,在新兴领域正释放着巨大潜力。 大数据遍地 ...
2018-03-19数据预处理的一些方法 现实世界中,数据集存在着不完整、包含噪声和不一致等特点,无法直接用来挖掘知识。收集数据的设备可能出故障,人为输入数据时出错或缺失,数据传输中引起的错误都将造成数据集含有不正确 ...
2018-03-19大数据项目为何失败 在大数据方面,关于内存计算以及开源Hadoop等,宝立明也发表过很多独特的见解。在厂商的发言人当中,宝立明也是为数不多能够将技术深入浅出解释清楚的人之一。他近期在DataInformed网站上发 ...
2018-03-19python通过加号运算符操作列表的方法 本文实例讲述了python通过加号运算符操作列表的方法。分享给大家供大家参考。具体如下: li = [\'a\', \'b\', \'mpilgrim\'] li = li + [\'example\', \'new\'] print li ...
2018-03-19python中子类调用父类函数的方法示例 本文主要给大家介绍了关于python子类调用父类函数的相关内容,Python中子类中的__init__()函数会覆盖父类的函数,一些情况往往需要在子类里调用父类函数。下面话不多说了 ...
2018-03-19数据中心削减成本的技巧 很多企业的IT管理者都会发现,随着自身企业的增长,数据中心站点越来越难以管理,甚至有的企业的IT管理者对于自身的数据中心站点都以感到无从下手。数据中心的空间、电力、制冷、设备之 ...
2018-03-19Python实现的多线程同步与互斥锁功能示例 这篇文章主要介绍了Python实现的多线程同步与互斥锁功能,涉及Python多线程及锁机制相关操作技巧,。 分享给大家供大家参考,具体如下: #! /usr/bin/env pyth ...
2018-03-18Python中多线程及程序锁浅析 Python中多线程使用到Threading模块。Threading模块中用到的主要的类是Thread,我们先来写一个简单的多线程代码: 复制代码代码如下: # coding : uft-8 __author__ = \'Phti ...
2018-03-18举例讲解Python中的死锁、可重入锁和互斥锁 一、死锁 简单来说,死锁是一个资源被多次调用,而多次调用方都未能释放该资源就会造成死锁,这里结合例子说明下两种常见的死锁情况。 1、迭代死锁 该 ...
2018-03-18R语言之逐步回归 逐步回归就是从自变量x中挑选出对y有显著影响的变量,已达到最优 用step()函数 导入数据集 cement<-data.frame( X1=c( 7, 1, 11, 11, 7, 11, 3, 1, 2, 21, 1, 11, 10), X2=c(2 ...
2018-03-18R语言的数据导入与导出学习笔记 福尔·摩斯曾说过:“数据,数据,没有数据的推理是罪恶!”不过比起有意思的统计分析,数据的导入与导出显得十分的无趣,但是不得不说统计分析的数据导入与导出是个让人沮丧的 ...
2018-03-18两个矩阵相乘算法 本来是处理两个矩阵的连乘求如何加括号使得中间的运算次数最少的问题,但是突然想到实现一下如何求连个矩阵连乘的算法,就实现了一下,挺简单的: 注意程序围绕的思想: 1.两个矩阵相乘,前 ...
2018-03-18线性代数之从线性方程组看线性组合 对于一个线性方程组,我们可以通过画出每条方程所代表的曲线,所有曲线的交点就是该线性方程组的解。这种做法可以看做是对矩阵方程Ax = b 的行解法。如果从列的角度看,就是 ...
2018-03-18数据分析对医疗行业做出的美好承诺 要说最有可能从不同数据来源中获取信息并通过分析受益的行业,医疗服务无疑是当之无愧的优胜者。但仅仅拥有这样的意愿还不够,从业人士还需要为可能出现的艰难险阻做好准备。 ...
2018-03-18R语言数据对象与运算 R语言数据对象与运算 笔记整理 2.1 数据对象及类型 R语言创建和控制的实体被称为对象(object) ls()命令来查看当前系统里的数据对象 R对象的名称必须以一个英文字母打头,并 ...
2018-03-18在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29