大数据的常见处理流程 具体的大数据处理方法其实有很多,但是根据长时间的实践,笔者总结了一个基本的大数据处理流程,并且这个流程应该能够对大家理顺大数据的处理有所帮助。整个处理流程可以概括为四步,分 ...
2015-12-18BI的三个层次–数据报表、数据分析、数据挖掘 经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的crm、ERP、OA等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据 ...
2015-12-18大数据分析 让精准营销进入企业 新的营销拓展软件帮助公司从普通销售方法中挖掘出价值——使它们牢牢掌握现有客户。 2013年,Russ Hearl开始尝试扩大自己的公司——位于旧金山的Double Dutch,建立一个面向 ...
2015-12-18从支付宝数据分析网购消费者行为 没有消费者,交易便无法成立,对于商家而言,关于消费者的数据至关重要。曾经,获取一份消费者报告需要通过漫长而周密的调研,而随着电商的不断发展,数据量级不断增大,服 ...
2015-12-18BI对数据的分析处理包括哪些方面内容 近几年,中国市场风起“云”涌,在人们不知所“云”和一知半解之际,“云”就以弥漫的姿态瞬间遍布市场,云数据、云杀毒、云输入法、云电视、云报销等,早已成为人 ...
2015-12-18从用户角度看BI系统中数据分析模型的层次 在BI商业智能系统中,面向分析的数据模型一般是多维数据分析模型,分析模型由相应分析领域的分析维度(见附1)和分析指标(见附2)组成。针对面向不同层级用户的需 ...
2015-12-18大数据的四大维深度解析 数量也许是与大数据最相关的特征,指企业为了改进企业中的决策而试图利用的大量数据。数据量持续以前所未有的速度增加。 涵盖这四个维度有助于定义和区分大数据: ...
2015-12-18R语言与机器学习学习笔记2(分类算法) 当实际输出与期望输出不符时,进入误差的反向传播阶段。误差通过输出层,按误差梯度下降的方式修正各层权值,向隐藏层、输入层逐层反传。周而复始的信息正向传播和误 ...
2015-12-17R语言与机器学习学习笔记1(分类算法) 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能 ...
2015-12-17数据挖掘从入门到进阶 要看什么书 做数据挖掘也有些年头了,写这篇文一方面是让我写篇文,朋友作为数据挖掘方面的参考,另一方面也是有抛砖引玉之意,希望能够和一些大牛交流,相互促进,让大家见笑了 ...
2015-12-17多元逻辑回归模型的应用误区 多元逻辑回归模型的理论前提相对判别分析法要宽松得多,且没有关于分布类型、协方差阵等方面的严格假定。不过,在大量运用多元逻辑回归的研究中往往忽视了另一个相当重要的问题 ...
2015-12-17对license数据的挖掘与分析 这里所称的数据分析泛指那些将数据转化为信息或知识的计算机应用系统(也可称之为商业智能应用,BusinessIntelligence/BI),包括决策支持、联机分析、查询与报表、预测分析、专业 ...
2015-12-17数据分析离不开商业分析 目前有些人关心行为数据,也有些人关心商业数据,但较少人把行为数据和商业数据联系起来看。大家往往只单纯看某一端数据。但是看数据走火入魔的人 会明白,每个数据,就 ...
2015-12-17大数据的七大核心应用价值 随着移动互联网的飞速发展,信息的传输日益方便快捷,端到端的需求也日益突出,纵观整个移动互联网领域,数据已被认为是继云计算、物联网之后的又一大颠覆性的技术性革命,毋庸置疑 ...
2015-12-17大数据七大趋势令人振奋 跟着小编一起来展望2016年大数据发展的七大趋势。 1.算法(Algorithms)的崛起 大数据已过时,算法正当道。数据已经成为一种商品,每个组织都能够收 ...
2015-12-17大数据时代数字广告产业的三种模式与战略 大数据时代的到来,正在深刻改变中国广告产业的竞争格局。随着越来越多的广告主将营销预算向新媒体广告倾斜,数字广告产业将会迎来发展的黄金时期。数字广告 ...
2015-12-17移动互联时代 大数据的应用价值 随着大数据的发展,企业也越来越重视数据相关的开发和应用,从而获取更多的市场机会。一方面,大数据能够明显提升企业数据的准确性和及时性;此外还能够降低企业的交易摩 ...
2015-12-17用Excel做数据分析—直方图 使用Excel自带的数据分析功能可以完成很多专业软件才有的数据统计、分析,这其中包括:直方图、相关系数、协方差、各种概率分布、抽样与动态模拟、总体均值判断,均值推断、线性 ...
2015-12-16在Excel中设置字符上、下标的方法 和Word不同,Excel的“格式”菜单中没有直接设置字体格式的命令,格式设置存在于“单元格格式”对话框中。单元格中上下标的设置也需要在此对话框中进行,下面给大家简要 ...
2015-12-16数据分析:分析数据?当心这两个误区 平时无论是进行用户调研、产品运营还是竞品分析,都少不了对于数据的分析,如果项目中出现某些分歧谁也无法说服谁时,很多时候也都是拿数据说话,可见在开发产品的时候,对 ...
2015-12-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30