原文来源|cloudera 译文来源|开源中国社区 最近,我加入了Cloudera,在这之前,我在计算生物学/基因组学上已经工作了差不多10年。我的分析工作主要是利用Python语言和它很棒的科学计算栈来进行的。但ApacheH ...
2015-12-29用户研究定量分析要让数据来说话 无论是产品经理、设计师、工程师,大家都是为用户服务的。用户各有所好。你喜欢这个,我喜欢那个,也有我们都喜欢的。那么在用户的心理隐藏着什么样的秘密呢?要想发现其中的奥 ...
2015-12-29网站运营数据分析之术语解释 做为网站运营、产品经理、交互设计师等职位,经常要对网站的一些运营数据做分析,那么这些公式是如何计算的,每个术语又代表什么意思呢? 一、网站运营数据分析之内容指 ...
2015-12-29数据分析用户需要什么数据 这里首先需要说明的是标题中的“用户”指的是数据的用户,或者数据的需求方,这些用户往往不是网站或企业面向的外部用户,数据的消费者通常是公司内部各个部门和领域的人员。 为什 ...
2015-12-29游戏运营的数据分析 这几天一直在看如何展开数据分析文章,大家写的都不错,说实话,针对如何展开游戏运营数据分析的指导真的非常少,作为每个公司的核心机密是不会拿到台面上与大家分享的,一段时期我上网看了 ...
2015-12-29如何统计和分析利用网络大数据? 大数据给互联网带来的是空前的信息大爆炸,它不仅改变了互联网的数据应用模式,还将深深影响着人们的生产生活。深处在大数据时代中,人们认识到大数据已经将数据分析的认识从“ ...
2015-12-29大数据的五点思考 大数据不在乎体量有多少,而是背后用它的那个大脑。实则大众对大数据依然存在不少误解。刘得寰教授在微博上发表了其对大数据的五点思考(后续可能还有更新),对近期大数据被大众捧为瑰宝的 ...
2015-12-29交互设计师如何培养数据分析的能力呢 面对一大堆看似杂乱的数据,如何进行信息提取与数据加工,从中获取自己想要的信息,并应用这些信息,有理有据的进行需求的讨论、最终设计决策的推进,这是每一个交互设计师 ...
2015-12-29数据分析-时间序列的趋势分析 无论是网站分析工具、BI报表或者数据的报告,我们很难看到数据以孤立的点单独地出现,通常数据是以序列、分组等形式存在,理由其实很简单,我们没法从单一的数据中发现什么,用于 ...
2015-12-29数据分析、机器学习与物联网 我们当前所处的世界,联网程度不断上升,低成本传感器和分布式智能也在不断普及,产业即将面临这一切带来的革命性的冲击;同时,在此过程中还会产生大量的数据,其规模将庞大到 ...
2015-12-29车联网谈物流O2O三大关键词:产业链、大数据、生态化 自国务院总理李克强提出互联网+以来,越来越多的传统行业开始拥抱互联网,而O2O则是被采用最为普遍的模式之一。2013年以来,传统行业向互联网转型的企业和 ...
2015-12-29asp.net生成Excel并导出下载五种实现方法 有关Excel下载的文章网上想必有很多,利用闲暇时间整理了一些有Excel下载方法的文章,接下来介绍五种实现Excel下载的方法,感兴趣的朋友可以了解下,或许对你学习Exce ...
2015-12-28excel if函数怎么用?excel中if函数的使用方法图文详解 excel中的if函数的主要用途是执行逻辑判断,它可以根据逻辑表达式的真假,返回不同的结果,从而执行数值或公式的条件检测任务,那么excel if函数怎么用呢 ...
2015-12-28别落后了,开始你的第一方数据分析 一、有哪些第一方数据? 我们常说数据驱动决策,首要的就是选择利用什么数据,今天这里主要探讨的就是用“第一方数据”来驱动决策。第一方数据简单来理解就是自有数 ...
2015-12-28数据分析面试题:如何从10亿查询词找出出现频率最高的10个? 1. 问题描述 在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通 ...
2015-12-28打赢人脑的大数据 大数据的出现,将不可能变成可能!事实上,大数据的威力不在于数据本身,而在于所带来的机器智能,期望它能够如人类的大脑一样运作,能根据分析结果给出最优化的解决办法。 1996 ...
2015-12-28大数据具海量规模 大数据(Big Data),或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法透过人工,在合理时间内达到撷取、管理、处理、并整理成为人类所能解读的形式的资讯。一般而 ...
2015-12-28数据是企业未来核心资产,数据就是价值 近年来,无论商界还是政界,对大数据的高度关注与价值利用表现得越来越热切。大数据概念火热的背后,折射出在市场竞争相对饱和的新时期,企业获取新客户比 维护老客户的 ...
2015-12-28那么多大数据公司“买数据” 怎么保护数据隐私? 数据是什么?是金子,也就是钱啊! 最近统计来看,全国已经有三百多家大数据公司,但在大数据发展初期这个情况下,国内大数据交易的现状是:供不应求 ...
2015-12-28大数据分析:O2O专车司机究竟是一群怎样的人 近两年来,互联网技术不断深入社会生活的各个层面,为时代发展注入新的活力。“互联网+交通”领域出现的出行服务软件显现出强大的活力,“专车”“快车”“顺风车” ...
2015-12-28在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10