使用数据进行决策时要避免3个陷阱 如今,数据不仅仅是营销领域的一个流行语。为了实现业务运作良好,企业需要关注如何改进,有效收集和分析数据。如果获得数据并使用它却没有促进改变,那么收集数据就没什么意 ...
2018-01-04为什么R语言是学习数据分析的第一选择 专注于一种编程语言的原因是,你需要更多地关注过程和技术,而不是语法。你需要掌握如何通过数据科学工具来分析数据,以及如何解决问题。事实证明,R语言是最佳的选择。 ...
2018-01-04汽车制造厂商使用大数据的5个创新思路 随着如今迅速发展的技术,现代汽车已经成为带有轮子、安全气囊与乘客空间的计算机。运用在汽车上的创新可以为司机规划安全路线、播放卫星广播、连接手机免提功能、使汽车 ...
2018-01-03数据科学家是干什么的?听七位受欢迎的专业人士发表见解 我们来跟上这些从事该职业的独角兽的步伐,了解使他们取得成就的工作、技能和教育。 来会一会数据科学家 我们中的很多人上大学时,那时没有数据科 ...
2018-01-03对于大数据,你必须要明白 大数据目前的技术和应用都是在数据分析、数据仓库等方面,主要针对OLAP(Online Analytical System),从技术角度来说,包含两条腿:一条腿是批量数据处理(包括MR、MPP等),另一条 ...
2018-01-02大数据打开存储市场新空间 以大数据在全球的发展状态来看,可谓是风声水起,中国大数据发展的步伐也越来越快。虽然目前中国大数据市场还处在初级阶段,但发展迅猛,应用极其广泛,不管是云计算、物联网、智慧城 ...
2018-01-02影响数据检索效率的几个因素 数据检索有两种主要形态。第一种是纯数据库型的。典型的结构是一个关系型数据,比如 mysql。用户通过 SQL 表达出所需要的数据,mysql 把 SQL 翻译成物理的数据检索动作返回结果。 ...
2018-01-01对于大数据来说 分析才是核心 对于大数据,量的增长是很多人对大数据的第一个印象,数据不仅仅是增长的量,增长的速度,以及信息的结构和难度等都在增长,原本数据是分散的,渐渐全部被重新整合,数据需要被重 ...
2018-01-01改变思维有效监控数据中心 企业希望在难题出现之前,智能分析功能可以将企业的系统监控提升到一个全新的水平。如今,适当进行产能规划以保持平稳运行,是IT部门一个非常重要的能力。除了实现IT目标和业务目标以 ...
2017-12-31什么是机器学习:一次权威定义之旅 在这篇文章中,我想要解决一个很简单的问题:机器学习是什么? 你可能对机器学习感兴趣或者稍稍了解。如果有一天你和朋友或同事聊起机器学习,那么一些人可能会问你“机器 ...
2017-12-31基于标记数据学习降低误报率的算法优化 无论是基于规则匹配的策略,还是基于复杂的安全分析模型,安全设备产生的告警都存在大量误报,这是一个相当普遍的问题。其中一个重要的原因是每个客户的应用场景和数据都 ...
2017-12-30全球各行业2020年将需要270万位数据科学家 你准备好步入蓬勃发展的大数据的职业生涯了吗?这个对数据科学家职位的研究就是一个很好的开始。 什么是数据科学家?如果你有分析数学的天赋,为什么不考虑成为一名 ...
2017-12-30大话数据中心网络三大新技术 这几年,云计算、大数据、虚拟化等新技术让人看得眼花缭乱,所有这些技术都要依托数据中心为基础来得以实现。俗话说“经济基础决定上层建筑”,数据中心网络是实现这些功能的基础, ...
2017-12-29理理大数据的脉络 先看看商业智能大数据的生意到底是啥?说白了就是数据分析(analytics)的生意,原来的商业智能(business intelligences)也是分析的生意,如果把原来的商业智能称为分析1.0,那大数据其实就是分 ...
2017-12-29揭穿数据分析的12个神话 在IT业界中,炒作越多,误解就越多,数据分析也不例外。作为当今IT技术最热门的方向之一,数据分析可以带来显著的业务收益,但是带来的误解可能也会阻碍顺利地、及时地交付可能让业务用 ...
2017-12-28大数据变现给了数据建模者自证价值的最好机会 从 BI 时代开始,笔者曾经做过取数,报表,建模,挖掘,分析等各类数据支撑工作,有个问题一直萦绕心中,数据支撑者如何证明自己工作的价值。 一、关于量 ...
2017-12-28大数据量快速处理的架构设计 在业务数据的处理过程中,经常会遇到夜间批次处理大量的数据,而且会有时效的要求。特别是当应用系统跑了2年以上时,就会有大表或者特大表的操作了,数据量达到百万甚至上亿。 这 ...
2017-12-27大数据在金融行业的应用与挑战 A 具有四大基本特征 金融业基本是全世界各个行业中最依赖于数据的,而且最容易实现数据的变现。全球最大的金融数据公司Bloomberg在1981年成立时“大数据”概念还没有出现 ...
2017-12-27大数据量最近的存储分表常见算法 当一个应用的数据量大的时候,我们用单表和单库来存储会严重影响操作速度,如mysql的myisam存储,我们经过测试,200w以下的时候,mysql的访问速度都很快,但是如果超过200w ...
2017-12-26【金融数据】挖掘数据价值,打造智能银行 今天移动互联网正狂飙突进、网上购物平台和网上社交平台也方兴未艾,包括结构化数据、半结构化数据、非结构化数据的大数据爆炸式增长。早在2012年,大数据已经登上美国 ...
2017-12-26Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23