五分钟带你看懂什么是区块链 如今区块链技术非常流行。那么让我们看到这几个问题: · 区块链究竟是什么? · 工作原理是什么? · 解决什么问题? · 有什么用途? 附有中文字幕的视频如下: ...
2018-01-10基于R统计分析—探索性数据分析 数据的统计分析分为描述性统计分析和统计推断两部分, 前者又称为探索性统计分析, 它是通过绘制统计图形、编制统计表格、计算统计量等方法来探索数据的主要分布特征, 揭示 ...
2018-01-10关于数据治理,你需要知道些什么 每个有效的数据库都需要精心设计的模式(Schema),以保持数据干净,避免冲突,满足用户的各种需求,适应未来的扩展。同样,每个有效的企业数据计划都离不开数据治理,也就是精心 ...
2018-01-10硅谷资深数据科学家教你认清探索性数据分析(EDA)的价值 从外表来看,数据科学通常被认为完全是由高等统计学和机器学习技术组成。然而,另一个重要组成部分往往被低估或遗忘:探索性数据分析(EDA)。EDA指对已 ...
2018-01-10降低数据中心的复杂性:运用基于策略的管理 策略能够让IT团队更有效地管理虚拟机的可用性、安全性以及其他组件。企业可以采取本文提及的策略来降低数据中心 的复杂性。 随着数据中心的不断发展,变得越来越复 ...
2018-01-10大数据+分析学 数字油田的两把利剑 在石油和天然气行业,数据都是以太字节(TB)和拍字节(PB)来表示的。这两个词语对于你来说或许有些陌生,下面我给你打个比方,一切就清晰明了了。 一个吉字节(GB)相当于七分 ...
2018-01-10数据挖掘核心算法之一--回归 回归,是一个广义的概念,包含的基本概念是用一群变量预测另一个变量的方法,白话就是根据几件事情的相关程度,用其中几件来预测另一件事情发生的概率,最简单的即线性二变量问题( ...
2018-01-10大数据分析思路的4点心得 大数据分析能力对于一名产品经理来说是最基本的能力。 在面试的过程中,社招会有面试官会问你以往你负责的产品的相关数据,如何看待这些数据,如何通过这些数据来做接下来的产品优化 ...
2018-01-10使用Python连接MySQL数据库 本篇文章使用python中的pymysql库连接MySQL数据库,并完成建表,数据写入和查询的过程。为了保证内容的完整性,我们将内容分为两个 阶段,第一阶段简单介绍数据的爬取过程。看过之 ...
2018-01-10用Python实现一个大数据搜索引擎 搜索是大数据领域里常见的需求。Splunk和ELK分别是该领域在非开源和开源领域里的领导者。本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家理解大数据搜索的 ...
2018-01-10【上海翼依信息技术有限公司】招聘数据分析师 Hitales(上海翼依信息技术有限公司)成立于2014年9月12日,打造中国最领先的医疗大数据平台。Hitales取名自Hippocrates(希波克拉底,古希腊医学家,被誉为医学之父) ...
2018-01-09【上海力程机电设备工程有限公】招聘数据分析师 LC M&E成立于2006年,集“设计、销售和系统工程服务”于一体,产业涵盖“暖通、电气、能源、机电一体化”四大领域。公司以人为本,进行了持之以恒地探索、创新与实践 ...
2018-01-09【北京小泽文化艺术有限公司】招聘数据分析师 北京小泽画室暨北京小泽文化艺术有限公司。是经过北京市工商局注册的正规美术培训机构。画室创建于2003年,秉承“用升学率定义王者”的理念,专注成绩,致力于打造北京 ...
2018-01-09什么是列联表 列联表又称交互分类表,所谓交互分类,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。 这里是按两个变量交叉分 ...
2018-01-09SPSS—描述性统计分析—频数分析 描述性统计量 分类 集中趋势分析——中心趋势的数值度量 反映一组数据向某一位置聚集的趋势,主要的统计量有均数(mean)、中位数(median)、众数(mode)、总 ...
2018-01-09利用excel和spss删除频数小的数据 1.先对excel数据表进行处理 2.保存文件,然后用spss打开 3.spss->数据->选择个案->进入If条件 4.设置IF条件,如果标记=2,点击继续 5.删 ...
2018-01-09R语言 画图时常用命令 生成图片 存储图片 存储图片格式 存储位置的方式 画图的常用命令 第一种png格式 png(file=\"myplot.png\", bg=\"transparent\") 画图程序 dev.off() 第二种jpeg格式 jpeg(fil ...
2018-01-09未来物联网、人工智能无法迈过的技术是什么 未来50年,互联网、物联网、人工智能都无法迈过的技术是什么? 大数据应用! 一、什么是大数据? 大数据是指以服务重大决策为目的,需要新型数据处理方法才能 ...
2018-01-09数据和分析带来五大积极业务成果 当今企业可以收集客户在互联网使用过程中的各种数据。这些信息可能包括移动应用使用情况、网络点击、社交媒体互动等,所有这些数据构成了其所有者独特的数据使用轨迹。然而,就 ...
2018-01-09常用排序算法比较与分析 一、常用排序算法简述 下面主要从排序算法的基本概念、原理出发,分别从算法的时间复杂度、空间复杂度、算法的稳定性和速度等方面进行分析比较。依据待排序的问题大小(记录数量 n)的 ...
2018-01-09在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29