数据挖掘总结之主成分分析与因子分析 主成分分析与因子分析 1)概念: 主成分分析概念:主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法。主成分分析(PCA)是一种数据降维技巧,它能 ...
2018-01-12用Python从零实现贝叶斯分类器的机器学习的教程 关于朴素贝叶斯 朴素贝叶斯算法是一个直观的方法,使用每个属性归属于某个类的概率来做预测。你可以使用这种监督性学习方法,对一个预测性建模问题进行概率建 ...
2018-01-12Python字典数据对象拆分的简单实现方法 本文实例讲述了Python字典数据对象拆分的简单实现方法。分享给大家供大家参考,具体如下: 有朋友问了下问题: {\'A1;A2\': \'B\',\'A3\': \'C\'}这种数据结构要拆解成{\' ...
2018-01-11
描述性统计与性能结果分析 LoadRunner中的90%响应时间是什么意思?这个值在进行性能分析时有什么作用?本文争取用最简洁的文字来解答这个问题,并引申出“描述性统计”方法在性能测试结果分析中的应用。 为 ...
2018-01-11
数据挖掘核心算法之一--回归 回归,是一个广义的概念,包含的基本概念是用一群变量预测另一个变量的方法,白话就是根据几件事情的相关程度,用其中几件来预测另一件事情发生的概率,最简单的即线性二变量问题( ...
2018-01-10
使用Python连接MySQL数据库 本篇文章使用python中的pymysql库连接MySQL数据库,并完成建表,数据写入和查询的过程。为了保证内容的完整性,我们将内容分为两个 阶段,第一阶段简单介绍数据的爬取过程。看过之 ...
2018-01-10数据和分析带来五大积极业务成果 当今企业可以收集客户在互联网使用过程中的各种数据。这些信息可能包括移动应用使用情况、网络点击、社交媒体互动等,所有这些数据构成了其所有者独特的数据使用轨迹。然而,就 ...
2018-01-09R语言 表达式对象的求值 eval 模式为 “expression”的对象在Expression objects 有具体定义。它们和引用对象的列表非常相似。 > ex <- expression(2 + 2, 3 + 4) > ex[[1]] 2 + 2 > ex[[2]] 3 + 4 > eval(ex) ...
2018-01-09
以电商为例,数据分析的5个思维方法 数据分析真的很重要,能从一堆看似杂乱的数据里,找到问题并解决问题。从数据上的变化,来判断甄别效果得失;简直是居家旅行,运营生意的必备良品。 首先,我们要知 ...
2018-01-08大数据分析的5个基本方面 1、可视化分析 大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特 ...
2018-01-08R语言之—字符串处理函数 nchar 取字符数量的函数 length与nchar不同,length是取向量的长度 # nchar表示字符串中的字符的个数 nchar(\"abcd\") [1] 4 # length表示向量中元素的个数 length(\"abcd\") [1] 1 l ...
2018-01-07R语言字符串处理常用函数 R语言中常用的字符串处理函数: (1)得到字符串长度:nchar() # 生成示范字符串 (2)剪切字符串:strsplit() # 对字符串进行剪切 (3) 得到子字符串:substr() # 得到子字符 ...
2018-01-07python中如何使用朴素贝叶斯算法 这里再重复一下标题为什么是\"使用\"而不是\"实现\": 首先,专业人士提供的算法比我们自己写的算法无论是效率还是正确率上都要高。 其次,对于数学不好的人来说,为了实现算法 ...
2018-01-06Python合并字符串的3种方法 这篇文章主要介绍了Python合并字符串的3种方法,本文讲解了使用+=操作符、使用%操作符、使用String的\' \'.join()方法3种方法,需要的朋友可以参考下 目的 将一些小的字符串 ...
2018-01-06SPSS非参数检验:单样本 一、概念: 单样本非参数检验使用一个或多个非参数检验识别单个字段中的差别。非参数检验不假定您的数据呈正态分布。非参数检验(Nonparametric tests)是统计分析方法的重要 ...
2018-01-05SPSS非参数检验:独立样本 一、概念: 独立样本的非参数检验是在对总体分布不甚了解的情况下,通过对两组或多组独立样本的分析来推断样本来自的总体的分布等是否存在显著差异的方法。独立样本是指 ...
2018-01-05
用Python的pandas框架操作Excel文件中的数据教程 本文的目的,是向您展示如何使用pandas 来执行一些常见的Excel任务。有些例子比较琐碎,但我觉得展示这些简单的东西与那些你可以在其他地方找到的复杂功能同等 ...
2018-01-04
数据分析报告怎么用 本文是作者基于自身多年数据分析的经验,总结的一体化数据分析框架,简单地介绍下数据分析能分析能落地的几点。enjoy~ 大数据,这个被炒烂了的概念,现如今已被人工智能替代。我们先不讨 ...
2018-01-04Python中的对象,方法,类,实例,函数用法分析 本文实例分析了Python中的对象,方法,类,实例,函数用法。分享给大家供大家参考。具体分析如下: Python是一个完全面向对象的语言。不仅实例是对象,类,函 ...
2018-01-03
Python实现输出程序执行进度百分比的方法 本文实例讲述了Python实现输出程序执行进度百分比的方法。分享给大家供大家参考,具体如下: 对于一些大型的Python程序,我们需要在命令行输出其百分比,显得更加友 ...
2018-01-03【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10