Python 爬取了马蜂窝的出行数据,告诉你这个夏天哪里最值得去 正值火辣的暑假,朋友圈已经被大家的旅行足迹刷屏了,真的十分惊叹于那些把全国所有省基本走遍的朋友们。与此同时,也就萌生了写篇旅行相关的内容 ...
2018-08-14
花式玩逻辑回归之不是只能做二分类 最近忙了一些,懒也有啦,就没怎么看书,发现一些新的东西,所以更新慢了,之前有个朋友叫我写避免过拟合,但是这个题目真的好广泛,我还没看透,所以这个可能后续再写,今天 ...
2018-08-14
统计学上的P值的含义通俗 首先解释下“有统计学意义”和“显著差异” 两个概念: ”有统计学意义\"和\"差异显著\"是两个不同的概念,\"差异显著\"易给人一种误导, 原来两概念在统计学中经常有点通用,现在明确 ...
2018-08-14
假设检验中的P值 与显著性水平的联系 假设检验是推断统计中的一项重要内容。用SAS、SPSS等专业统计软件进行假设检验,在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另 ...
2018-08-14
python numpy 一维数组转变为多维数组的实例 今天小编就为大家分享一篇python numpy 一维数组转变为多维数组的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 如下所示: import n ...
2018-08-14python中numpy的矩阵、多维数组的用法 1. 引言 最近在将一个算法由matlab转成python,初学python,很多地方还不熟悉,总体感觉就是上手容易,实际上很优雅地用python还是蛮难的。目前为止,觉得就算法仿真研 ...
2018-08-14
基于Python中numpy数组的合并实例讲解 下面小编就为大家分享一篇基于Python中numpy数组的合并实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧 Python中numpy ...
2018-08-14企业大数据应用三段论 随着云计算、物联网和开源大数据技术生态的高速发展,企业获得大数据相关基础设施技术和服务越来越容易。虽然现阶段大数据成熟应用多在互联网公司,但我们需认识到,一方面,大数据应用是 ...
2018-08-14
数据分析方法论:你真的懂 Session(会话) 分析吗 在数据分析领域,Session是一种专业的数据分析。对于有数据驱动意识的互联网人来说,这并不陌生——Session 即会话,是指在指定的时间段内在网站上发生的一系 ...
2018-08-14
盘点机器学习中那些神奇的损失函数 我最近在学习R语言,但是估R语言我应该没能跟sas一样玩那么好。今天来更新在机器学习中的一些专业术语,例如一些损失函数,正则化,核函数是什么东西。 损失函数:损失函 ...
2018-08-14
机器学习中的损失函数 损失函数(loss function)是用来估量你模型的预测值f(x)与真实值Y的不一致程度,它是一个非负实值函数,通常使用L(Y, f(x))来表示,损失函数越小,模型的鲁棒性就越好。损失函数是 ...
2018-08-13
机器学习中的参数与超参数之间的区别 机器学习中的模型参数和模型超参数在作用、来源等方面都有所不同,而模型超参数常被称为模型参数,这样,很容易对初学者造成混淆。本文给出了模型参数和模型超参数的定义 ...
2018-08-13
产品和运营,你为什么做不好转化分析 对于一款产品来说,如何让用户更好地转化,是用户能否留存下来产生价值的关键因素。 对于运营来说,广开源路寻找目标用户,甚至还要选择一些付费渠道(如下图)进行投 ...
2018-08-13
现代数据中心六大优化趋势 能源成本仍然是数据中心增长最快的费用,据说超过了计算设备本身的成本。电力使用效率(PUE)和碳使用效率(CUE)是国际公认的指标,与更多其他的定义指标一道,将成为行业标准。新 ...
2018-08-13
机器学习之支持向量机(SVM) 支持向量机算法在深度学习没有火起来的2012年前,在机器学习算法中可谓是霸主地位,其思想是在二分类或者多分类任务中,将类别分开的超平面可能有很多种,那么哪一种的分类效果是最 ...
2018-08-13
python中验证码连通域分割的方法详解 这篇文章主要给大家介绍了关于python中验证码连通域分割的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用python具有一定的参考学习价值,需要的朋友们下 ...
2018-08-13
大数据在互联网用户系统中的应用 但是对于今日的互联网和移动互联网,大数据的规模和应用深度早已不次于传统的电信、民航等行业,甚至超过不少。因此笔者还是想写些东西浅谈一下互联网的大数据应用,权当抛砖引 ...
2018-08-13
Python简单实现的代理服务器端口映射功能示例 这篇文章主要介绍了Python简单实现的代理服务器端口映射功能,结合实例形式分析了Python模拟服务器、代理服务器及客户端访问的相关操作技巧,需要的朋友可以参考下 ...
2018-08-13互联网公司是如何做大数据的 大数据”炙手可热,很多企业都不会错失机会,谷歌已经从一个网页索引发展成为一个实时数据中心枢纽,可以估量任何可以测量的数据,将输入的查询与所有可用数据相匹配 ...
2018-08-139种人人都应该掌握的数据分析思维 1. 分类 分类分析的目标是:给一批人(或者物)分成几个类别,或者预测他们属于每个类别的概率大小。 举个栗子:“京东的用户中,有哪些会在618中下单?”这就是个典型的二分 ...
2018-08-13在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26