R语言自定义函数 R语言某种程度来说本身就是一个函数库,因为它有大量的函数可供调用,加上函数式编程,使得R语言的功能很强大。但是,有时候,根据实际需要,我们还是需要自己动手编写函数,从而减少代码的缀 ...
2017-05-30R语言逻辑运算 R语言包括两个逻辑值:TRUE、FALSE,其它编程语言经常称为布尔值,下面就来介绍R语言逻辑的应用。 条件运算产生逻辑值 > a <- 1 > b <- 2 > a>b [1] FALSE > a<b [1] T ...
2017-05-30智慧水务与大数据应用 智慧水务是通过数采仪、无线网络、水质水压表等在线监测设备实时感知城市供排水系统的运行状态,并采用可视化的方式有机整合水务管理部门与供排水设施,形成“城市水务物联网”,并可将海 ...
2017-05-30R语言-线性模型假设检验 让我一起学习下gvlma包中的gvlma()函数。gvlma()函数由Pena和Slate(2006)编写,能对线性模型假设进行综合验证,同时还能做偏斜度、峰度和异方差性的评价。换句话说,它给模型假设提供 ...
2017-05-30大数据真的无所不能吗 2017中国国际大数据博览会在今天落下帷幕,这场大数据行业盛会贡献了无数场头脑风暴。近些年来,随着互联网行业的快速发展,大数据变成了一个越来越热的话题,那么大数据到底是什么?到底 ...
2017-05-30R语言-如何处理回归中的异常值点 异常观测值 一个全面的回归分析要覆盖对异常值的分析,包括离群点、高杠杆值点和强影响点。这些数据点需要更深入的研究,因为它们在一定程度上与其他观测点不同,可能对结 ...
2017-05-30大数据处理并不难 洞察与升值在眼前 大数据在处理过程中会涉及多个步骤,一般包括了采集、筛选、导入、存储、分析、挖掘和应用等等。 采集是获取大数据的过程;筛选则要验证所收集到数据的正确性和相关性, ...
2017-05-30大数据应用价值与挑战并存 。什么是大数据?什么是数据?什么是资料?资料就是生产过程、管理过程,乃至经济、社会、生活过程的记忆,那些记忆可能表现在一个文件、一段演讲、一段文字上。资料放在计算机里就叫 ...
2017-05-30R语言解读资本资产定价模型CAPM 伴随2016年中国金融交易市场的跌宕起伏,风险越来越不确定,利率持续走低,理财等无风险资产收益持续下降的情况,唯有投资组合才能让我们的资产保值、增值。根据资本资产定价模 ...
2017-05-30大数据就是占有数据?错!如何使用更重要 置身于互联网金融行业,人们讨论的焦点都绕不过这两个字。没有人会否认大数据对互联网金融企业的重要性,也没有人能否认,随着大数据时代进程的不断加快,传统的信贷、风 ...
2017-05-30【北京博睿捷程管理咨询有限责任公司】招聘数据分析师 在过去的15年当中,在亚洲我们专注于人才匹配,职业的发展和团队构建,尤其在建筑地产领域的项目管理,设施设备维护,电子商务领域等高端客户,向他们提供专业高 ...
2017-05-29【成都懋世通商务有限公司】招聘数据分析师 懋世通商务机构(Milestone Investment)致力于打造中国第一流的服装、手袋类终端运营管理公司。公司创建于1994年,发展至今已拥有三家分公司,100余人的管理队伍,800余 ...
2017-05-29【天津卡采奥科技有限公司】招聘数据分析师 科学研究和技术服务业;信息传输、软件和信息技术服务业;商业服务业;批发和零售业。 职位月薪:4001-6000元/月 工作地点:天津-南开区 发布日期:前天 工作性质: ...
2017-05-29【深圳堉云信息技术有限公司】招聘数据分析师 深圳堉云信息技术有限公司前身为武汉矩阵信息技术有限公司,成立于2008年,有8年的悠久历史。我公司从事计算机软件、技术、通信设备等电子产品的研发及销售;是综合性软 ...
2017-05-29【广州猫玩网络科技有限公司】招聘数据分析师 广州猫玩网络科技公司(以下简称“广州猫玩”)成立于2015年,现坐落在广州市海珠区北岛创意园,办公面积达1000余方。广州猫玩是一家移动互联网的创新型企业,扎根在手 ...
2017-05-29【上海惟吾商务咨询有限公司】招聘数据分析师 We-wow上海惟吾人才服务有限公司是2009年成立的一家经上海市人事局批准的专业人力资源服务机构。 公司多年来凭借广泛的业务联系以及丰富的优质资源为广大优秀人才和世界 ...
2017-05-29SAS中的协方差分析 所谓的协方差分析,就是在方差分析的基础上加上协变量这一额外因素,而方差分析则只考虑组变量这一因素。协变量可以有一个,也可以有多个。 在这篇文章中,我只讲述单变量的协方差分析。 ...
2017-05-29构建大数据健康发展的安全生态环境 大数据等颠覆性技术快速发展的同时,大数据安全面临的挑战也日益尖锐。5月26日至28日在贵州贵阳举办的2017中国国际大数据产业博览会上,大数据安全成为业界热议的焦点话题。 ...
2017-05-29R语言分类算法之随机森林 1.原理分析: 随机森林是通过自助法(boot-strap)重采样技术,从原始训练样本集N中有放回地重复随机抽取k个样本生成新的训练集样本集合,然后根据自助样本集生成k个决策树组成的随 ...
2017-05-29R语言实战k-means聚类和关联规则算法 1、R语言关于k-means聚类 数据集格式如下所示: [plain] view plain copy ,河东路与岙东路&河东路与聚贤桥路,河东路与岙东路&新悦路与岙东路,河东路与岙东路&火炬路与聚贤 ...
2017-05-29在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30