不平衡数据分类算法介绍与比较 在数据挖掘中,经常会存在不平衡数据的分类问题,比如在异常监控预测中,由于异常就大多数情况下都不会出现,因此想要达到良好的识别效果普通的分类算法还远远不够,这里介绍几 ...
2018-04-01机器学习中的数据不平衡解决方案大全 在机器学习任务中,我们经常会遇到这种困扰:数据不平衡问题。 数据不平衡问题主要存在于有监督机器学习任务中。当遇到不平衡数据时,以总体分类准确率为学习目标的传统 ...
2018-04-01我们应以何种思维方式来适应大数据时代 目前,在报刊文献和各种媒体中,大数据这个概念,几乎是处处可见、不绝于耳;同时,学术界的学术研究,使人们对大数据的理性认识水平不断提高。有学者认为,2012年世界 ...
2018-04-01【北京凯因科技股份有限公司】招聘数据分析师 北京凯因科技股份有限公司(以下简称凯因科技)成立于2008年,注册资本11500万元。位于素有“药谷”之称的北京经济技术开发区。凯因科技以生物技术为平台,专注于肝病领 ...
2018-03-31【成都名文建筑装饰设计有限公司】招聘数据分析师 名文建筑装饰公司是集室内设计、开发、预算、施工、材料于一体的专业化设计公司。公司从专业的设计和可实现性的角度上,为客户营造更温馨和舒适的家园。 职位月薪 ...
2018-03-31【国电南瑞轨道交通技术分公司】招聘数据分析师 轨道交通技术分公司作为国家电网公司直属产业单位南瑞集团公司旗下上市公司—国电南瑞科技股份有限公司的下属分公司之一,是国内唯一同时掌握城市轨道交通电力自动化 ...
2018-03-31Python栈算法的实现与简单应用示例 本文实例讲述了Python栈算法的实现与简单应用。分享给大家供大家参考,具体如下: 原理: 栈作为一种数据结构,是一种只能在一端进行插入和删除操作。它按照先进后出的 ...
2018-03-31Python with语句上下文管理器两种实现方法分析 本文实例讲述了Python with语句上下文管理器。分享给大家供大家参考,具体如下: 在编程中会经常碰到这种情况:有一个特殊的语句块,在执行这个语句块之前需 ...
2018-03-31深入解析Python中的上下文管理器 Python中把进入代码块前调用__enter__ 方法并在离开代码块后调用__exit__方法的对象作为上下文管理器,本文中我们就来深入解析Python中的上下文管理器,来看看上下文管理器的作用 ...
2018-03-31机器学习4种不同数据集的优劣对比 数据源决定了机器学习算法,机器算法的选择好坏也决定了数据的分析质量等,因此,我们选择机器算法的时候,要首先弄懂各个机器学习数据集的优劣性,主要特点,方可着手处理, ...
2018-03-31浅谈数据分析中的“暗物质” 我们分析数据,更重要的是看到数据中所隐藏的暗物质,即数据图中你看不见的数据\\逻辑\\知识。 开门见山,以下是某新闻媒体WAP\\APP\\PC三端的分周中和周末的PV曲 ...
2018-03-31机器学习中的数据集合 数据集分类 在有监督(supervise)的机器学习中,数据集常被分成2~3个,即:训练集(train set) 验证集(validation set) 测试集(test set)。 训练集用来估计模型,验证集用来确定网络结构或 ...
2018-03-31移动大数据的四个发展趋势 如果我告诉你,你可以做到从海量数据来源(包括各种各样的移动设备)中把数据提取到一个系统,然后只用少量的程序行数描述所需的信息就可以让结果轻松呈现,还可以做到实时处理这些数 ...
2018-03-31最流行的4个机器学习数据集 机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。本文作为学习研究数 ...
2018-03-31区块链火热应用场景成关键 业内:今年是落地好时机 数个月前,人们似乎还在热议着“互联网+”,然而对市场敏感的人就会发现,现在已然成为了“区块链+”的世界。根据百度搜索指数趋势,“区块链”一词的搜索次 ...
2018-03-31盘点丨2018年最适合学习的编程语言 对于在2018年想学习编程语言的人来说,本篇文章是值得参考的指南。 需要明确的是,这并不是介绍最热门的语言,然后抛出各种名称和流行语。而是根据2018年IT行业现状、趋势 ...
2018-03-30你的第一个智能合约「Hello World」,好像也不是很智能 在看过我花了 99 个以太坊(Ethereum)来学智能合约开发(http://davidfnck.com/blockchain/ethereum-smart-contract-intro.html/)之后,相信你对以太坊的 ...
2018-03-30【阳光财产保险股份有限公司3】招聘数据分析师 阳光保险集团是国内七大保险集团之一、中国500强企业,由中国石油化工集团公司、中国南方航空集团公司、中国铝业公司、中国外运长航集团有限公司、广东电力发展股份有 ...
2018-03-30【优必爱信息技术(北京)有限公司】招聘数据分析师 低碳化、信息化、智能化是未来汽车技术的发展方向。借助于移动互联网、大数据和云计算等新一代信息技术的革命性突破,智能网联汽车正在改写全球汽车产业格局下的产 ...
2018-03-30【北京信宜明悦咨询有限公司】招聘数据分析师 北京信宜明悦咨询有限公司——企业数据化管理的领跑者。公司成立于2012年3月,专注于推动中国本土成长型企业数据化管理,致力于帮助企业梳理数据资产,分析和挖掘数据价 ...
2018-03-30在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09