机器学习之Logistic回归与Python实现 logistic回归是一种广义的线性回归,通过构造回归函数,利用机器学习来实现分类或者预测。 一 Logistic回归概述 Logistic回归的主要思想是,根据现有的数据对分类边 ...
2017-07-24商业银行如何完成从“数据大”到“大数据”的蜕变 商业银行在大数据时代的蜕变,既不是传统状态下短期目标的满足,也不是金融新业态(互联网金融)压迫下的被动选择,更不是固化金融生态结构的势力扩张,其根本目 ...
2017-07-24【赢时胜软件】招聘数据分析师 深圳市赢时胜信息技术股份有限公司,创业板上市公司,股票简称:赢时胜,股票代码:300377我们的目标:成为中国金融证券行业软件服务商的领跑者。公司资质:公司被国家发改委、工业和 ...
2017-07-23【鑫茂荣信财富投资管理(北京)有限公司】招聘数据分析师 鑫茂荣信财富投资管理(北京)有限公司,简称鑫茂荣信财富,是鑫茂集团旗下专业从事投资咨询与财富管理的综合性金融服务公司,总部位于北京CBD。公司集投资咨 ...
2017-07-23【合肥文辉软件服务有限责任公司】招聘数据分析师 合肥文辉软件服务有限责任公司是软件业行业内知名企业。公司主要经营计算机软硬件、网络产品、通信产品的技术开发、技术检测、技术咨询、技术转让;计算机软件外包 ...
2017-07-23【长沙沃邦企业管理顾问有限公司】招聘数据分析师 长沙沃邦企业管理顾问有限公司是一家专注于汽车售后服务的咨询公司。我公司以【客户管理工具】为载体(自主研发),【数据分析】为手段,致力于【售后运营能力改善 ...
2017-07-23【杭州红禾文化传播有限公司】招聘数据分析师 杭州红禾文化传播有限公司(www.shyscm.net),成立于2000年。致力于传媒文化事业,业务涉及众多领域,如娱乐直播、电子竞技、网络娱乐、网剧、广告、代言拍摄及其他深度 ...
2017-07-23【深圳市复兴教育科技有限公司】招聘数据分析师 深圳市复兴教育科技有限公司(简称复兴教育),成立于2012年,隶属文艺复兴集团。主营业务为职业资格认证和学历提升,是一家专业教育培训机构。公司秉承“奋斗”“开 ...
2017-07-23【深圳乐聚互动科技有限公司】招聘数据分析师 乐聚互动成立于2014年7月,致力于手机游戏发行、海外游戏代理以及游戏媒体网站运营。公司实力雄厚,团队实力强大,创业团队,拥有成熟手机游戏发行经验,并且成功发行过 ...
2017-07-23机器学习之朴素贝叶斯(NB)分类算法与Python实现 朴素贝叶斯(Naive Bayesian)是最为广泛使用的分类方法,它以概率论为基础,是基于贝叶斯定理和特征条件独立假设的分类方法。 一、 概述 1.1 简介 朴 ...
2017-07-23机器学习之决策树(ID3)算法与Python实现 机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结 ...
2017-07-23商业银行大数据征信应用策略分析 国内征信业发展迅速、特点鲜明。国家专项法律和政策规划促进了征信机构及服务的多样性,立信、供信、征信、用信各方共同组成了征信市场,推动形成了全社会共同参与的“大数据 ...
2017-07-23数据挖掘的基本概念:数据库、数据仓库、机器学习,统计学 “数据挖掘“(Data Mining)又被称为“数据中的知识发现”(KDD),顾名思义,也就是通过数据清理、数据集成、数据选择、数据变换、数据挖掘、模式评估 ...
2017-07-23重塑现有商业模式大数据产业或将迎来收获期 近年来,“大数据”逐渐从学术概念走向产业应用,并成为互联网界争相逐鹿的“风口”。然而,虽然业内有关大数据的设想、研究、计划层出不穷,但大多数公司仍未实质 ...
2017-07-23机器学习之k-近邻(kNN)算法与Python实现 k-近邻算法(kNN,k-NearestNeighbor),是最简单的机器学习分类算法之一,其核心思想在于用距离目标最近的k个样本数据的分类来代表目标的分类(这k个样本数据和目标 ...
2017-07-23人工智能+大数据将成为餐饮行业风向标 在互联网繁荣发展的时代,餐饮O2O成为现代餐饮人的谈论热点。如何利用好互联网向大众传递自己的品牌理念,让大众对自己的产品有更深的了解,通过互联网营销手段更好的为顾 ...
2017-07-23样本统计量与总体的关系,抽样分布的概念性质 本文对抽样分布的概念、无偏差和最小偏差等性质,以及中心极限定理和样本比例的抽样分布进行总结。 1 抽样分布基本概念 参数(parameter):参数是对总 ...
2017-07-23土壤环境大数据:构建与应用 作者从大数据特征分析入手,分析了国内外大数据在环境领域的发展状况...在文章中阐明我国土壤环境大数据发展的数据基础与瓶颈问题是什么?提出了土壤环境大数据系统的构建方法与技术 ...
2017-07-23大数据将成为智能电网基础性技术 机遇与挑战并存 今天,大数据概念的讨论越来越少,大数据应用却如雨后春笋般涌出,这预示着大数据产业已经告别了概念炒作,进入了实实在在的落地阶段。在这一背景下,包括电力 ...
2017-07-23图形和数值的数据集描述方法 图形方法对数据集的描述 1. 条形图(bar graph) 条形图一般横向表示类别(class),纵向表示该类别所对应的类别频率(class frequency)。 2. 饼状图(pie graph) 饼状图 ...
2017-07-23在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30