大数据热中要有冷思考 当下中国,大数据成为国际流行的词汇。既走进决策者视野,也在影响着人们的日常生活。大数据的应用领域十分广泛,涵盖医疗、金融、交通、零售、互联网、工业等行业,毫无疑问的是它的市场 ...
2018-05-16教你如何用R进行数据挖掘 R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用 ...
2018-05-16写量化策略时常用的技巧 1.善用panel保存数据 说明:pandas有三种数据结构,分别是Series(一维),DataFrame(二维),panel(三维) 例子:沪深300成分股所有股票[stock list]在某些特征指标如成交量、收盘 ...
2018-05-15数据科学家需要掌握的十大统计技术详解 「数据科学家比程序员擅长统计,比统计学家擅长编程。」本文介绍了数据科学家需要掌握的十大统计技术,包括线性回归、分类、重采样、降维、无监督学习等。 不管你对数 ...
2018-05-15R 和 Python 联姻!本年度最牛“社交” Hadley Wickham对于编程语言R来说,是贡献最大的开发人员。Wes McKinney是编程语言Python最重要的开发人员之一。 R和Python这两种免费语言在数据科学领域经常被视为 ...
2018-05-15某券商自营部量化策略岗的面试题 本文为网络上流传的某券商自营部量化策略岗的面试题,内容不太完整,仅供参考。 笔试一共八条大题,前两题必答,后六题选三题作答。(试卷还是打印得很工整的,感 ...
2018-05-15如何打造敏捷的数据挖掘能力 大家都知道数据挖掘是发现规律的一种手段,但在很多传统企业里数据挖掘有点像奢侈品,因为数据挖掘的过程一般较长,总体来讲性价比不是那么高,规则取数往往成为了企业数据驱动业 ...
2018-05-15python实现中文输出的两种方法 本文实例讲述了python实现中文输出的两种方法。分享给大家供大家参考。具体如下: 方法一: 用encode和decode 如: import os.path import xlrd,sys Filename=\'/home/tom/Desk ...
2018-05-15用R语言实现深度学习情感分析 word embeddings介绍 之前建立的情感分类的模型都是Bag of words方法,仅仅统计词出现的次数这种方法破坏了句子的结构。这样的结构,我们也可以使用如下的向量(one hot 编码 ...
2018-05-15区块链“狂欢”下的创业者:还有什么玩法比发币赚钱 区块链在追求技术驱动的创业者眼里,它是去中心、价值数据化、token……在投机者的眼里,它就是代币投资。 区块链作为一个多维的价值传递链条,究竟和 ...
2018-05-15Python基于动态规划算法解决01背包问题实例 本文实例讲述了Python基于动态规划算法解决01背包问题。分享给大家供大家参考,具体如下: 在01背包问题中,在选择是否要把一个物品加到背包中,必须把该物品加进 ...
2018-05-15数据挖掘与商业智能的捆绑 从发展路线和实施原理来讲,企业级的商业智能应用可以覆盖企业的全貌、打通不同部门和系统间的数据壁垒、通盘规划企业的整体应用、企业的总体拥有成本偏低。但企业级的商业智能应用规 ...
2018-05-15Python使用遗传算法解决最大流问题 本文为大家分享了Python遗传算法解决最大流问题,供大家参考,具体内容如下 Generate_matrix def Generate_matrix(x,y): import numpy as np import random return np.ceil( ...
2018-05-15企业部署BI的几大误区 企业大多采用商业智能应用来强化决策的严谨性、降低营运成本以及评估新的商机。商业智能的应用远超过传统企业报表的范畴,也超越对企业系统化分析的应用。各大企业的CIO多数采用商业智能 ...
2018-05-15【伴奏王(北京)音乐教育科技有限公司】招聘数据分析师 伴奏王(北京)音乐教育科技有限公司,隶属于台湾可来音乐股份有限公司,由知名音乐制作人薛位山先生创办,历经四年倾力打造的音乐教育内容服务平台。伴奏王专注 ...
2018-05-14【北京第三石信息技术有限公司】招聘数据分析师 5Miles是一家美国市场领先的电商服务平台,基于位置信息,用户可以快速可靠地在5Miles买卖商品和服务。2015年初进入美国市场至今,长期占据安卓购物类应用排前10名,i ...
2018-05-14【广州仁海网络科技有限公司】招聘数据分析师 广州仁海网络科技有限公司成立于2014年,隶属于香港爱家创建控股集团有限公司(股票代码:WGYY)旗下的子公司。广州仁海网路科技有限公司专注于智能管理集成系统开发与 ...
2018-05-14【杭州藤木网络科技有限公司】招聘数据分析师 杭州藤木网络科技有限公司创建于2016年1月,坐落于杭州市滨江区。由多名原腾讯、网易、2K Games等游戏研发专家组成。我们专注于研发高质量的精品移动端网络游戏,并立志 ...
2018-05-14【浙江夕尔网络科技有限公司】招聘数据分析师 公司隶属夕尔控股,是一家集母婴产品研发、设计、销售于一体的实业企业,夕尔控股作为母婴行业领先品牌Babycare的品牌方及实际运营方,渠道涉及线上大部分主流电商平台 ...
2018-05-14【广州昔古服饰有限公司】招聘数据分析师 广州昔古服饰有限公司是一家集设计、生产、销售运营为一体的服装企业多年来,公司以探索东方美学艺术为追求,返璞归真,摆脱生活的刻板。以简约的设计手法诠释精致美学,融 ...
2018-05-14在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30