批处理与python代码混合编程的方法 批处理可以很方便地和其它各种语言混合编程,除了好玩,还有相当的实用价值,比如windows版的ruby gem包管理器就是运用了批处理和ruby的混合编写,bathome出品的命令工具包管 ...
2017-12-21业界共同开掘大数据文化价值 使用深度学习方法按照本文所介绍的步骤处理结构化数据有这样的好处: 快 无需领域知识 表现优良 在机器学习/深度学习或任何类型的预测建模任务中,都是先有数据然后再 ...
2017-12-21大数据的理想与现实之间 我与数据打了25年的交道,经历了从电信、网通到联通的多次重组,亲身参与了数据专业线从弱势群体逐渐发展壮大的全过程。一直想找个机会,谈谈我的体会,但是没有下这个决心动笔。最近, ...
2017-12-21勾勒物联网与大数据的数据中心路线图 从数据中心的角度看,物联网和大数据项目几乎总是强调网络和存储基础设施。规划人员在组织内开始实施这种大规模数据密集的项目之前,需要仔细地评估基础设施的需求。 ...
2017-12-21Python判断两个对象相等的原理 大部分的python程序员平时编程的时候,很少关心两个对象为什么相等,因为教程和经验来说,他们就应该相等,比如1==1就应该返回True,可是当我们想要定义自己的对象或者修改默认的 ...
2017-12-21【每周一本(赠)书第16波】Power Query:用Excel 玩转商业智能数据处理 Power Query,Excel 的另一个江湖 对大部分学习Excel 的人来说,Power Query 还是一个相对比较陌生的工具,在江湖中早有耳闻,却一直 ...
2017-12-20——题记 摘要:我自己的领域——数据挖掘为例,08年左右Hadoop开始兴起,一时「大数据」概念火热,Hadoop工程师万金难求,各互联网公司纷 ...
2017-12-20【爱德威软件开发(上海)有限公司】招聘数据分析师 爱德威软件开发(上海)有限公司是Adways(东京)株式会社(上市外企)在上海的研发中心, 做IPHONE WEB游戏开发、电子商务数据分析、网络广告系统、以及其他新产品 ...
2017-12-20【冠诚(北京)信息服务有限公司】招聘数据分析师 “冠诚——冠诚(北京)信息服务有限公司,成立于2016年北京,注册资金5000万元人民币。以信用风险评估与管理、借款咨询服务为主要业务,为有资金需求的个人与中小企 ...
2017-12-20【掌阅科技股份有限公司】招聘数据分析师 掌阅,全球最大移动数字阅读平台,日活跃用户2000万,累计用户达6亿,掌阅,掌文学为公,阅经典之版,创新方式传播中华传统文化 职位月薪:12000-20000元/月 工作地点:北 ...
2017-12-20网站用户行为数据收集和分析方法 随着In ternet 的不断发展, 各种各样的网站如雨后春笋般成倍增长, 各个商业网站之间的竞争越来越激烈, 随之而来的是, 网站的建设不可避免的出现了很多问题。从最近一次国外对1 ...
2017-12-20为什么说「大数据」可能被人们过度神化了 如果说下水道是一个城市的良心,那么厕所就是一座城市的门脸。 很多年前,人们就发现一个有意思的现象:一个城市的文明程度可以从其厕所的卫生程度反映出来,厕所越 ...
2017-12-20mysql数据库海量数据优化方法总结 下面是一部分比较重要的建议: 1、选择正确的存储引擎 以 MySQL为例,包括有两个存储引擎 MyISAM 和 InnoDB,每个引擎都有利有弊。 MyISAM 适合于一些需要大量查询的应用,但 ...
2017-12-20利用python实现简单的循环购物车功能示例代码 购物车对我们每位开发者来说应该都不陌生,下面这篇文章主要给大家介绍了利用python实现简单的循环购物车功能的相关资料,文中给出了详细的示例代码供大家参考学习 ...
2017-12-20介绍一下海量数据的处理方法 适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集 基本原理及要点: 对 于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数 ...
2017-12-20大数据应用的创新路径 随着云计算、移动互联网和物联网等新一代信息技术的创新和应用普及,海量数据正在生成。2015年,中国大数据市场规模达到115.9亿元人民币,增速达38%,预计2016至2018年中国大数据市场规模 ...
2017-12-20大牛数据分析师养成日记 在耀眼的职业光环下,数据分析师自身的成长,几乎是与孤寂相伴,在高级打杂中,锻造而成。 最近接到一个职业访谈的邀请,要给对数据分析感兴趣的新人Y(目前在知名电商从事系统开 ...
2017-12-20大数据对当代企业推广价值何在 什么是\"大数据\"?直白的解释就是:通过一定的技术在合理的时间获取到海量数据并且加以分析,然后用这个分析结果去做各种研究、决策等等。关于大数据笔者认为首先必须先弄清楚三 ...
2017-12-20Python中实现字符串类型与字典类型相互转换的方法 本文以实例形式简述了Python中字符串类型与字典类型相互转换的方法,是比较实用的功能。具体方法如下: 一、字典(dict)转为字符串(string) 我们可以比较容易的 ...
2017-12-20大数据之路依然还很长,看你怎么走 前段时间做了一次大数据直播课,主要是大数据职业生涯规划的一些内容。第一次做,磕磕绊绊,但总算顺利搞完了。 直播课中有收集到群里朋友的一些问题,并且在直播中进行了 ...
2017-12-20在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29