十个用到大数据应用的职业岗位 重要数据科学技能列表取决于你正在考虑成为的数据科学家类型。虽然一些技能看起来在不同专业人士间通用(尤其是沟通,处理结构化数据,数学,项目管理,数据挖掘和可视化工具,数 ...
2016-05-06
小白学数据:一篇文章看懂NoSQL数据库 如果你关注大数据科技动向,可能听说过一个叫NoSQL数据库的名词,这可能让人有些云里雾里。其实我们处在一个激动人心的技术更迭时代,以甲骨文为代表的SQL数据库已经称霸 ...
2016-05-06数据超市打造企业征信数据,引爆大数据风控 近年来,我国互联网金融市场风生水起,在行业的快速发展和突破中,伴随着的是互联网金融行业对线上线下资源的激烈竞争和风险的把控。对资源的竞争也需要建立在把控征信 ...
2016-05-06
基于树的建模-完整教程(R & Python) 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关 ...
2016-05-06
2016年大数据将走下神坛拥抱生活 资本青睐创业机会多 2016年,大数据在国防、气候、保险、医疗、农业、制造业、城市建设、公共服务等领域都将有着实质性的落地应用。大数据将走下神坛,拥抱我们的生活,直接影 ...
2016-05-06掌握8项技能让你顺利受雇于4种逼格最高的数据科学岗位 你想找到一份数据科学家的工作吗?如果你有这样的想法的话,那么你就有伴儿了。最近由Thomas Davenport和D.J. Patil在《哈佛商业周刊》上面发表了一篇专栏 ...
2016-05-06
矩阵分解在推荐系统中的应用:NMF和经典SVD实战 数据 关于NMF,在隐语义模型和NMF(非负矩阵分解)已经有过介绍。 用户和物品的主题分布 运行后输出: 可视化物品的主题分布 ...
2016-05-06
车联网与车有关的大数据 随着互联网的不断发展,大数据正在成为一股热潮,且业界对大数据的讨论已达到一个前所未有的高峰。车联网作为移动互联网大背景下诞生的一个产物,不管是车辆的接入、服务内容的选择还是 ...
2016-05-06
5分钟轻松上手ECharts数据图表系统 最近在捣鼓各种插件各种框架,发现这个ECharts还是比较不错的,文档也挺全的,还是中文的,给大家推荐一下。 这篇文章是零基础入门ECharts图表的教程,先简单介绍 ...
2016-05-06
大数据对智能化发展有着怎样的影响力 说到头条,很多人会想到“黑马”、“大杂烩”、“大数据”等关键词,说是黑马因为谁也没想到,没有过硬的背影,在移动互联网爆发之际杀出了个“今日头条”;大杂烩则是这款 ...
2016-05-06
到底该使用哪一种大数据编程语言:R、Python、Scala和Java 说到处理大规模数据,R、Python、Scala和Java基本上都能满足你的要求。 你有一个大数据项目,你知道问题领域(problem domain),也知道使用什么基 ...
2016-05-06
浅谈餐饮数据分析 半年来,笔者有强烈危机感。身处互联网革新年代,社会进步的强度和烈度不亚于“第一次工业革命”,未来3-5年重复性的工作将被程序取代、知识获取门槛越来越低、折旧速度越来越快、高端技术或 ...
2016-05-06
R语言数据挖掘实战案例:电商评论情感分析 随着网上购物的流行,各大电商竞争激烈,为了提高客户服务质量,除了打价格战外,了解客户的需求点,倾听客户的心声也越来越重要,其中重要的方式 就是对消费者的文本评论进 ...
2016-05-06
大数据:越发展,难题越多 大数据这两年一直是热词。发展中的大数据确实带来了很多有用信息,但也使我们遇到越来越多的难题。其中最大的难题就是如何去伪存真,将那些带来误导的噪音去除。 因此,发展中的大 ...
2016-05-06
掌握机器学习技术从这些编程语言和程式库开始 在我们之前分享的文章《一名合格的机器学习工程师需要具备的5项基本技能,你都get了吗?》收到了读者的热烈响应。在这片广受赞誉的文章当中我们向大家介绍了成为 ...
2016-05-06
中美企业在数据分析上的最大差异:增长黑客的实践 一、烧钱≠增长,数据驱动是一种能力 在过去10年,中国互联网发展速度非常快,以前是流量驱动的互联网经济。随着人力成本不断攀升,竞争不断加剧,完全靠流 ...
2016-05-06
深入理解SQL大逻辑 1、只要结果不问过程 当我们写出一条SQL语句后,SQL语句是到数据库中去执行的,具体怎么理解和执行SQL是数据库的事,我们关心的事儿就是如何写好SQL语句,别让数据库对我们的SQL产生误解 ...
2016-05-06
大数据告诉你,是谁在支撑着北京房地产市场的发展 1、交易量处于持续上行阶段 从2010至今,北京市场交易量呈现出“W”型,2010年,受国十一条收紧政策影响,成交量高位运行;2013年,受“国五条”政策影响, ...
2016-05-06
如何利用市场细分方法构建更好的预测模型? 我们使用线性或者逻辑回归模型来开发精确模型,为了预测相关的输出结果。我们经常为分割的部分分别创建模型。为了判断它们的有效性,我们可以利用细分方法:如CHIAD ...
2016-05-06
大数据探究经济衰退的到来 当今全球经济风起云涌,全球市场普遍不景气,资本缩水,油价下跌严重,诸多大企业纷纷裁员,一时间经济唱衰的声音越来越多。《大数据文摘--商业与金融专栏》今天刊登一篇全球顶级资本 ...
2016-05-06在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20