如何通过自学,成为数据挖掘“高手”? 基础篇 1. 读书《Introduction to Data Mining》,这本书很浅显易懂,没有复杂高深的公式,很合适入门的人。另外可以用这本书做参考《Data Mining : Co ...
2015-12-24九个成为数据科学家的必备技能 Works详细列举了从雇主角度看来,数据科学家加强自身市场竞争力所必备的9个数据科学技能。 过去一年中人们对数据科学的兴趣骤然增长。Nate Silver这个名字已经家喻户晓 ...
2015-12-24利用大数据分析,痛击通信网络诈骗 网络搜索可知,2009年公安部对河北丰宁县、湖北红安县和大悟县、湖南双峰县、广东电白县和海南儋州市等6个电信诈骗犯罪嫌疑人比较集中的原籍地进行了挂牌整治。其中,河北 ...
2015-12-24文|SamanthaZhang来源|GRAPHIQ 摘要:虽然如今好的配色方案已经唾手可得,但为数据可视化找到合适的配色方案,却仍是一项巨大挑战。 在Graphiq,事情甚至更加棘手,因为我们要通过上千种各不相 ...
2015-12-23文|MatthewMayo译|王鹏宇 开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时,就更让人两腿发软了。 从哪里开始? 本文旨在通过七个步骤,使用全部免费的线上资料,帮 ...
2015-12-23Excel导入外部数据的3大绝招! 来源|ExcelSkill 想把网页或者其他工作表的内容导入到正在编辑的Excel工作表中,该如何操作呢?今天小编推出3大绝招,不服来战! 一、导入网页数据 每次要用到外汇汇率都要 ...
2015-12-23怎样在国内企业中实施工作分析 工作分析是指对工作进行整体分析,以便确定每一项工作的七W:(1)用谁做(Who)(2)做什么(What)(3)何时做(When)(4)在哪里做(Where)(5)如何做(How)(6)为什么做(Why)(7) ...
2015-12-23非财务专业管理者如何对财务数据进行有效分析 随着企业的不断壮大,很多管理者会觉得对于企业的管理,尤其是战略、薪酬绩效等相关措施的制定与有效实施都变得越发复杂!“如何有效管控企业?”这句话被越来 ...
2015-12-23网站数据分析:基于用户细分的比较分析 从网站的用户层面,我们根据用户访问的行为特征将用户细分成各种类型,因为用户行为各异,行为统计指标各异,分析的角度各异,所以如果要对用户做细分,可以从很多角度根 ...
2015-12-23数据分析报告与商业计划书、可行性研究报告的区别 一、现有的一些商业计划书与可行性研究报告的特点: 1、基础数据的采集缺乏科学依据 基础数据的采集对于整个数据分析报告具有非常重要的意义 ...
2015-12-23数据分析所不可替代的作用是什么 在企业的经营活动中,随时都会产生大量的数据信息,面对庞大的数据信息内容,如何进行整理分析,就成为了企业所关注的问题。在这样的情况下,数据分析就具有不可替代的意义 ...
2015-12-23数据分析的别称也叫定性数据分析 数据分析是人们早已想期待被紧急利用的一种科学,但就是由于数据分析这种科学将其转化为可用技术是需要一定苛刻条件的。这就是说,要想进行数据分析,光有数学科学基础知识 ...
2015-12-23数据分析师:数据分析到底适合于哪些人才 到底哪些人适合于进行数据分析呢?毕竟数据分析不仅仅是写数据报表或者整理数据,而是需要对数据进行分析。对于互联网公司而言,其又需要招募怎样的人才作为数据分析 ...
2015-12-23大数据分析可行性方法综述 大数据分析是现下比较热门的词汇,通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中,越来越多的应用都会涉及到大数据,数据的属性越来越复杂,如数量、速度以及多 ...
2015-12-23大数据时代将“革新”物流业 相对于传统的数据库应用,大数据分析具有数据量大、类型多样、价值密度低、处理速度快等特点,采用对所有数据进行收集、分类、处理和整理,并为企业经营决策提供有应用价值的信 ...
2015-12-232016年商业智能十大趋势 商业智能一直是发展最快的企业领域之一。不只是技术本身发展迅速,人们用于推广普及并从数据中获取价值的方法也在成倍地增加。人们愈发重视通过更加高级的分析来解答更加深入的问题 ...
2015-12-23数据挖掘:微博用户画像之用户标签 来源|微博大数据 摘要:用户画像(UserProfile),作为大数据的根基,它完美地抽象出一个用户的信息全貌,为进一步精准、快速地分析用户行为习惯、消费习惯等重要信息,提供 ...
2015-12-22数据分析师是否需要研究如何解决问题? 那么,在大数据时代,是否有这个必要?从熟悉业务、分析问题,到解决问题,有多大的Gap? 我们设计一些场景,来看看大数据时代,是否需要数据分析进化。 例如市场部要求数 ...
2015-12-22人们常说“用数据说谎”,我要说往往数据的分析是没问题的,但这些分析却是建立在夸大或不实的数据之上。下面便是几个常见的“错进错出”案例。 选择偏倚 《纽约客》资深影评人宝琳•凯尔(Pauline Kael)据称曾经 ...
2015-12-22这是几道数据库的概念性面试题,有的面试题在之前收录的面试题里面已经出现过了,不过还是要拿来强化一下概念: 1、触发器的作用? 答:触发器是一种特殊的存储过程,它主要是通过事件来触发而被执行的。它的 ...
2015-12-22在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30