有大分析 才有真正的大数据 大数据在过去几年中一直是流行话题,许多组织一直在研究大数据系统和流程以及背后的科学采集、数据存储、数据分析,并在他们的业务中使用大量的数据。 这些年我曾工作过的许多组 ...
2016-01-24大数据技术架构解析 大数据数量庞大,格式多样化。大量数据由家庭、制造工厂和办公场所的各种设备、互联网事务交易、社交网络的活动、自动化传感器、移动设备以及科研仪器等生成。它的爆炸式增长已超出了传统I ...
2016-01-23大数据是互联网时代的重要资源 在这个互联网时代,数据分析时代,大数据(Big Data,BD)是构成信息化世界的基本元素,组成了互联网上纷繁庞杂的知识和数据资源。数据分析师通过合理的挖掘工具进行分析处理, ...
2016-01-23数据分析美国人一天的生活 据数据分析师了解,目前可以从两个角度来观察美国人如何度过一天的,但是我们锁键十分有限。 25到34岁美国人中40%在每天下午3点工作。家务、休闲、旅行和其他事情也差不多。这只 ...
2016-01-23看联通大数据时代的行业应用 “说话算数——2016联通大数据应用研讨会”这是联通在今年年初率先召开的运营商级别的大数据应用会议,一个旨在联通解析运营商大数据如何应用企业精准营销、行业创新和产业升级的 ...
2016-01-23与大家的常规想法不同,当事情涉及到广告和隐私时,广告商并不在意我们在做什么或我们想要什么,他们只关心一件事情:让我们去买他们销售的东西。你可能想问:那又怎么了,谁不喜欢在寻找一件特定商品时正好收 ...
2016-01-23大数据:商业革命与科学革命 什么叫大数据? “大数据”是“数据化”趋势下的必然产物!数据化最核心的理念是:“一切都被记录,一切都被数字化”,它带来了两个重大的变化:一是数据量的爆炸性剧增,最近2 ...
2016-01-22不完整分析优秀的微信运营人员需要具备的能力 从接触公众平台到现在不知不觉已经三年的时间,这期间经历了公众平台的红利期--公众号起好名字仍在那每天都增长几百粉;经历了公众平台的狂躁期--企业找第三方申请 ...
2016-01-222015年大数据市场应用与趋势调研 即将逝去的2015年,被认为是具有跨时代意义的“大数据元年”。在这一年,数据比以往任何时候都要宝贵,甚至成为可以与石油资源相媲美的新能源,大数据被认为是继信息化和互联网 ...
2016-01-22一些有用的站点(在线教育与数据分析) 今天看了一下满满的浏览器书签,是时候整理一下自己用过的,给大家分享以下,也许大家都知道,也许比我使用和收藏的还多,如果觉得作为数据分析师的我整理的不全 ...
2016-01-22大数据不在于“大”而在于“用” 近日,国家发改委公布《关于组织实施促进大数据发展重大工程的通知》,提到四个“重点支持”,即大数据示范应用、大数据共享开放、基础设施统筹发展、数据要素流通(数据分析师 ...
2016-01-22文|翟周伟 本文节选自《Hadoop核心技术》一书。 Hadoop是一个开源的高效云计算基础架构平台,其不仅仅在云计算领域用途广泛,还可以支撑搜索引擎服务,作为搜索引擎底层的基础架构系统,同时在海量数据处理 ...
2016-01-21“大数据”时代应探索信息引导侦查机制 几千年来,侦查活动的发展谱写了侦查方法创新的历史。从远古的神明裁判到封建社会的刑讯逼供,从近代的人体测量与指纹鉴别到当今的科学证据时代,侦查方法与制度的进化既 ...
2016-01-21大数据勾勒“大钱景” 近日,美团外卖APP通过大数据分析国内不同城市用户的外卖消费习惯,对外公布了各大城市的外卖消费特点。根据美团外卖对“各品类外卖订单量最高的城市”统计发现,除了订餐外,北京市鲜花 ...
2016-01-21数据分析师看了这个故事,你还有什么理由不努力? 有位知乎题主提出了这样一个问题:“贫穷无法改变吗?” 题主的问题阐释很长,大意是自己从小在一个落后的小城镇长大,考入大学之后感觉自己的见识和眼 ...
2016-01-21“不靠谱”的车联网大数据 我一个在纽约工作的朋友,前几天谈到了一个现象。她在曼哈顿上班,住在布鲁克林大桥的另一端,由于做医生,上夜班是常态。没有想到,像她这样受过极好的教育,从事对社会有贡献职业的 ...
2016-01-21互联网跨界营销掘金“大数据” 在阿里巴巴投资优酷和新浪、腾讯入股京东和大众点评等战略部署时,不少人仅仅将这些举措看作是互联网的一次“站队行为”,又或者解读为被投资的互联网企业需要资本支撑的。(数据 ...
2016-01-21文|宿痕 来源|知乎 过去的运营体系弊端: 过去运营的方式存在几个比较严重的问题:1)运营模式比较单一,很难适应互联网快速变化的节奏,不能及时根据市场和用户的变化作出调整。比如双十一、828、双12、 ...
2016-01-20大数据在企业运营中的8大落地应用 大数据在企业运营中到底有哪些应用值得我们关注? 无论规模大小,无论是生产型还是服务型,无论是盈利还是非盈利机构,运营管理,即产品制造,都是每个组织的核心。我们(企业) ...
2016-01-20大数据时代的精准骗局 年关将至,你欢欢喜喜迎新年之际,也是骗子小偷大行其道之时。骗子也要过年,奉劝各位切不可麻痹大意,把一年的血汗钱肥了骗子的腰包。数据分析师专门统计的近年来的数据进行了一系列的 ...
2016-01-20在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30