解决Python中由于logging模块误用导致的内存泄露 首先介绍下怎么发现的吧, 线上的项目日志是通过 logging 模块打到 syslog 里, 跑了一段时间后发现 syslog 的 UDP 连接超过了 8W, 没错是 8 W. 主要是 logging ...
2018-04-10大数据杀熟只是开始,未来算法还将成为法律 1,最近看到网上流传着大量滴滴打车,面对不同用户不同价格的截图,并在互联网上引发了大量的抨击,认为滴滴的这种价格歧视是损害消费者的行为。 同样类似的事情 ...
2018-04-10分析了2.2W条抖音数据,发现95后其实很养生 或许是因为抖音的推荐算法,那些火爆的视频会优先推荐给我们,导致其更加火,而那些普通的几百赞视频,则默默的扎堆在一起,被系统遗弃。 文 / 张佳 来 ...
2018-04-09论炒币者的自我修养 加密货币,这个词本身就充满了密码学的神秘感。 对一个新手而言,要学习如何炒币可能很困难。不过,当前众多的行业专家和在线资源十分便利,通过一些高质量的新媒体资讯平台,比如币圈 ...
2018-04-09【北京抱财金融信息服务有限公司】招聘数据分析师 中联达是一家以“实业+金融”双轮驱动的集团公司,业务涵盖医疗和互联网金融两个领域。其中医疗领域以北京联达动力信息科技股份有限公司领衔,公司已于2015年成功 ...
2018-04-09【广州市微帝电子商务有限公司】招聘数据分析师 广州市微帝电子商务有限公司,以全新的理念和运作模式立足广东、辐射全国各地。“实体+移动端+互联网=专业化的合作”,公司现设五大中心——运营中心、新媒体中心、行 ...
2018-04-09【上海匹匹扣网络科技有限公司】招聘数据分析师 上海匹匹扣网络科技有限公司,成立于2013年,基于专业的创始团队及强大的互联网基因创立旅游圈——旅游互联网品牌。北京匹匹扣国际旅行社有限公司,是上海匹匹扣网络 ...
2018-04-09区块网,什么是区块链技术?什么叫区块链 区块链是一种分布式共享记账的技术,它要做的事情就是让参与的各方能够在技术层面建立信任关系。 区块链可以大致分成两个层面,一是做区块链底层技术;二是做区块链 ...
2018-04-09Python变量赋值的秘密分享 在Python中,我们令一个变量等于另外一个变量时,并不是把值传递给它,而是直接把指向的地址更改了。我们想要查看一个变量在内存中的地址,可以通过id(变量) 来查看。我们通过一个小 ...
2018-04-09Python图形绘制操作之正弦曲线实现方法分析 这篇文章主要介绍了Python图形绘制操作之正弦曲线实现方法,涉及Python使用numpy模块数值运算及matplotlib.pyplot模块进行图形绘制的相关操作技巧,需要的朋友可以参考 ...
2018-04-09大数据会说话,简明机器学习问题 从数据中学习究竟是什么?科学家从数据中学习,企业、政府和慈善机构也一样。事实上,无论是私人、公共的,还是慈善部门的领域,几乎没有哪个领域不在部署数据驱动的模型,以发 ...
2018-04-09大数据如何帮助我们改善大气环境 大数据可以把现有的旧能源网络变成更加智能的网络,能够了解个人的能源消耗状况。这无疑将提高效率,降低能源价格并帮助我们减少碳排放量。 智能能源网格 在不久的将来,将 ...
2018-04-09机器学习中的非均衡分类问题 非均衡分类问题是指在分类器训练时,正例数目和反例数目不相等(相差很大),或者错分正反例导致的代价不同(可从代价矩阵观测)时存在的问题。 而大多数情况下,不同类别的分类 ...
2018-04-09如何解决分类中的样本倾斜问题 先来说说样本的偏斜问题,也叫数据集偏斜(unbalanced),它指的是参与分类的两个类别(也可以指多个类别)样本数量差异很大。比如说正类有10,000个样本,而负类只给了10 ...
2018-04-09云计算,大数据,人工智能为何总是捆绑出现 在谈到创新型前沿科技的时候,我们会发现一个有趣的现象,\"云计算、大数据、人工智能\"这三个概念经常是\"捆绑式\"出现,它们之间好像有什么紧密的关联,在谈到云 ...
2018-04-09大数据驱动国家治理的未来图景 大数据是信息化发展的新阶段。大数据是一种创新技术、一种基础设施、一种生产要素、一种战略资源、一种科技产业,也是一种治理技术。随着互联网技术的迅猛发展,大数据已经成为了 ...
2018-04-09【北京康普森生物技术有限公司】招聘数据分析师 北京康普森生物技术有限公司(以下简称“康普森生物”)是中关村生命科学园内的国家级高新技术企业,公司自2011年注册成立以来一直致力于为生命科学、动植物分子育种 ...
2018-04-08【义米能源科技(上海)有限公司】招聘数据分析师 义米能源科技(上海)有限公司,属于上海盛海石油化工有限公司旗下公司。义米能源希望通过自身的不断创新,采用先进的技术,整合线下资源和线上资源,改变物流企业传 ...
2018-04-08【上海极高信息技术有限公司】招聘数据分析师 上海极高信息技术有限公司以互联网技术为核心,第三方电商平台及自研跨境移动电商平台为基础,依托互联网社交分享营销理念,专注于跨境出口零售的垂直类电子商务平台业 ...
2018-04-08区块链数据的价值体现方式 很多人在提到大数据的时候,都会提到这样一个观点:数据即价值。宏观的来看这个论点,没什么问题。然而,我们如果回溯一下这个观点的论证过程,就会发现一些有意思的事情。 信息本 ...
2018-04-08在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30