海量数据带来极致痛苦 每天,我们都在创建难以估算的海量数据。现在全球90%的数据都是过去两年间产生的,这些数据来源广泛,包括气象信息收集传感器、社交媒体内容、在线数码照片和视频、在线交易记录及手机GP ...
2018-07-09python通过线程实现定时器timer的方法 本文实例讲述了python通过线程实现定时器timer的方法。分享给大家供大家参考。具体分析如下: 这个python类实现了一个定时器效果,调用非常简单,可以让系统定时执行指定 ...
2018-07-09Python实现求解一元二次方程的方法示例 本文实例讲述了Python实现求解一元二次方程的方法。分享给大家供大家参考,具体如下: 1. 引入math包 2. 定义返回的对象 3. 判断b*b-4ac的大小 具体计算代码如下: # -* ...
2018-07-09如何提高数据质量 大数据时代带来了海量、多样、非结构化的数据,我们得以进行更加广泛且深入的分析,但这必须建立在高质量的数据上才有意义。本期以企业级的视角,介绍数据质量的评价、提升与监控。 大数据 ...
2018-07-09用R语言把超大文本文件拆分成几个小文本文件 近一段时间一直在研究一些医院的数据。前两天遇到一个尴尬:想打开一个仅有3G左右的文本文件(有时候必须要打开,直接传到数据库满足不了需求),破电脑(4G内存的 ...
2018-07-08【北京中天方木教育科技有限公司】招聘数据分析师 公司团队由来自海外或有多年金融投资经验的专业精英组成。荟鑫资本立志缔造企业品牌价值,以客户服务为主导,为员工、客户及投资者创富增值。我们坚信专业化的知识 ...
2018-07-08【广州明鑫信息科技有限公司】招聘数据分析师 广州明鑫信息科技有限公司是一家专业从事贵金属投资服务的金融机构,是广东省工商管理局登记批准,专业提供贵金属投资咨询管理服务,秉承“诚信服务,信誉第一”的经营 ...
2018-07-08【广州沣鼎实业投资有限公司】招聘数据分析师 广州沣鼎实业投资有限公司是一家专业从事贵金属、外汇投资服务的金融机构,是广东省工商管理局登记批准,专业提供外汇、贵金属投资咨询管理服务,秉承“诚信服务,信誉 ...
2018-07-08Excel-箱线图(数据分布)分析 箱线图(Boxplot)也称箱须图(Box-whisker Plot),它是用一组数据中的最小值、第一四分位数、中位数、第三四分位数和最大值来反映数据分布的中心位置和散布范围,可以粗略地看 ...
2018-07-08区块链是如何重塑广告和媒体领域的 数字广告欺诈是商业界的一个重大问题。事实上,广告欺诈是一个非常严重的问题,37%的受访广告客户会乐意支付额外费用,以确保他们所支付的流量能与一个真正的人联系在一起。 ...
2018-07-08基于大数据的视觉搜索应用与组织模式研究 当前视觉搜索已成为信息科学领域的前沿课题,主要用于分析和研究现实世界实体属性、行为、事件与视觉大数据资源之间的发展规律,针对视觉大数据资源的获取、组织、描述 ...
2018-07-08准确真实数据决定信息化价值 企业信息化可以实现数据的全局共享,前提是必须在规范化的数据基础上运行。对此有些企业提出了建设数据中心的思路,高度集中管理企业数据资源。从而使企业在实施信息化建设时,需要 ...
2018-07-08大数据时代下的迁移学习 迁移学习不是机器学习的一个模型或技术,它是机器学习中的一种“设计方法论”,还有一些其他的设方法论,比如说主动学习。 本文是AI科技大本营编译的迁移学习系列的第一篇文章。第二 ...
2018-07-08大数据:存储技术必须跟上 “大数据” 通常指的是那些数量巨大、难于收集、处理、分析的数据集,亦指那些在传统基础设施中长期保存的数据。这里的“大”有几层含义,它可以形容组织的大小,而更重要的是,它界 ...
2018-07-08Python编程实现数学运算求一元二次方程的实根算法示例 本文实例讲述了Python编程实现数学运算求一元二次方程的实根算法。分享给大家供大家参考,具体如下: 问题: 请定义一个函数quadratic(a, b, c),接收3个 ...
2018-07-08利用python求解物理学中的双弹簧质能系统详解 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧。 物理的模型如 ...
2018-07-08python求列表交集的方法汇总 本文实例汇总了python求列表交集的方法。分享给大家供大家参考。具体方法如下: 交集对于给定的两个集合A 和 集合B 的交集是指含有所有既属于 A 又属于 B 的元素,而没有其他元 ...
2018-07-08大数据的特点及应对策略 大数据的主要特点 要理解大数据这一概念,首先要从“大”入手,“大”是指数据规模,大数据一般指在10TB(1TB=1024GB)规模以上的数据量。大数据同过去的海量数据有所区别,其基本特 ...
2018-07-08【植物医生DR PLANT】招聘数据分析师 植物医生DR PLANT高山植物护肤品牌,隶属于北京明弘科贸有限责任公司,创始于1994年,20多年来一直专注植物护肤领域,如今已与中国最具影响力的国际卖场及重要的连锁购物中心、 ...
2018-07-07【浙江中隧桥波形钢腹板有限公司】招聘数据分析师 浙江中隧桥致力于波形钢板和特种钢结构技术的开拓与倡导,从事波形钢腹板组合箱梁、波形H型钢与工字钢、波形钢板结构桥面系、波形钢腹板专用施工挂篮、波形钢腹板叠 ...
2018-07-07在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30