python脚本实现分析dns日志并对受访域名排行 前段时间有个需求是要求查一段时间的dns上的域名访问次数排行(top100),没办法,只好慢慢的去解析dns日志呗,正好学习了python,拿来练练手。 1.原始数据分 ...
2018-02-05改善企业数据管理流程七个建议 为了对信息进行更好的监督和管理,从而改善业务运营效率,许多企业都开始投资数据治理项目。其策略和流程设计用来在整个企业中产生更为精确和一致的数据,数据专员(Data Steward ...
2018-02-05大数据一统天下 窃听何时休 互联网和智能通讯技术的应用和普及,加速了经济全球化的进程,拓宽了全球资讯传播分享界域,也增强了世界各国民众间的交流和互动。但是,从斯诺登事件的持续发酵和美国安局对全球网 ...
2018-02-05python中的set实现不重复的排序原理 最近在尝试写选课系统的时候遇到一个问题: 1、存在两个类 School、Teacher ; 2、School实例中包含多个Teacher的实例,但又不可重复 本人想到在School中用set( ...
2018-02-05Python中set与frozenset方法和区别详解 set(可变集合)与frozenset(不可变集合)的区别: set无序排序且不重复,是可变的,有add(),remove()等方法。既然是可变的,所以它不存在哈希值。基本功能包括关系 ...
2018-02-05大数据分析模式 折射出背后隐患 随着大数据的发展,大数据分析也已经应用到各个领域,大数据分析主要有三种类型,而这三种类型的背后也隐藏着不为人知的隐患,这些隐患是不容忽视的,亟需要彻底解决。 ...
2018-02-05Python中内置数据类型list,tuple,dict,set的区别和用法 Python语言简洁明了,可以用较少的代码实现同样的功能。这其中Python的四个内置数据类型功不可没,他们即是list, tuple, dict, set。这里对他们进行一个 ...
2018-02-05大数据与隐私安全并非矛盾体 大数据的发展,带来的社会价值和商业价值是不言而喻的,因此同时,隐私安全问题也为很多人所诟病,然而大数据与隐私安全真的是一对矛盾统一体吗?其实并非如此,这两者是完全可以兼 ...
2018-02-05python实现将元祖转换成数组的方法 本文实例讲述了python实现将元祖转换成数组的方法。分享给大家供大家参考。具体分析如下: python的元祖使用一对小括号表示的,元素是固定的,如果希望添加新的元素, ...
2018-02-05中国大数据市场和技术发展趋势 为了准确描述中国大数据市场和技术发展趋势,解析大数据发展的各阶段对IT技术的需求,2013年6月,中桥国际调研咨询(以下简称中桥)对中国480家最终用户的IT管理者和专业人员,就 ...
2018-02-05使用Python判断质数(素数)的简单方法讲解 质数又称素数。指在一个大于1的自然数中,除了1和此整数自身外,不能被其他自然数整除的数。素数在数论中有着很重要的地位。比1大但不是素数的数称为合数。1和0既非素 ...
2018-02-05大数据可否被神化 大数据的发展速度让人瞠目结舌,大数据应用的快速深入也引起业界广泛关注,如今,大数据总量的增长主要归功于非结构化数据的增长。 广义的非结构化数据也包括了半结构化和多结构化数据,目前 ...
2018-02-05【便利蜂商贸有限公司】招聘数据分析师 北京梦想蜂连锁商业有限公司是一家以科技创新为先导、以安全健康为核心、以便民高效为目标的创新创业企业,公司以“便利蜂”为品牌名称,于2016年12月在北京完成注册申请,注 ...
2018-02-04【蓝色光标-欧泰谱】招聘数据分析师 欧泰谱(http://www.otype.cn/)是蓝色光标全资CRM子公司,基于行业理解及消费者洞察,结合技术和数据发展趋势,专注为品牌主提供CRM营销服务。蓝色光标传播集团是一家为大型企业 ...
2018-02-04【上海步成教育科技有限公司】招聘数据分析师 上海步成教育科技有限公司注册于华东师范大学科技园,总部位于华东师范大学校内。上海步成教育科技有限公司是新型的高科技企业,是我国著名心理测量专家、华东师范大学 ...
2018-02-04本文实例分析了python动态性强类型用法。分享给大家供大家参考。具体如下: Python变量声明和定义 与C#不同,Python在使用变量之前无须定义它的类型,试着运行下面的例子: i = 12 print i python动态性强类型 ...
2018-02-04python+pillow绘制矩阵盖尔圆简单实例 本文主要研究的是使用Python+pillow绘制矩阵盖尔圆的一个实例,具体如下。 盖尔圆是矩阵特征值估计时常用的方法之一,其定义为: 与盖尔圆有关的两个定理为: 定 ...
2018-02-04浅谈插入排序算法在Python程序中的实现及简单改进 这篇文章主要介绍了插入排序算法在Python程序中的实现及简单改进,插入排序算法的最差时间复杂度为O(n^2),最优时间复杂度为O(n),存在一定的优化空间,需要的朋友 ...
2018-02-04大数据驱动创新思维 大数据时代的变革重要的并不是升级现有逻辑,而是需要创造一种新的逻辑。正如外军研究所强调,大数据时代所需要创造的逻辑,关键是需要人们在通常状态下开动左脑的同时,来充分唤醒沉睡的右 ...
2018-02-04python简单的函数定义和用法实例 这篇文章主要介绍了python简单的函数定义和用法,实例分析了Python自定义函数及其使用方法,具有一定参考借鉴价值,需要的朋友可以参考下 具体分析如下: 这里定义了一个温 ...
2018-02-04在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29