CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

基于最小二乘法的异常行为分析模型设计

基于最小二乘法的异常行为分析模型设计
2016-04-21
基于最小二乘法的异常行为分析模型设计 本文针对异常访问现状及问题进行简要描述,在此基础上提出基于一元线性回归的最小二乘法异常访问分析模型,通过该模型解决了异常访问中时间与访问间相关性问题。 异常 ...
机器学习中的随机森林模型
2016-04-21
机器学习中的随机森林模型 01 树与森林 在构建决策树的时候,可以让树进行完全生长,也可以通过参数控制树的深度或者叶子节点的数量,通常完全生长的树会带来过拟合问题。过拟合一般由数据中的噪声和离群点 ...
数据科学家获取更高薪资的几点建议
2016-04-21
数据科学家获取更高薪资的几点建议 每年秋天,我都将在西北分析科学硕士项目当中教授分析领导力课程。我们很骄傲每年的课堂上都会出现非常有天赋的学员。毕业的学员大都会以数据分析师的职位加入到公司或 ...

如何构建落地型的数据分析流程?

如何构建落地型的数据分析流程?
2016-04-21
如何构建落地型的数据分析流程? 数据工作者最长也是有效的一种工作方式是带项目,无论是数据分析还是专项挖掘,项目制能使数据尽量贴近业务并且有效理解业务和数据的各个维度。那么如何建立面向业务落地的数据 ...

简单有效的数据分析才是王道

简单有效的数据分析才是王道
2016-04-21
简单有效的数据分析才是王道 越来越多的公司开始倡导‘用数据说话’,利用数据分析来帮助公司进行商务运营和制定决策。但如果一个公司试图对所有可能收集到的数据进行分析或者期望用数字来解决一切问题,那便又 ...

基于树的建模-完整教程(R & Python)

基于树的建模-完整教程(R & Python)
2016-04-21
基于树的建模-完整教程(R & Python) 基于树的学习算法被认为是最好的方法之一,主要用于监测学习方法。基于树的方法支持具有高精度、高稳定性和易用性解释的预测模型。不同于线性模型,它们映射非线性关 ...

基于协同过滤的推荐系统

基于协同过滤的推荐系统
2016-04-20
基于协同过滤的推荐系统 协同过滤是一种基于一组兴趣相同的用户或项目进行的推荐,它根据邻居用户(与目标用户兴趣相似的用户)的偏好信息产生对目标用户的推荐列表。协同过滤算法主要分为基于用户的协同过 ...

支持向量机实例讲解

支持向量机实例讲解
2016-04-20
支持向量机实例讲解 简介 掌握机器学习算法不再是天方夜谭的事情。大多数初学者都是从回归模型学起。虽然回归模型简单易学易上手,但是它能解决我们的需求吗?当然不行!因为除了回归模型外我们还可以构建许 ...

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林

WePay机器学习反欺诈实践:Python+scikit-learn+随机森林
2016-04-20
WePay机器学习反欺诈实践:Python+scikit-learn+随机森林 什么是shell selling? 虽然欺诈几乎涉及各种领域,但相对于传统的买方或卖方仅仅担心对方是否是骗子,支付平台需要担心的是交易双方。如果其中任何 ...

SPSS主成分分析与因子分析之比较及实证分析

SPSS主成分分析与因子分析之比较及实证分析
2016-04-20
SPSS主成分分析与因子分析之比较及实证分析 一、问题的提出 在科学研究或日常生活中,常常需要判断某一事物在同类事物中的好坏、优劣程度及其发展规律等问题。而影响事物的特征及其发展规律的因素(指标)是 ...
加密你的SAS macro程序
2016-04-20
加密你的SAS macro程序 如果别人要使用你的macro,你不想让他看到源程序,加密下就好了。具体操作如下: *定义宏文件目录及设置相关的选项(红色部分代码,在你调用宏的程序里也要加上,这样才能直接 ...

SAS中用ODS指定以PDF格式保存统计过程的输出图形

SAS中用ODS指定以PDF格式保存统计过程的输出图形
2016-04-20
SAS中用ODS指定以PDF格式保存统计过程的输出图形 假如希望将特定统计过程的图形输出对象以pdf格式保存,可以通过以下路径: 1.利用ods trace识别图形输出对象名称。 2.利用ods pdf指定输出 ...

以“上大学分析”为例体验什么是数据挖掘

以“上大学分析”为例体验什么是数据挖掘
2016-04-19
谈到BI,就会谈到数据挖掘(Data mining)。数据挖掘是指用某些方法和工具,对数据进行分析,发现隐藏规律并利的一种方法。下面我们将通过具体的例子来学习什么是数据挖掘。 案例“上大学分析”-体验什么是数据 ...
Excel实用操作技巧九则
2016-04-19
Excel实用操作技巧九则 本人使用Excel已经有一段时间,使用时学到过一些技巧,现介绍一部分如下:   1、快速输入大写中文数字 将光标移至需要输入大写数字的单元格中。利用数字小键盘在单元格中输 ...
三种优化方式让你的数据分析如虎添翼
2016-04-19
三种优化方式让你的数据分析如虎添翼 每年,数据技术企业需要管理的数据量和数据类型正在不断攀升。我们平时所谓的大数据,包括了从社交网站的博文、音频和图像到成交记录、传感器信息数据和视频的的每一 ...

5步教你如何开展完美的用户调研分析

5步教你如何开展完美的用户调研分析
2016-04-19
5步教你如何开展完美的用户调研分析 用户调研作为产品人员最常用的工作方式,相信各位一定不会陌生。但如何提高用户调研的有效性却是一直困扰大家的问题,网上有一堆提供调研方法的文章与理论,但是却没有 ...

游戏运营的常规数据分析思路分享

游戏运营的常规数据分析思路分享
2016-04-19
游戏运营的常规数据分析思路分享 数据分析工作可以从宏观数据和微观数据(细分数据)说起,这种方式也是我比较喜欢的,宏观数据是对总体趋势的预测,以及对异常数据的敏感性把握。而微观数据分析的来源一方面 ...

如何提高数据可读性的一些技巧

如何提高数据可读性的一些技巧
2016-04-19
如何提高数据可读性的一些技巧 表格的应用 由于工作原因,经常接触到表格。我们发现,表格不但广泛的运用在各类数据收集和分析,同时通过表格这样一种二维矩阵来整理和陈列信息时(即便最后的展示方式并非一 ...

大数据思维的十大原理,你知道几个

大数据思维的十大原理,你知道几个
2016-04-19
大数据思维的十大原理,你知道几个 一、数据核心原理 从“流程”核心转变为“数据”核心 大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是 ...
因子分析和主成分分析的10大不同
2016-04-18
每每谈起主成分和因子有啥区别,楼主总是有种心里大概明白,但就是说不清的感觉,终于看到一篇帖子,从十个方面阐述了两者的区别,留作纪念,同时也发给大家做个参考: 1.原理不同 主成 ...

OK