cda

数字化人才认证

首页 > 行业图谱 >

123 3/3

机器学习项目中的数据预处理与数据整理之比较

机器学习项目中的数据预处理与数据整理之比较
2017-05-10
机器学习项目中的数据预处理与数据整理之比较 要点 在常见的机器学习/深度学习项目里,数据准备占去整个分析管道的60%到80%。 市场上有各种用于数据清洗和特征工程的编程语言、框架和工具。它们之间的 ...

Python数学与随机数 (math包,random包)

Python数学与随机数 (math包,random包)
2017-04-16
Python数学与随机数 (math包,random包) 我们已经在Python运算中看到Python最基本的数学运算功能。此外,math包补充了更多的函数。当然,如果想要更加高级的数学功能,可以考虑选择标准库之外的numpy和scipy项 ...

2016年终盘点大数据篇:跨越巅峰,迈向成熟

2016年终盘点大数据篇:跨越巅峰,迈向成熟
2017-02-19
2016年终盘点大数据篇:跨越巅峰,迈向成熟 大数据技术在2016年继续取得高速的发展,并且在大数据相关的每个细分的环节,都有不同的创新的点。让我们来看看这一年,大数据技术的一些重要进展和趋势。 大数据 ...

谷歌的海量数据排序实验史

谷歌的海量数据排序实验史
2016-04-12
谷歌的海量数据排序实验史 自从相关工具创建以来,我们一直通过对海量的随机数据执行排序来测试MapReduce。这种方式很受欢迎,因为生成任意数量的数据非常简单,想要验证输出结果是否正确也很简单。 尽管最 ...

大数据盘点之Spark篇

大数据盘点之Spark篇
2016-01-13
文 | 谭政 来源 | 炼数成金 作者简介 谭政,Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。专注于大数据存储和处理,对 Hadoop、HBase 以及 Spark 等 ...

Hadoop无法解决的难题

Hadoop无法解决的难题
2015-12-20
Hadoop无法解决的难题 因为项目的需要,学习使用了Hadoop,和所有过热的技术一样,“大数据”、“海量”这类词语在互联网上满天乱飞。Hadoop是一个非常优秀的分布式编程框架,设计精巧而且目前没有同级别同 ...

关于用户行为几类大数据计算_数据分析师

关于用户行为几类大数据计算_数据分析师
2015-01-04
关于用户行为几类大数据计算_数据分析师 用户行为类数据是最常见的大数据形式,比如电信的通话记录、网站的访问日志、应用商店的app下载记录、银行的账户信息、机顶盒的观看记录、股票的交易记录、保险业的 ...

1/10计算资源,1/3耗时,Spark颠覆MapReduce保持的排序记录_数据分析师

1/10计算资源,1/3耗时,Spark颠覆MapReduce保持的排序记录_数据分析师
2014-11-25
1/10计算资源,1/3耗时,Spark颠覆MapReduce保持的排序记录_数据分析师 在过去几年,Apache Spark的采用以惊人的速度增加着,通常被作为MapReduce后继,可以支撑数千节点规模的集群部署。在内存 ...
123 3/3

OK