cda

数字化人才认证

首页 > 行业图谱 >

用机器学习构建O(N)复杂度的排序算法,可在GPU和TPU上加速计算

用机器学习构建O(N)复杂度的排序算法,可在GPU和TPU上加速计算
2018-08-01
用机器学习构建O(N)复杂度的排序算法,可在GPU和TPU上加速计算 排序一直是计算机科学中最为基础的算法之一,从简单的冒泡排序到高效的桶排序,我们已经开发了非常多的优秀方法。但随着机器学习的兴起与大数据的 ...

神经网络测试结果很差,该怎么做

神经网络测试结果很差,该怎么做
2018-07-26
神经网络测试结果很差,该怎么做 当我们编程实现了神经网络模型,将模型用于测试集时,经常会发现测试的准确率非常的低,神经网络层数很深,通常我们不容易判断具体的梯度下降求解参数的过程,那我们该 ...

神经网络的关键是什么

神经网络的关键是什么
2018-07-25
神经网络的关键是什么 相对于传统的线性和非线性方法,为什么神经网络会如此强大? 当你有一个线性模型,每一个功能要么对你有帮助,要么对你有伤害,这种假设是线性模型中固有的。因此线性模型要么功能异常 ...

资源 | 一个Python特征选择工具,助力实现高效机器学习

资源 | 一个Python特征选择工具,助力实现高效机器学习
2018-07-11
资源 | 一个Python特征选择工具,助力实现高效机器学习 鉴于特征选择在机器学习过程中的重要性,数据科学家 William Koehrsen 近日在 GitHub 上公布了一个特征选择器 Python 类,帮助研究者更高效地完成特征选 ...

算法太多挑花眼?教你如何选择正确的机器学习算法

算法太多挑花眼?教你如何选择正确的机器学习算法
2018-07-05
算法太多挑花眼?教你如何选择正确的机器学习算法 机器学习算法虽多,却没有什么普适的解决方案。决策树、随机森林、朴素贝叶斯、深度网络等等等等,是不是有时候觉得挑花了眼呢?福利来啦~本文将教你慧眼识精 ...

从零开始用Python构建神经网络

从零开始用Python构建神经网络
2018-07-04
从零开始用Python构建神经网络 动机:为了更加深入的理解深度学习,我们将使用 python 语言从头搭建一个神经网络,而不是使用像 Tensorflow 那样的封装好的框架。我认为理解神经网络的内部工作原理,对数据科学 ...

量化多种策略受关注 发展核心在研发

量化多种策略受关注 发展核心在研发
2018-06-26
量化多种策略受关注 发展核心在研发 近年市场和行情的变化,给量化投资团队带来了巨大的挑战。不少量化私募顺应市场做出调整,从加强风险控制、优化升级策略、开发新策略等角度进行探索。私募表示量化投资最核 ...

机器学习入门之多项式曲线拟合

机器学习入门之多项式曲线拟合
2018-06-22
机器学习入门之多项式曲线拟合 机器学习和人工智能是最近几年特别火的领域,比如微软小冰、微软cortana、苹果siri、谷歌Now和alphaGo都使用了机器学习,使得他们的产品变得更加智能。 当然除了这些科技巨头, ...

决策树、随机森林简单原理和实现

决策树、随机森林简单原理和实现
2018-06-16
决策树、随机森林简单原理和实现 一:概念 决策树(Decision Tree)是一种简单但是广泛使用的分类器。通过训练数据构建决策树,可以高效的对未知的数据进行分类。决策数有两大优点:1)决策树模型可以读性好 ...

R语言︱决策树族——随机森林算法

R语言︱决策树族——随机森林算法
2018-06-15
R语言︱决策树族——随机森林算法 一、随机森林理论介绍 1.1 优缺点 优点。 (1)不必担心过度拟合; (2)适用于数据集中存在大量未知特征; (3)能够估计哪个特征在分类中更重要; (4)具有很好的抗噪声能力; (5) ...

几个常用机器学习算法 - 决策树算法

几个常用机器学习算法 - 决策树算法
2018-06-14
几个常用机器学习算法 - 决策树算法 1 决策树算法(Decision Tree)是从训练数据集中归纳出一组分类规则的过程。 实际操作中,与训练数据集不相矛盾的决策树可能有多个,也可能一个都没有;理想情况是找到一个 ...

一文搞定数据科学和机器学习的最常见面试题

一文搞定数据科学和机器学习的最常见面试题
2018-06-13
一文搞定数据科学和机器学习的最常见面试题 去的几个月中,我参加了一些公司数据科学、机器学习等方向初级岗位的面试。 我面试的这些岗位和数据科学、常规机器学习还有专业的自然语言处理、计算机视觉相关。 ...

机器学习模型可解释的重要及必要性

机器学习模型可解释的重要及必要性
2018-06-06
机器学习模型可解释的重要及必要性 不管你是管理自己的资金还是客户资金,只要你在做资产管理,每一步的投资决策都意义重大,做技术分析或基本面分析的朋友很清楚地知道每一个决策的细节,但是通过机器学 ...

scikit-learn 逻辑回归类库使用小结

scikit-learn 逻辑回归类库使用小结
2018-05-20
scikit-learn 逻辑回归类库使用小结 1. 概述 在scikit-learn中,与逻辑回归有关的主要是这3个类。LogisticRegression, LogisticRegressionCV 和logistic_regression_path。其中LogisticRegression和Logi ...

一文详解计算机视觉五大技术

一文详解计算机视觉五大技术
2018-05-16
一文详解计算机视觉五大技术 目前,计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉实际上是一个跨领域的交叉学科,包括计算机科学(图形、算法、理论、系统、体系结构),数学(信息检索、机器学习 ...

数据科学家需要掌握的十大统计技术详解

数据科学家需要掌握的十大统计技术详解
2018-05-15
数据科学家需要掌握的十大统计技术详解 「数据科学家比程序员擅长统计,比统计学家擅长编程。」本文介绍了数据科学家需要掌握的十大统计技术,包括线性回归、分类、重采样、降维、无监督学习等。 不管你对数 ...

如何设计出一个比较成功量化策略

如何设计出一个比较成功量化策略
2018-05-07
如何设计出一个比较成功量化策略 设计量化交易策略其实就是一个想法+验证的过程。 一、想法的来源: 大概有以下几个思路: 1、金融理论。 金融理论里资产定价的核心就是无套利原则。这里说的套利 ...

教你用Python实现简单监督学习算法

教你用Python实现简单监督学习算法
2018-04-05
教你用Python实现简单监督学习算法 监督学习作为运用最广泛的机器学习方法,一直以来都是从数据挖掘信息的重要手段。即便是在无监督学习兴起的近日,监督学习也依旧是入门机器学习的钥匙。 这篇监督学习教程 ...

机器学习中训练样本不均衡问题

机器学习中训练样本不均衡问题
2018-04-03
机器学习中训练样本不均衡问题 在实际中,训练模型用的数据并不是均衡的,在一个多分类问题中,每一类的训练样本并不是一样的,反而是差距很大。比如一类10000,一类500,一类2000等。解决这个问 ...

深度学习入门课程学习笔记03 损失函数

深度学习入门课程学习笔记03 损失函数
2018-04-02
深度学习入门课程学习笔记03 损失函数 前向传播之-损失函数 损失函数:在前面一节咱们介绍了得分函数,就是给定一个输入,对于所有类别都要给出这个输入属于该类别的一个分值,如上图所示,对于每一 ...

OK