CDA数据科学研究院 CDA考试中心 企业服务 关于CDA

cda

全国校区

首页 > 技术干货

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)
2017-05-19
R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等) 情感分析中对文本处理的数据的小技巧要求比较高,笔者在学习时候会为一些小技巧感到头疼不已。 主要包括以下内容: 1 批量读取txt ...

R语言︱集合运算—小而美法则

R语言︱集合运算—小而美法则
2017-05-19
R语言︱集合运算—小而美法则 集合运算的一般规则如下: union(x,y) #求并集 intersect(x,y) #求交集 setdiff(x,y) #求属于x而不属于y的所有元素 setequal(x,y) #判断x与y是否相等 a %in% y #判断a是否为y ...
数据挖掘:层次性和时髦性
2017-05-19
数据挖掘:层次性和时髦性 在银行做了两年的数据分析和挖掘工作,较少接触互联网的应用场景,因此,一直都在思考一个问题,“互联网和金融,在数据挖掘上,究竟存在什么样的区别”。在对这个问题的摸索和理解过 ...
做好数据挖掘模型必读的9条高端经验总结
2017-05-19
做好数据挖掘模型必读的9条高端经验总结 数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。 当前的数据挖掘形式,是在20世纪90年代实践领 ...

用Python处理数据集中的缺失值

用Python处理数据集中的缺失值
2017-05-18
用Python处理数据集中的缺失值 现实生活中的数据经常存在缺失值。产生缺失值的原因有很多,如观察资料未被记录、数据损坏等。由于很多机器学习算法不支持存在缺失值的数据集,正确处理缺失值就显得比较重要了。 ...

Python做文本挖掘的情感极性分析

Python做文本挖掘的情感极性分析
2017-05-18
Python做文本挖掘的情感极性分析 「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前 ...

Python代码在实践过程中的经验总结

Python代码在实践过程中的经验总结
2017-05-18
Python代码在实践过程中的经验总结 关于Python脚本,在具体的实践过程中经常会遇到一些问题,下面将其总结,便于使用。考虑使用 Logger(logger 怎么配置,需要输出哪些信息 — 可以反向考虑,比方说看到这个 lo ...

利用Python,四步掌握机器学习

利用Python,四步掌握机器学习
2017-05-18
利用Python,四步掌握机器学习 为了理解和应用机器学习技术,你需要学习 Python 或者 R。这两者都是与 C、Java、PHP 相类似的编程语言。但是,因为 Python 与 R 都比较年轻,而且更加“远离”CPU,所以它们显得 ...
Python 文件I/O
2017-05-18
Python 文件I/O 打印到屏幕 最简单的输出方法是用print语句,你可以给它传递零个或多个用逗号隔开的表达式。此函数把你传递的表达式转换成一个字符串表达式,并将结果写到标准输出如下: #!/usr/bin/python # - ...

Python多进程并行编程实践: mpi4py的使用

Python多进程并行编程实践: mpi4py的使用
2017-05-18
Python多进程并行编程实践: mpi4py的使用 在高性能计算的项目中我们通常都会使用效率更高的编译型的语言例如C、C++、Fortran等,但是由于Python的灵活性和易用性使得它在发展和验证算法方面备受人们的青睐于是 ...

Python函数式编程,从入门到⎡放弃⎦

Python函数式编程,从入门到⎡放弃⎦
2017-05-17
Python函数式编程,从入门到⎡放弃⎦ 很早以前就听说过了函数式编程,印象中是一种很晦涩难懂的编程模式,但却一直没有去进行了解。 恰好这周组内的周会轮到我主持,一时也没想到要分享什么。灵光一闪,就 ...

Python面试中8个必考问题

Python面试中8个必考问题
2017-05-17
Python面试中8个必考问题 1、下面这段代码的输出结果是什么?请解释。 def extendList(val, list=[]): list.append(val) return list list1 = extendList(10) list2 = extendList(123,[]) list3 = extend ...

提高Python运行效率的六个窍门

提高Python运行效率的六个窍门
2017-05-17
提高Python运行效率的六个窍门 Python是一门优秀的语言,它能让你在短时间内通过极少量代码就能完成许多操作。不仅如此,它还轻松支持多任务处理,比如多进程。 不喜欢Python的人经常会吐嘈Python运行太慢。 ...

Python函数 “大脑移植”

Python函数 “大脑移植”
2017-05-17
Python函数 “大脑移植” 当我们在Python里定义函数时发生了什么呢? 关键字def有两个功能:它可以创建一个函数对象,然后把这个函数对象赋值给一个变量(即我们的函数名)。所以,当我们编写: Pyth ...

Python之os模块

Python之os模块
2017-05-17
Python之os模块 众所周知,python是一种强大的脚本语言,那么,问题来了,为什么不用python来编写Linux脚本呢?问题的答案就是python有os模块啊!这个os模块能够让你像在Linux命令行中操作文件一样,在python中 ...

用Python多线程实现生产者消费者模式

用Python多线程实现生产者消费者模式
2017-05-17
用Python多线程实现生产者消费者模式 什么是生产者消费者模式 在软件开发的过程中,经常碰到这样的场景: 某些模块负责生产数据,这些数据由其他模块来负责处理(此处的模块可能是:函数、线程、进程等)。 ...

SPSS编程在Ridit分析中的应用

SPSS编程在Ridit分析中的应用
2017-05-16
SPSS编程在Ridit分析中的应用 多样本有序分类资料(或等级资料)我们一般采用非参数检验——H检验(Kruskal-Wallis法),但其结论只得出三组或多组间总的有差别,若要知道两两间是否有差别,则没有Ridit分析只要一 ...

数据挖掘的五个误区

数据挖掘的五个误区
2017-05-16
数据挖掘的五个误区 许多成功的企业都发现了围绕着数据挖掘而产生的神话确实就是误解。这些企业没有成为这些误区的牺牲品,而是通过使用数据挖掘技术解决复杂的业务问题来增加利润,获取更大的竞争优势。 实 ...

数据挖掘大企业成功案例少 中小企业需求小

数据挖掘大企业成功案例少 中小企业需求小
2017-05-16
数据挖掘大企业成功案例少 中小企业需求小 台资餐饮企业\"一茶一座\"在内地发展迅猛,几年下来已经开了34家连锁店,历史数据累积到三千多万条;本土生产型企业\"乐百氏\"的门店几乎已铺遍全国,总部十分重视原 ...

利用WEKA编写数据挖掘算法

利用WEKA编写数据挖掘算法
2017-05-16
利用WEKA编写数据挖掘算法 WEKA是由新西兰怀卡托大学开发的开源项目。WEKA是由JAVA编写的,并且限制在GNU通用公众证书的条件下发布,可以运行在所有的操作系统中。WEKA工作平台包含能处理所有标准数据挖掘问题 ...

OK