cda

数字化人才认证

首页 > 行业图谱 >

一句python,一句R︱python中的字符串操作、中文乱码、NaN情况

一句python,一句R︱python中的字符串操作、中文乱码、NaN情况
2017-07-17
一句python,一句R︱python中的字符串操作、中文乱码、NaN情况 先学了R,最近刚刚上手Python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。 pandas可谓如雷贯耳, ...

R语言:数据处理包dplyr的函数

R语言:数据处理包dplyr的函数
2017-07-07
R语言:数据处理包dplyr的函数 dplyr专注处理dataframe对象, 并提供更稳健的与其它数据库对象间的接口。 一、5个关键的数据处理函数: select()   返回列的子集 filter()     返回行的子 ...

R字符串处理应用之邮件考勤自动化

R字符串处理应用之邮件考勤自动化
2017-07-05
R字符串处理应用之邮件考勤自动化 最近发现,担任助教真不是一件轻松的事情啊。虽然老师一直在想方设法减轻我的工作负担,可是核对名单真的是一件考验眼力和耐力的事情。 最近有一件非常艰巨的任务:检查上 ...

R语言进行中文分词和聚类

R语言进行中文分词和聚类
2017-07-02
R语言进行中文分词和聚类 由于时间较紧,且人手不够,不能采用分类方法,主要是没有时间人工分类一部分生成训练集……所以只能用聚类方法,聚类最简单的方法无外乎:K-means与层次聚类。 尝试过使用K-means ...

Python中字符串中的数字提取方法

Python中字符串中的数字提取方法
2017-06-28
Python中字符串中的数字提取方法 逛到一个有意思的博客 在里面看到一篇关于ValueError: invalid literal for int() with base 10错误的解析,针对这个错误,博主已经给出解决办法,使用的是re.sub 方法 1 t ...

R爬虫之京东商城手机信息批量获取

R爬虫之京东商城手机信息批量获取
2017-06-27
R爬虫之京东商城手机信息批量获取 人手一部智能手机的移动互联网时代,智能手机对很多人来说,它就像我们身上生长出来的一个器官那样重要。如果你不能对各大品牌的『卖点』和『受众』侃上一阵,很可能会被怀疑 ...

R语言从SNPedia批量提取搜索数据

R语言从SNPedia批量提取搜索数据
2017-06-11
R语言从SNPedia批量提取搜索数据  SNP是单核苷酸多态性,人的基因是相似的,有些位点上存在差异,这种某个位点的核苷酸差异就做单核苷酸多态性,它影响着生物的性状,影响着对某些疾病的易感性。SNPedia是 ...

使用R语言预测泰坦尼克号乘客生存率

使用R语言预测泰坦尼克号乘客生存率
2017-06-09
使用R语言预测泰坦尼克号乘客生存率 1912年4月10日,号称 “世界工业史上的奇迹”的豪华客轮泰坦尼克号开始了自己的处女航,从英国的南安普顿出发驶往美国纽约,4月14日晚,泰坦尼克号在北大西洋撞上冰山而倾覆 ...

13个真实世界情景中的数据科学应用

13个真实世界情景中的数据科学应用
2017-06-06
13个真实世界情景中的数据科学应用 现在让我们看看13个在真实世界情景下的例子,了解现代数据科学家可以帮助我们做些什么。这些例子将有助于你学习如何专注于一个问题和如何形式化一个问题,以及如何仔细评估所 ...

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)

R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等)
2017-05-19
R语言︱词典型情感分析文本操作技巧汇总(打标签、词典与数据匹配等) 情感分析中对文本处理的数据的小技巧要求比较高,笔者在学习时候会为一些小技巧感到头疼不已。 主要包括以下内容: 1 批量读取txt ...

R语言基因组数据分析可能会用到的data.table函数整理

R语言基因组数据分析可能会用到的data.table函数整理
2017-04-28
R语言基因组数据分析可能会用到的data.table函数整理 R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。包括两个方面,一方面是写的快,代码简洁,只要一行命令就可以完 ...

R语言函数收藏||字符串处理-grep/grepl/sub/gsub

R语言函数收藏||字符串处理-grep/grepl/sub/gsub
2017-04-21
R语言函数收藏||字符串处理-grep/grepl/sub/gsub 处理文本是每一种计算机语言都应该具备的功能,但不是每一种语言都侧重于处理文本。R语言是统计的语言,处理文本不是它的强项,perl语言这方面的功能比R不知要 ...

Python 实现一个火车票查询的工具

Python 实现一个火车票查询的工具
2017-04-19
使用 python 实现一个查询火车票的小工具 主要功能: 输入出发车站,到达车站,时间,然后返回所有的车次信息,和余票信息 支持输入附加选项查询不同的火车的类型,比如高铁,动车。 #查询上海到北京2017-04-25的 ...

Python标准库—走马观花

Python标准库—走马观花
2017-04-18
Python标准库—走马观花 Python有一套很有用的标准库(standard library)。标准库会随着Python解释器,一起安装在你的电脑中的。它是Python的一个组成部分。这些标准库是Python为你准备好的利器,可以让编程事半 ...

Python路径与文件 (os.path包, glob包)

Python路径与文件 (os.path包, glob包)
2017-04-17
Python路径与文件 (os.path包, glob包) os.path包 os.path包主要是处理路径字符串,比如说\'/home/vamei/doc/file.txt\',提取出有用信息。 import os.path path = \'/home/vamei/doc/file.txt\' print(os.pat ...

用R语言做网页爬虫和文本分析

用R语言做网页爬虫和文本分析
2017-02-24
用R语言做网页爬虫和文本分析 受到这篇情感分析的文章和这篇网页爬虫指南的双重启发,我决定尝试抓取并分析 Goodreads 网站的书评数据。这个项目将会呈现一个从数据收集到机器学习建模分析的完整案例,我在中途 ...

R中的apply族函数

R中的apply族函数
2017-02-19
R中的apply族函数 如果计算涉及到 一个单一的向量,而结果也是一个向量 , tapply函数 是一个可选项,不同于aggregate函数,它返回一个向量或数组,这使得其单个元素很容易被访问。 将 ...

python数据分析笔记—数据加载与整理

python数据分析笔记—数据加载与整理
2017-02-18
python数据分析笔记—数据加载与整理 数据加载 导入文本数据 1、导入文本格式数据(CSV)的方法: 方法一:使用pd.read_csv(),默认打开csv文件。 9、10、11行三种方式均可以导入文本 ...

使用Python进行大数据分析

使用Python进行大数据分析
2017-01-31
使用Python进行大数据分析 毫不夸张地说,大数据已经成为任何商业交流中不可或缺的一部分。桌面和移动搜索向全世界的营销人员和公司以空前的规模提供着数据,并且随着物联网的到来,大量用以消费的数据还会呈指 ...

R语言爬虫初尝试-基于RVEST包学习

R语言爬虫初尝试-基于RVEST包学习
2017-01-11
R语言爬虫初尝试-基于RVEST包学习 在学完coursera的getting and Cleaning data后,继续学习用R弄爬虫网络爬虫。主要用的还是Hadley Wickham开发的rvest包。再次给这位矜矜业业开发各种好用的R包的大神奉上膝盖 ...

OK