数据科学专业问答社区，好文章，一字千金--CDA答疑社区

热线电话：13121318867

登录

啊啊啊啊啊吖

学习笔记-集合

集合（set），它表示为一组不同的元素：s = set()s.add(1) # s现在是1s.add(2) # s现在是{1,2}s.add(2) # s还是{1,2}x = len(s) # 等于2y = 2 in s # 等于Truez = 3 in s # 等于False我们使用集合的原因主要有两个。第一个是集合上有一种非常快速的操作： in。如果我们有大量的项目，希望对它

0.0000

0

3

0

关注作者

收藏

啊啊啊啊啊吖

学习笔记-字典

Python 中的一种基本数据结构是字典，它将值与键联系起来，让我们可以通过键快速找到对应值：empty_dict = {} # Python风格empty_dict2 = dict() # 更少的Python风格grades = { "Joel" : 80, "Tim" : 95 } # 字典你也可以通过方括号查找键的值：joels_grade = grades["Joel"] #

0.0000

0

3

0

关注作者

收藏

詹惠儿

文本挖掘中使用的特征工程技术是什么？

你知道你正在阅读的这一行的每个单词都可以转换成一个函数吗？是的，你听错了。文本数据提供了广泛的可能性来生成新函数。但有时候，我们最终会产生很多功能，在某种程度上处理它们会变成一项痛苦的任务。因此，我们应该仔细分析提取的特征。别担心！下面解释的方法也有助于减少结果数据集的维度。以下是使用的常用功能工程方法列表： 1. n-gram ：在文档语料库中，1

0.0000

0

4

0

关注作者

收藏

啊啊啊啊啊吖

学习笔记-元组

元组是列表的亲表哥。你对列表做的很多操作都可以对元组做，但不包括修改。元组通过圆括号（或者什么都不加）而不是方括号来给出具体的描述：my_list = [1, 2]my_tuple = (1, 2)other_tuple = 3, 4my_list[1] = 3 # my_list现在是[1, 3]try:my_tuple[1] = 3except TypeError:print

0.0000

0

3

0

关注作者

收藏

詹惠儿

关于正则表达式的练习示例（二）

6.从一行文本中删除标点符号going

0.0000

0

2

0

关注作者

收藏

詹惠儿

关于正则表达式的练习示例（一）

1.从一串字符中提取数字#extract digits - all 4 works string

0.0000

0

0

0

关注作者

收藏

詹惠儿

R中可用POSIX字符类

在R中，POSIX字符类可以被标识为包含在双方括号内[（[]]）。表达式之前的插入符号限定了表达式的值。我发现这些类比其他类更直观，因此更容易学习。以下是R中可用的posix字符类：

0.0000

0

2

0

关注作者

收藏

zxq997

数据库常用的数据函数

为了方便计算及处理数据，SQL语句为我们提供了大量函数，这些函数主要分为数学函数，字符串函数，日期和时间函数以及其他函数。以下内容中标粗部分的函数为需要重点关注的函数。常用的数学函数：主要用于处理数字值ABS(x)：返回x的绝对值BIN(x)：返回x的二进制（OCT返回八进制，HEX返回十六进制）EXP(x)：返回值e（自然对数的底）的x次方GREATEST(x1,x2,...,xn)

0.0000

0

3

0

关注作者

收藏

zxq997

数据库常用的运算符

如果想要在SQL语句中进行计算就需要用到运算符，常见的运算符如下。常用的比较运算符：用来在变量间进行比较的运算符常用的算数运算符：用来进行变量计算的运算符：常用的逻辑运算符：用来进行逻辑运算的运算符：

0.0000

0

2

0

关注作者

收藏

詹惠儿

基本正则表达式函数

R在解析文本数据方面同样强大，在正则表达式中，有多种方法可以完成某项任务。但是，在学习的过程中，坚持特定方法以避免混淆是至关重要的。因此，下面整理了一些专门用于处理正则表达式（又名正则表达式）的基本函数。对于使用正则表达式，可用的基本正则表达式函数是grep（），grepl（），regexpr（），gregexpr（），regexec（）和regmatches（）。以下

0.0000

0

2

0

关注作者

收藏

zxq997

数据库中的关键字

使用关键字可以帮助我们完成复杂灵活的数据查询需求，在查询中常用到的关键字包括AND、OR、IN、BETWEEN、LIKE、IS NULL、 DISTINCT等AND关键字：用来联合多个条件进行查询，条件与条件间是“和”的意思条件表达式1 AND 条件表达式2 【…AND 条件表达式n】例：在student表中查询数学成绩大于50分并且英语成绩小于80分的学员记录SELECT *

299.9278

1

4

0

关注作者

收藏

zxq997

数据库表的更新和删除

在SQL语句中可以通过UPDATE语句来更新表中已经存在的字段内容，通过DELETE语句删除表中不再使用的记录UPDATE语句语法：UPDATE 表名SET 字段名1 = 取值1, 字段名2 = 取值2,…字段名n = 取值n;例：为student表增加一个mathandenglish字段，并用数学成绩与英语成绩的加总成绩为此字段赋值AL

0.0000

0

4

0

关注作者

收藏

zxq997

数据库的统计推断

SQL语句中常用到的集合函数包括COUNT、SUM、AVG、MAX和MIN。COUNT用来统计记录的条数，SUM用来计算字段值的总和，AVG用来计算字段值的平均值，MAX用来查询字段的最大值，MIN用来查询字段的最小值。GROUP BY关键字通常需要与集合函数一起使用。COUNT函数：用来统计记录的条数例：SELECT COUNT(*) FROM student; -- 求student表

0.0000

0

1

0

关注作者

收藏

PGC123

什么是数据挖掘？

什么是数据挖掘？数据挖掘是指在大型数据之上自动的发现有用信息的过程。数据挖掘可以通过历史数据发掘先前未知的状态，以及预测未来的状态。数据挖掘是KDD的关键一部分。机器学习属于数据挖掘的一种方式。

0.0000

0

1

0

关注作者

收藏

zxq997

数据库的连接

在面对复杂的查询需求时，常常需要进行多表链接，主要有两类多表连接方式，一类是横向连接，另一类是纵向连接。横向连接包括内连接(inner join)、左连接(left join)、右连接(right join)、全连接(full join)，后三种统称外连接。四种连接的区别在于保留原表与连接表的信息不同：纵向连接包括集合操作(union/union all)。注意，UNION连接的两表必须

0.0000

0

2

0

关注作者

收藏

zxq997

数据库的查询

SELECT语句语法：SELECT 字段列表 FROM 表名【WHERE 条件表达式1】 -- 用WHERE语句指定查询条件【GROUP BY 字段名1 【HAVING 条件表达式2】】-- 用GROUP BY语句进行分组，用HAVING语句指定分组条件【ORDER BY 字段名2 【ASC/DESC】】-- 用ORDER BY语句进行排序，ASC为升序排序，DESC为降序

0.0000

0

2

0

关注作者

收藏

詹惠儿

修改字符串的R函数有哪些？

下表整理归纳了一些常用的基本R函数（在stringr中也可用）来修改字符串：

0.0000

0

2

0

关注作者

收藏

PGC123

python 中pass 的作用

python 中pass 的作用是什么？Python pass是空语句，是为了保持程序结构的完整性。pass 不做任何事情，一般用做占位语句。我们在定义程序的时候可以有些功能还没想好怎么去实现，这时候就可以先用pass关键字来占位，使程序完整、这样程序没有语法问题、可以执行使用。

0.0000

0

3

0

关注作者

收藏

zxq997

数据库的导入

导入外部文本文件：LOAD DATA [LOCAL] INFILE ‘文本文件所在完整路径’INTO TABLE 表名FIELDS TERMINATED BY ‘文本文件的分隔符符号’IGNORE 省略的行数 LINES;例：为student表导入本地E盘下student.csv文本文件中从第二行开始的所有数据LOAD DATA LOCAL INFILE 'E:

0.0000

0

1

0

关注作者

收藏

zxq997

数据库的增删改

修改表是指修改数据库中已存在的表的定义。MySQL中通过ALTER TABLE语句来修改表。修改表包括修改表名、修改字段数据类型、修改字段名、增加字段、删除字段、修改字段排列顺序等操作。修改表名：ALTER TABLE 旧表名 RENAME 新表名;例：ALTER TABLE example RENAME student; -- 将example表的表名改为student修改字段的数据类

299.9278

1

2

0

关注作者

收藏

<1…114711481149…1218>

CDA考试动态

CDA报考指南