zxq997

数据库的统计推断

SQL语句中常用到的集合函数包括COUNT、SUM、AVG、MAX和MIN。COUNT用来统计记录的条数,SUM用来计算字段值的总和,AVG用来计算字段值的平均值,MAX用来查询字段的最大值,MIN用来查询字段的最小值。GROUP BY关键字通常需要与集合函数一起使用。COUNT函数:用来统计记录的条数例:SELECT COUNT(*) FROM student; -- 求student表

0.0000 0 1
  • 关注作者
  • 收藏
PGC123

什么是数据挖掘?

什么是数据挖掘?数据挖掘是指在大型数据之上自动的发现有用信息的过程。数据挖掘可以通过历史数据发掘先前未知的状态,以及预测未来的状态。数据挖掘是KDD的关键一部分。机器学习属于数据挖掘的一种方式。

0.0000 0 1
  • 关注作者
  • 收藏
zxq997

数据库的连接

在面对复杂的查询需求时,常常需要进行多表链接,主要有两类多表连接方式,一类是横向连接,另一类是纵向连接。横向连接包括内连接(inner join)、左连接(left join)、右连接(right join)、全连接(full join),后三种统称外连接。四种连接的区别在于保留原表与连接表的信息不同: 纵向连接包括集合操作(union/union all)。注意,UNION连接的两表必须

0.0000 0 2
  • 关注作者
  • 收藏
zxq997

数据库的查询

SELECT语句语法:SELECT 字段列表 FROM 表名【WHERE 条件表达式1】 -- 用WHERE语句指定查询条件【GROUP BY 字段名1 【HAVING 条件表达式2】】-- 用GROUP BY语句进行分组,用HAVING语句指定分组条件【ORDER BY 字段名2 【ASC/DESC】】-- 用ORDER BY语句进行排序,ASC为升序排序,DESC为降序

0.0000 0 2
  • 关注作者
  • 收藏
詹惠儿

修改字符串的R函数有哪些?

下表整理归纳了一些常用的基本R函数(在stringr中也可用)来修改字符串:

0.0000 0 2
  • 关注作者
  • 收藏
PGC123

python 中pass 的作用

python 中pass 的作用是什么?Python pass是空语句,是为了保持程序结构的完整性。pass 不做任何事情,一般用做占位语句。我们在定义程序的时候可以有些功能还没想好怎么去实现,这时候就可以先用pass关键字来占位,使程序完整、这样程序没有语法问题、可以执行使用。

0.0000 0 3
  • 关注作者
  • 收藏
zxq997

数据库的导入

导入外部文本文件:LOAD DATA [LOCAL] INFILE ‘文本文件所在完整路径’INTO TABLE 表名FIELDS TERMINATED BY ‘文本文件的分隔符符号’IGNORE 省略的行数 LINES;例:为student表导入本地E盘下student.csv文本文件中从第二行开始的所有数据LOAD DATA LOCAL INFILE 'E:

0.0000 0 1
  • 关注作者
  • 收藏
zxq997

数据库的增删改

修改表是指修改数据库中已存在的表的定义。MySQL中通过ALTER TABLE语句来修改表。修改表包括修改表名、修改字段数据类型、修改字段名、增加字段、删除字段、修改字段排列顺序等操作。修改表名:ALTER TABLE 旧表名 RENAME 新表名;例:ALTER TABLE example RENAME student; -- 将example表的表名改为student修改字段的数据类

299.9278 1 2
  • 关注作者
  • 收藏
zxq997

数据库的创建

表是数据库存储数据的基本单位,一个表包含若干个字段。表的操作包括创建新表、修改表、删除表、为表添加数据以及查看表结构等内容。创建表:创建表是指在数据库中创建新表的方法。在MySQL中使用CREATE TABLE语句来创建新表。CREATE TABLE 表名(字段名 数据类型 【完整性约束条件】, 字段名 数据类型 【完整性约束条件】, …字段名 数据类型 【完整性约束

0.0000 0 6
  • 关注作者
  • 收藏
詹惠儿

常见的字符串操作函数列表

在R中,字符串是用引号(“”)括起来的任何值。 是的,您甚至可以将数字作为字符串。 R通知类character下的字符串。 让我们来看看!text

0.0000 0 1
  • 关注作者
  • 收藏
詹惠儿

什么是字符串操作?

字符串操作的定义 顾名思义,字符串操作包含一系列用于从文本变量中提取信息的函数。 在机器学习中,这些功能被广泛用于进行特征工程,即从现有的字符串特征创建新特征。 在R中,我们有像stringr and stringi这样的包,它们都加载了所有的字符串操作函数。此外,R还包括几个用于字符串操作的基本函数。 这些函数旨在补充正则表达式。 字符串操作函数和正则表达式之间的实际差异是

0.0000 0 2
  • 关注作者
  • 收藏
詹惠儿

正则表达式是什么?

正则表达式的定义 正则表达式(又名正则表达式)是一组模式匹配命令,用于检测大型文本数据中的字符串序列。 这些命令旨在匹配文本的族(字母数字,数字,单词),这使得它具有足够的通用性来处理任何文本/字符串类。 简而言之,使用正则表达式可以在编写较短代码时获得更多文本数据。 例如,假设您从网上抓取了一些数据。 数据包含用户的日志时间。 您想要提取日志时间。 但是,数据很混乱

0.0000 0 3
  • 关注作者
  • 收藏
PGC123

np.c_是啥意思?

在网上看代码的时候看到np.c_[......],这个是什么用法呢?np.r_是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等。np.c_是按行连接两个矩阵,就是把两矩阵左右相加,要求行数相等。例如:a = np.random.randint(1,high=20,size=(4,5))a## array([[ 8, 16, 3, 13, 4], [16, 1

0.0000 0 4
  • 关注作者
  • 收藏
PGC123

“一切皆为对象,一切皆为对象的引用”啥意思?

“一切皆为对象,一切皆为对象的引用”这句话在python中比较重要,啥意思呢?首先在python中所有的具体数据都是对象,比如5就是一个int对象、‘a’是字符串对象,定义一个函数则函数也会是一个可调用的对象。一切皆为对象的引用是指当我们定义一个变量并将一个值赋给这个变量,则此时变量便是该对象的一个引用。a = 5# 5 为整数对象,a则是5这个整数对象的一个引用

0.0000 0 3
  • 关注作者
  • 收藏
PGC123

python中的不可变数据类型

python中的数据类型分为可变与不可变两种类型,不可变的有数字、字符串、元组;可变的有列表、字典。不可变对象一旦创建,其值就不可以改变了,不可变对象只能被创建和删除(del或者被‘垃圾回收’)。如果想要对指向不可变数据类型的变量再次赋值,则python解释器会在内存中创建新的对象指向变量而不是改变原来的对象。a = 5print(id(a))#94562099482920a = 6

0.0000 0 10
  • 关注作者
  • 收藏
PGC123

pyspark如何创建RDD

PySpark 如何创建RDD呢?PySpark中有两种方法可以创建RDD:1、使用parallelize(...) 通过传入python集合创建,如:list或array。第二个参数可以是分区数。2、也可以引用文件(本地或者外部文件如HDFS等)data_from_file = sc.textFile(path,p_num) ,其中path是文件路径,p_num是分区数。

0.0000 0 5
  • 关注作者
  • 收藏
PGC123

Hadoop的MapReduce框架原理

在Hadoop上面进行并行计算需要按照MapReduce计算框架开发代码。MapReduce计算过程主要分为map 、shuffle、reduce三个阶段,其中用户要实现 的只有map和reduce两个阶段,其他阶段框架自动完成。Map阶段:当向MapReduce 框架提交一个计算作业时,它首先把计算作业拆分成若干个Map 任务,然后分配到不同的节点上去并行执行,每一个Map 任务处理输入

0.0000 0 1
  • 关注作者
  • 收藏
PGC123

RDD分区是什么?

RDD 内部的数据集合在逻辑上和物理上被划分成多个小子集合,这样的每一个子集合我们将其称为分区,分区的个数会决定并行计算的粒度,而每一个分区数值的计算都是在一个单独的任务中进行,因此并行任务的个数,也是由 RDD分区的个数决定的。

0.0000 0 2
  • 关注作者
  • 收藏
wangjuju123

跳出循环 -break

通常,循环会不断地执行代码块,直到条件为假或使用完序列中的所有元素。但在有些情况 下,你可能想中断循环、开始新迭代(进入“下一轮”代码块执行流程)或直接结束循环。 要结束(跳出)循环,可使用break。假设你要找出小于100的大平方值(整数与自己相乘 的结果),可从100开始向下迭代。找到一个平方值后,无需再迭代,因此直接跳出循环。 from math import sqrt for n i

0.0000 0 0
  • 关注作者
  • 收藏
wangjuju123

迭代字典

要遍历字典的所有关键字,可像遍历序列那样使用普通的for语句。 d = {'x': 1, 'y': 2, 'z': 3} for key in d: print(key, 'corresponds to', d[key]) 也可使用keys等字典方法来获取所有的键。如果只对值感兴趣,可使用d.values。你可能还记得,d.items以元组的方式返回键值对。for循环的优点之一是

0.0000 0 1
  • 关注作者
  • 收藏

热门用户 换一批

本月PGC排行 总奖励
01
CDA持证人阿涛哥
480.0000
02
85691082
320.0000