聊聊 python 数据处理全家桶（Redis篇）-CDA数据分析师官网

热线电话：13121318867

首页大数据时代聊聊 python 数据处理全家桶（Redis篇）

聊聊 python 数据处理全家桶（Redis篇）

2020-09-24

作者：星安果

来源：AirPython

前面两篇文章聊到了 python 处理 Mysql、Sqlite 数据库常用方式，本篇文章继续说另外一种比较常用的数据存储方式：Redis

Redis：Remote Dictionary Server，即：远程字典服务，Redis 底层使用 C 语言编写，是一款开源的、基于内存的 NoSql 数据库

由于 Redis 性能远超其他数据库，并且支持集群、分布式及主从同步等优势，所以经常用于缓存数据、高速读写等场景

本篇文章就聊聊 Python 操作 Redis 正确的姿势

——准备

我们以在云服务器 Centos 7.8 安装 Redis-Server 为例

首先，安装在云服务器上 Redis 数据库

# 下载epel仓库
yum install epel-release

# 安装redis
yum install redis

然后，通过 vim 命令修改 Redis 配置文件，打开远程连接，设置连接密码

配置文件目录：/etc/redis.conf

bind 更改为 0.0.0.0，容许外网访问
requirepass 设置一个访问密码

# vim /etc/redis.conf
# 1、bing从127.0.0.1修改为:0.0.0.0，开放远程连接
bind 0.0.0.0 

# 2、设置密码
requirepass 123456

需要指出的是，为了保证云服务器数据安全，Redis 开放远程访问的时候，一定要加强密码

接着，启动 Redis 服务，开启防火墙和端口，配置云服务器安全组

默认情况下，Redis 服务使用的端口号是 6379

另外，需要在云服务器安全组进行配置，保证 Redis 数据库能正常连接

# 启动Redis服务，默认redis端口号是6379
systemctl start redis 

# 打开防火墙
systemctl start firewalld.service

# 开放6379端口
firewall-cmd --zone=public --add-port=6379/tcp --permanent   

# 配置立即生效
firewall-cmd --reload

完成以上操作，我们就可以通过 Redis-CLI 或 Redis 客户端工具进行连接了

最后，要使用 python 操作 Redis，我们需要使用 pip 安装一个依赖

# 安装依赖，便于操作redis
pip3 install redis

——实战

在操作 Redis 中的数据之前，我们需要利用 Host、端口号、密码实例化一个 Redis 连接对象

from redis import Redis
class RedisF(object):

    def __init__(self):
        # 实例化Redis对象
        # decode_responses=True，如果不加则写入的为字节类型
        # host：远程连接地址
        # port：Redis端口号
        # password：Redis授权密码
        self.redis_obj = Redis(host='139.199.**.**',port=6379,password='123456',
                               decode_responses=True,charset='UTF-8', encoding='UTF-8')

接下来我们以操作字符串、列表、set 集合、zset 集合、哈希表、事务为例，讲讲 Python 操作这些数据的方法

1、字符串操作

操作字符串有两种方式，操作方法分别是：set() 和 mset()

其中：set() 一次只能保存一个值，参数意义如下

name：key，代表键
value：value，待保存的值
ex：过期时间，以秒为单位，如果不设置，则永久不过期；否则，过期则删除
px：过期时间，以毫秒为单位
nx/xx：set 操作是否执行与 name 键是否存在有关

获取值和删除值的操作方法分别为：get(Key)、 delete(Key or Keys)

# set()：单字符串操作
# 添加一个值，并设置超时时间为120s
 self.redis_obj.set('name', 'airpython', ex=120)

# get()：获取这个值
print(self.redis_obj.get('name'))

# delete()：删除一个值或多个值
self.redis_obj.delete('name')
print(self.redis_obj.get('name'))

对于多值数据的设置，只需要调用 mset() 方法，将待插入的数据以键值对组成一个字典作为参数即可。同理，Redis 提供了 mget() 方法，可以一次获取多个键的值

# mset()：设置多个值
self.redis_obj.mset({"foo": "foo1", "zoo": "zoo1"})

# mget()：获取多个值
result = self.redis_obj.mget("foo", "zoo")
print(result)

2、列表操作

Redis 提供了很多方法用于操作列表，其中比较常见的如下：

lpush/rpush：将一个值或多个值插入到列表头部或尾部，其中，lpush 代表头部插入；rpush 代表尾部插入数据
lset：通过索引，将值插入到列表对应的位置
linsert：在列表元素前面或后面插入数据
lindex：通过索引获取列表中的某一个元素，其中，0 代表第一个元素；-1 代表最后一个元素
lrange：通过制定起始位置和结束位置，从列表中获取指定区域的值
llen：获取列表的长度，如果 Key 对应的列表不存在，返回 0
lpop：移除并返回列表中的第一个元素
rpop：移除并返回列表中的最后一个元素

实例代码如下：

def manage_list(self):
    """
    操作列表
    :return:
    """
    # 1、新增一个列表，并左边插入一个数据
    # 注意：可以一次加入多个元素，也可以一个个元素的加入
    self.redis_obj.lpush('company', '阿里', '腾讯', '百度')

    # 2、移除第一个元素
    self.redis_obj.lpop("company")

    # 3、右边插入数据
    self.redis_obj.rpush('company', '字节跳动', '小米')

    # 4、移除最后一个元素
    self.redis_obj.rpop("company")

    # 5、获取列表的长度
    self.redis_obj.llen("company")

    # 6、通过索引，获取列表中的某一个元素（第二个元素）
    print('列表中第二个元素是：', self.redis_obj.lindex("company", 1))

    # 7、根据范围，查看列表中所有的值
    print(self.redis_obj.lrange('company', 0, -1))

3、操作 Set 集合

Set 是一个无序的元素集合，集合中的元素不能重复，Redis 同样提供了很多方法，便于操作 Set 集合

其中，比较常用的方法如下：

sadd：添加元素到集合中，已经存在集合中的元素将被忽略，如果集合不存在，则新建一个集合
scard：返回集合元素的数量
smembers：返回集合中所有元素
srem：移除集合中一个或多个元素，如果元素不存在则忽略
sinter：返回两个集合的交集，结果依然是一个集合
sunion：返回两个集合的并集
sdiff：以第一个集合参数为标准，返回两个集合的差集
sunionstore：计算两个集合的并集，保存到一个新的集合中
sismember：判断集合中是否存在某个元素
spop：随机删除集合中的一个元素，并返回

具体实例代码如下：

def manage_set(self):
    """
    操作set集合
    :return:
    """
    self.redis_obj.delete("fruit")

    # 1、sadd：新增元素到集合中
    # 添加一个元素：香蕉
    self.redis_obj.sadd('fruit', '香蕉')

    # 再添加两个元素
    self.redis_obj.sadd('fruit', '苹果', '桔子')

    # 2、集合元素的数量
    print('集合元素数量：', self.redis_obj.scard('fruit'))

    # 3、移除一个元素
    self.redis_obj.srem("fruit", "桔子")

    # 再定义一个集合
    self.redis_obj.sadd("fruit_other", "香蕉", "葡萄", "柚子")

    # 4、获取两个集合的交集
    result = self.redis_obj.sinter("fruit", "fruit_other")
    print(type(result))
    print('交集为：', result)

    # 5、获取两个集合的并集
    result = self.redis_obj.sunion("fruit", "fruit_other")
    print(type(result))
    print('并集为：', result)

    # 6、差集，以第一个集合为标准
    result = self.redis_obj.sdiff("fruit", "fruit_other")
    print(type(result))
    print('差集为：', result)

    # 7、合并保存到新的集合中
    self.redis_obj.sunionstore("fruit_new", "fruit", "fruit_other")
    print('新的集合为：', self.redis_obj.smembers('fruit_new'))

    # 8、判断元素是否存在集合中
    result = self.redis_obj.sismember("fruit", "苹果")
    print('苹果是否存在于集合中', result)

    # 9、随机从集合中删除一个元素，然后返回
    result = self.redis_obj.spop("fruit")
    print('删除的元素是:', result)

    # 3、集合中所有元素
    result = self.redis_obj.smembers('fruit')

    print("最后fruit集合包含的元素是:", result)

4、操作 zset 集合

zset 集合相比普通 set 集合，是有序的，zset 集合中的元素包含：值和分数，其中分数用于排序

其中，比较常用的方法如下：

zadd：往集合中新增元素，如果集合不存在，则新建一个集合，然后再插入数据
zrange：通过起始点和结束点，返回集合中的元素值（不包含分数）;如果设置withscores=True，则返回结果会带上分数
zscore：获取某一个元素对应的分数
zcard：获取集合中元素个数
zrank：获取元素在集合中的索引
zrem：删除集合中的元素
zcount：通过最小值和最大值，判断分数在这个范围内的元素个数

实践代码如下：

def manage_zset(self):
    """
    操作zset集合
    :return:
    """
    self.redis_obj.delete("fruit")

    # 往集合中新增元素：zadd()
    # 三个元素分别是："banana", 1/"apple", 2/"pear", 3
    self.redis_obj.zadd("fruit", "banana", 1, "apple", 2, "pear", 3)

    # 查看集合中所有元素（不带分数）
    result = self.redis_obj.zrange("fruit", 0, -1)
    # ['banana', 'apple', 'pear']
    print('集合中的元素（不带分数）有：', result)

    # 查看集合中所有元素（带分数）
    result = self.redis_obj.zrange("fruit", 0, -1, withscores=True)
    # [('banana', 1.0), ('apple', 2.0), ('pear', 3.0)]
    print('集合中的元素（带分数）有：', result)

    # 获取集合中某一个元素的分数
    result = self.redis_obj.zscore("fruit", "apple")
    print("apple对应的分数为：", result)

    # 通过最小值和最大值，判断分数在这个范围内的元素个数
    result = self.redis_obj.zcount("fruit", 1, 2)
    print("集合中分数大于1，小于2的元素个数有：", result)

    # 获取集合中元素个数
    count = self.redis_obj.zcard("fruit")
    print('集合元素格式:', count)

    # 获取元素的值获取索引号
    index = self.redis_obj.zrank("fruit", "apple")
    print('apple元素的索引为：', index)

    # 删除集合中的元素：zrem
    self.redis_obj.zrem("fruit", "apple")
    print('删除apple元素后，剩余元素为：', self.redis_obj.zrange("fruit", 0, -1))

4、操作哈希

哈希表中包含很多键值对，并且每一个键都是唯一的

Redis 操作哈希表，下面这些方法比较常用：

hset：往哈希表中添加一个键值对值
hmset：往哈希表中添加多个键值对值
hget：获取哈希表中单个键的值
hmget：获取哈希表中多个键的值列表
hgetall：获取哈希表中种所有的键值对
hkeys：获取哈希表中所有的键列表
hvals：获取哈表表中所有的值列表
hexists：判断哈希表中，某个键是否存在
hdel：删除哈希表中某一个键值对
hlen：返回哈希表中键值对个数

对应的操作代码如下：

def manage_hash(self):
    """
    操作哈希表
    哈希：一个键对应一个值，并且键不容许重复
    :return:
    """
    self.redis_obj.delete("website")

    # 1、新建一个key为website的哈希表
    # 往里面加入数据：baidu（field），www.baidu.com(value)
    self.redis_obj.hset('website', 'baidu', 'www.alibababaidu.com')
    self.redis_obj.hset('website', 'google', 'www.google.com')

    # 2、往哈希表中添加多个键值对
    self.redis_obj.hmset("website", {"tencent": "www.qq.com", "alibaba": "www.taobao.com"})

    # 3、获取某一个键的值
    result = self.redis_obj.hget("website", 'baidu')
    print("键为baidu的值为：", result)

    # 4、获取多个键的值
    result = self.redis_obj.hmget("website", "baidu", "alibaba")
    print("多个键的值为:", result)

    # 5、查看hash表中的所有值
    result = self.redis_obj.hgetall('website')
    print("哈希表中所有的键值对为：", result)

    # 6、哈希表中所有键列表
    # ['baidu', 'google', 'tencent', 'alibaba']
    result = self.redis_obj.hkeys("website")
    print("哈希表，所有的键（列表）为:", result)

    # 7、哈希表中所有的值列表
    # ['www.alibababaidu.com', 'www.google.com', 'www.qq.com', 'www.taobao.com']
    result = self.redis_obj.hvals("website")
    print("哈希表，所有的值（列表）为:", result)

    # 8、判断某一个键是否存在
    result = self.redis_obj.hexists("website", "alibaba")
    print('alibaba这个键是否存在:', result)

    # 9、删除某一个键值对
    self.redis_obj.hdel("website", 'baidu')
    print('删除baidu键值对后，哈希表的数据包含：', self.redis_obj.hgetall('website'))

    # 10、哈希表中键值对个数
    count = self.redis_obj.hlen("website")
    print('哈希表键值对一共有：', count)

5、操作事务管道

Redis 支持事务管道操作，能够将几个操作统一提交执行

操作步骤是：

首先，定义一个事务管道
然后通过事务对象去执行一系列操作
提交事务操作，结束事务操作

下面通过一个简单的例子来说明：

def manage_steps(self):
    """
    执行事务操作
    :return:
    """
    # 1、定义一个事务管道
    self.pip = self.redis_obj.pipeline()

    # 定义一系列操作
    self.pip.set('age', 18)

    # 增加一岁
    self.pip.incr('age')

    # 减少一岁
    self.pip.decr('age')

    # 执行上面定义3个步骤的事务操作
    self.pip.execute()

    # 判断
    print('通过上面一些列操作，年龄变成:', self.redis_obj.get('age'))

本篇文章通过 python 实现了对 Redis 常见数据的操作，大家有问题可以留言咨询哦！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；