来源：AI入门学习

作者：小伍哥

数据排序，是使用非常高频的功能，Pandas排序支持做的非常好，主要涉及两个函数，两种数据类型，组合起来四种情况。

Series排序

Series.sort_index 索引排序
Series.sort_values 值引排序

DataFrame排序

DataFrame.sort_index 索引排序
DataFrame.sort_values 值引排序

一、Series的排序

1、sort_index 索引排序

定义一个Series用于实验

s = Series([4,1,2,3],index=['d','a','c','b'])
d 4 a 1 c 2 b 3

对Series的索引进行升序排序，默认即可，无需使用其他参数

s.sort_index() a 1 b 3 c 2 d 4

对Series的索引进行降序排序，使用ascending=False参数

s.sort_index(ascending=False) d 4 c 2 b 3 a 1

2、sort_values 值引排序

用法：

Series.sort_values(ascending=True, inplace=Flase)

参数：

ascending：默认为True升序排列，为Flase降序排序
inplace：是否修改原始的Series

对Series的值进行升序排序，默认即可，无需使用其他参数

s.sort_values() a 1 c 2 b 3 d 4

对Series的值进行降序排序，使用ascending=False参数

s.sort_values(ascending=False) d 4 b 3 c 2 a 1

二、 DataFrame的排序

1、sort_index 索引排序

DataFrame.sort_index(by=None,
axis=0, level=None, 
ascending=True, 
inplace=False, 
kind='quicksort', 
na_position='last', 
sort_remaining=True)

by：按照某一列或几列数据进行排序，但是by参数貌似不建议使用
axis：0按照行名排序；1按照列名排序
level：默认None，否则按照给定的level顺序排列---貌似并不是，文档
ascending：默认True升序排列；False降序排列
inplace：默认False，否则排序之后的数据直接替换原来的数据框
kind：排序方法，{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心。
na_position：缺失值默认排在最后{"first","last"}

构建数据集

import numpy as np import pandas as pd data = pd.DataFrame( np.arange(9).reshape(3,3),
                 index   = ["0","2","1"],
                 columns = ["col_a","col_c","col_b"]) data col_a  col_c  col_b 0 0 1 2 2 3 4 5 1 6 7 8

按行的索引升序进行排序，默认按行，升序

data.sort_index() col_a col_c col_b 0 0 1 2 1 6 7 8 2 3 4 5

按行的索引按降序进行排序

data.sort_index(ascending=False) col_a col_c col_b 2 3 4 5 1 6 7 8 0 0 1 2

按列升序的索引进行排序

data.sort_index(axis=1) Out[10]: col_a col_c col_b 0 0 1 2 1 6 7 8 2 3 4 5

2、sort_values 值引排序

用法：

DataFrame.sort_values(
by, 
axis=0, 
ascending=True, 
inplace=False,
kind='quicksort', 
na_position='last')

参数：

by：字符串或者List<字符串>；如果axis=0，那么by="列名"；如果axis=1，那么by="行名"。
axis：{0 or ‘index’, 1 or ‘columns’}, default 0，默认按照列排序，即纵向排序；如果为1，则是横向排序。
ascending：布尔型，True则升序，如果by=['列名1','列名2']，则该参数可以是[True, False]，即第一字段升序，第二个降序。
inplace：布尔型，是否用排序后的数据框替换现有的数据框。
kind：排序方法，{‘quicksort’, ‘mergesort’, ‘heapsort’}, default ‘quicksort’。似乎不用太关心。
na_position：{‘first’, ‘last’}, default ‘last’，默认缺失值排在最后面。

构建实验用数据

data =pd.DataFrame([[2,3,12],[6,2,8],[9,5,7]], index=["0", "2", "1"], columns=["col_a", "col_c", "col_b"]) col_a col_c col_b 0 2 3 12 2 6 2 8 1 9 5 7

按指定列的值大小顺序进行排序

data.sort_values(by='col_c') col_a col_c col_b 2 6 2 8 0 2 3 12 1 9 5 7

按多列进行排序

data.sort_values(by=['col_b','col_a']) col_a col_c col_b 1 9 5 7 2 6 2 8 0 2 3 12

先按col_b列降序，再按col_a列升序排序

data.sort_values(by=['col_b','col_a'],axis=0,ascending=[False,True]) col_a col_c col_b 0 2 3 12 2 6 2 8 1 9 5 7

按行升序排列

data.sort_values(by='2',axis=1) col_c col_a col_b 0 3 2 12 2 2 6 8 1 5 9 7

按 2行升序，0行降排列

data.sort_values(by=['2','0'],axis=1) col_c col_a col_b 0 3 2 12 2 2 6 8 1 5 9 7

一文搞懂Pandas数据排序

一、Series的排序

二、 DataFrame的排序

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：王晓琳谈数据分析备考与秋招实战经 ...

【CDA干货】用户决策流程全解析：核心环节、影响因 ...

从“标签”到“人”：CDA数据分析师视角下的用户画 ...

【CDA干货】透视表跨表数据应用原理与实战方法 ...

【CDA干货】正态分布异常事件识别与处理方法：数据 ...

从“raw”到“ready”：CDA数据分析师视角下的标签 ...

CDA持证人专访：孙尚亮谈制造行业数据分析与生产采 ...

【CDA干货】DataFrame数据归一化：核心原理、常用方 ...

从“零散标识”到“结构资产”：CDA数据分析师视角 ...

【CDA干货】数据分析如何辅助商业谈判决策：从经验 ...

【CDA干货】T检验完整实操教程：核心原理、分类场景 ...

精准取数之道：CDA数据分析师视角下的数据查询语言 ...

CDA持证人专访：曾津谈互联网数据分析与业务赋能实 ...

【CDA干货】Pandas文本词频统计：查找关键词出现次 ...

从“数据存储”到“智能取数”：CDA数据分析师视角 ...

【CDA干货】CDA透视分析核心计算方法：求和、计数、 ...

【CDA干货】客户交易价值分析：核心逻辑、分析方法 ...

从“数据仓库”到“智能取数”：CDA数据分析师视角 ...

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载