Python实现统计代码行的方法分析-CDA数据分析师官网

热线电话：13121318867

Python实现统计代码行的方法分析

2017-09-01

Python实现统计代码行的方法分析

本文实例讲述了Python实现统计代码行的方法。分享给大家供大家参考，具体如下：

参加光荣之路测试开发班已三月有余，吴总上课也总问“ 咱们的课上了这么多次了大家实践了多少行代码了？”。这里是一个一脸懵逼的表情。该怎么统计呢？一个个文件数当然不可取，能用代码解决的事咱们坚决不动手。最近在网上刷题时也正好遇到有这么一道题，所以决定撸一撸。

题目：有个目录，里面是你自己写过的程序，统计一下你写过多少行代码。包括空行和注释，但是要分别列出来。

首先分析一下思路捋一下大象装冰箱的步骤，从一个给定的目录统计该目录下所有的代码行大致需要以下7个步骤：

1. 遍历该目录下所有的文件。
2. 判断文件是否以“.py”结尾。（以python代码为例）
3. 打开.py文件（切忌勿用W+，W+会清空文件内容）
4. 循环读取文件的每一行
5. 判断每一行的内容：
                  (a) 注释: 以#开头。
                  (b) 注释：以三引号开头结束。
                  (c) 空行：除空白字符无其他。
                  (d) 代码行：除空白字符之后还剩下其他字符。
6. 判断是否为文件末尾,
7. 关闭文件, 返回结果.

解题思路捋清楚之后剩下的就是将各模块的代码像搭积木一样搭起来就完事了（示例代码在本文最后）：

5~9：导入OS，定义 code_lines_count 函数并接收一个 path 形式参数，声明了三个变量分别用于统计代码行，注释行和空行
10~13：遍历os.walk获取到的file 对象，然后将文件的后缀名利用splitext函数分割然后使用列表索引 [1] 取得文件后缀名，并判断是否是以“.py”结尾。（此处也可以使用listdir, 但listdir只能取单层目录下的文件，并且需要单独判断取得的元素是文件还是文件夹，较麻烦）
第12行定义了一个file_abs_path的变量并赋值文件的绝对路径，是因为下面的代码会多次使用，不必每次都使用so.path.join(xx,xx)。
14~18：对于上一个步骤获取到的以“.py”结尾的文件利用with 方式打开（使用with可省去关闭文件的代码），对于打开的文件使用While True 循环的使用readline()去读取文件的每一行并赋值给line 变量。
19~39：该段代码用于对上一步骤readline()取得的行做判断是代码行，空行还是注释行。
19~21：如果line为空，表示取到文件末尾，此时break while 循环，继续files 中的下一个文件操作。
22~24：使用strip()对readline()取得的行做去空白处理，如果经过处理后是以“#”开头则表示这行是一个注释行此时对comm_lines 做加1 操作。
25~33：使用strip()对readline()取得的行做去空白处理，如果经过处理后是以三个单引号或者三个双引号开头则表示此处为一个多行注释的开始，然后判断该行的三引号数量如果为1则表示注释分多行，否则注释为一行（一对三引号在同一行），对于注释为多行情况使用while 循环得读取接下来的行，并且没读一行对 comm_lines 做加1 操作，如果读到某一行存在三引号则判定注释结束，break 当层while循环（此处只考虑了比较规范的注释）
34~36：如果读到的行做过strip()之后非空且不是注释，则是一个代码行，并对code_lines做加1操作。
37~39：如果上述条件都不满足，则判断为一个空行，并对space_lines 做加1操作。
41：返回统计到的代码行，注释行和空行。
43：测试代码下图是运行的一个实例

#_*_coding:utf-8_*_

# 统计代码行数, 空行, 注释.

importos

defcode_lines_count(path):

code_lines=0

comm_lines=0

space_lines=0

forroot,dirs,filesinos.walk(path):

foriteminfiles:

file_abs_path=os.path.join(root,item)

postfix=os.path.splitext(file_abs_path)[1]

ifpostfix=='.py':

#print 'Start: ',file_abs_path

withopen(file_abs_path) as fp:

whileTrue:

line=fp.readline()

ifnotline:

#print 'break here,%r' %line

break

elifline.strip().startswith('#'):

#print '1, here',line

comm_lines+=1

elifline.strip().startswith("'''") or line.strip().startswith('"""'):

comm_lines += 1

if line.count('"""') ==1 or line.count("'''")==1:

whileTrue:

line=fp.readline()

#print '4, here',line

comm_lines+=1

if("'''"inline)or('"""'inline):

break

elifline.strip():

#print '5, here',line

code_lines+=1

else:

#print '6, here',line

space_lines+=1

#print 'Done',file_abs_path

returncode_lines,comm_lines,space_lines

#test

print"Code lines: %d\nComments lines: %d\nWhiteSpace lines: %d"%code_lines_count(r'D:\exercises')

-码代码本质和打游戏一样，都是打怪升级穿装备。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

python 索引

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

Python实现统计代码行的方法分析

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载