京公网安备 11010802034615号
经营许可证编号:京B2-20210330
python利用socketserver实现并发套接字功能
本文实现利用python的socketserver这个强大的模块实现套接字的并发,具体内容如下
目录结构如下:
测试文件请放在server_file文件夹里面
server.py
#!/usr/bin/env python
# -*- coding: gbk -*-
# @Version : Python 3.5.2
# @Time : 2018/1/24 10:29
# @Author : Ncp
# @File : server.py
# @Software: PyCharm
import json
import time
import hashlib
import struct
import os
from socketserver import *
FILE_PATH = os.path.dirname(os.path.abspath(__file__))+'\\server_file'
class MYserver(BaseRequestHandler): # 设置一个类,基础BaseRequestHandler这个类
def handle(self): # 这个方法下添加通信功能(和上面创建类一样,这是socketserver的固定模式)
print(self.client_address)
'''
:functions: 使用socketserver的并发套接字,提供客户端下载文件,并对文件进行MD5加密
'''
while True:
try:
data = self.request.recv(1024)
data_recv = data.decode('gbk').split()
if not os.path.exists(FILE_PATH+r'\%s' %data_recv[1]):
self.request.send('file is not found'.encode('gbk'))
continue
else:
data = self.request.send('1'.encode('gbk')) # 这里发现小问题,不回复一个信息的话,发送给客户端的包头居然成了没有封装
FILE_SIZE = os.path.getsize(FILE_PATH+r'\%s' %data_recv[1])
with open(FILE_PATH+r'\%s' %data_recv[1],'rb')as f:
hash_file = f.read()
m = hashlib.md5()
m.update(hash_file)
m_hex = m.hexdigest()
file_header = {'filename':data_recv[1],
'filesize':FILE_SIZE,
'md5':m_hex,
'time':time.strftime('%Y-%m-%d-%X',time.localtime())
}
# 包头信息序列化
file_header_dump = json.dumps(file_header)
# 编译成2进制
file_header_bytes = file_header_dump.encode('gbk')
# 封装报头
file_header_struct = struct.pack('i',len(file_header_bytes))
# 发送报头
self.request.send(file_header_struct)
# 发送报文内容
self.request.send(file_header_bytes)
# 发送文件数据
send_size = 0
with open(FILE_PATH+r'\%s' %data_recv[1] , 'rb')as f:
for i in f:
self.request.send(i)
send_size += len(i) # 这里后续可以拓展一个进度或者网速显示功能
except Exception:
self.request.close()
if __name__ == '__main__':
server = ThreadingTCPServer(('127.0.0.1',8080),MYserver) # windows下只能开启多线程
server.serve_forever()
client.py
#!/usr/bin/env python
# -*- coding: gbk -*-
# @Version : Python 3.5.2
# @Time : 2018/1/24 10:29
# @Author : Ncp
# @File : client.py
# @Software: PyCharm
from socket import *
import os,sys
import hashlib
import struct
import math
import json
FILE_PATH = os.path.dirname(os.path.abspath(__file__))+'\\client_file'
# 显示下载进度条功能,可以拓展为显示下载速度(提示,因为每次传输4096个字节,那么下载网速为KB/S,1KB个字节=1024B(字节),那么1s传输了多少个字节呢?)
def progress(recvd, total):
fraction = '{:.0%}'.format(recvd / total)
sys.stdout.write('\r[%-30s] %s' % ('#' * int(math.floor(recvd * 30 / total)), fraction))
sys.stdout.flush()
if recvd == total:
sys.stdout.write('\n')
# 主函数
def run(ip,addr):
client = socket(AF_INET,SOCK_STREAM)
client.connect((ip,addr))
while True:
user_input = input('>>').strip()
cmd = user_input.split()
if len(cmd) != 2:
print('input format is error please use:get xx')
continue
if cmd[0] == 'get':
client.send(user_input.encode('gbk'))
data = client.recv(1024)
data_recv = data.decode('gbk')
if data_recv == 'file is not found':
print(data_recv)
continue
else:
print('commands is not found')
continue
# 收包头,然后一系列处理
header = client.recv(4)
if not header:break
header_json_len = struct.unpack('i', header)[0]
header_json_bytes = client.recv(header_json_len)
header_josn = header_json_bytes.decode('gbk')
header_dic = json.loads(header_josn)
# 去除包头内容进行下载
print(header_dic)
data_len = header_dic['filesize']
data_file = header_dic['filename']
data_md5 = header_dic['md5']
recv_size = 0
with open(FILE_PATH+r'\%s' %data_file,'wb')as fw:
while recv_size < data_len:
recv_data = client.recv(4096)
recv_size += len(recv_data)
fw.write(recv_data)
progress(recv_size,data_len)
print('Download completion, start validation')
# 收到文件后,读取文件进行加密,看是否与服务端下载的文件一致!
with open(FILE_PATH+r'\%s' %data_file,'rb')as fr:
data_total = fr.read()
m = hashlib.md5()
m.update(data_total)
m_hex = m.hexdigest()
if m_hex == data_md5:
print('文件验证通过')
else:
print('文件损坏,删除文件')
os.remove(FILE_PATH+r'\%s' %data_file)
if __name__ == '__main__':
run('127.0.0.1',8080)
自己可以设置一个多用户登录,然后测试,用户下载同一个文件,分别存入每个用户自己的家目录下面,效果更好。
当然现在也能测试,开启两个客户端同时下载文件。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13当流量红利消退、用户需求日趋多元,“凭经验决策、广撒网投放”的传统营销模式早已难以为继。大数据的崛起,为企业营销提供了全 ...
2026-05-13 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-05-13在手游行业存量竞争日趋激烈、流量成本持续高企的当下,“拉新”早已不是行业核心痛点,“留存”尤其是“付费留存”,成为决定手 ...
2026-05-12 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-05-12用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08