Python模块教程之struct数据格式转换

发布时间:2020-08-21编辑:脚本学堂
本文介绍下,python中使用struct模块进行数据格式转换的方法,学习下python模块struct的用法,分享了几个实例,供大家作下参考。

本节内容:
pythonmokuai/ target=_blank class=infotextkey>python模块struct实现数据格式转换的转换。

Python是一门非常简洁的语言,对于数据类型的表示,不像其他语言预定义了许多类型(如:在C#中,光整型就定义了8种),它只定义了六种基本类型:字符串,整数,浮点数,元组,列表,字典。通过这六种数据类型,可以完成大部分工作。

但当Python需要通过网络与其他的平台进行交互时,必须考虑到将这些数据类型与其他平台或语言之间的类型进行互相转换问题。打个比方:C++写的客户端发送一个int型(4字节)变量的数据到Python写的服务器,Python接收到表示这个整数的4个字节数据,怎么解析成Python认识的整数呢? Python的标准模块struct就用来解决这个问题。

struct模块的内容不多,对其中最常用的方法进行介绍:

一,struct.pack
struct.pack用于将Python的值根据格式符,转换为字符串(因为Python中没有字节(Byte)类型,可以把这里的字符串理解为字节流,或字节数组)。其函数原型为:struct.pack(fmt, v1, v2, ...),参数fmt是格式字符串,关于格式字符串的相关信息在下面有所介绍。v1, v2, ...表示要转换的python值。下面的例子将两个整数转换为字符串(字节流):
 

复制代码 代码示例:
import struct 
 
a = 20 
b = 400 
 
str = struct.pack("ii", a, b)  #转换后的str虽然是字符串类型,但相当于其他语言中的字节流(字节数组),可以在网络上传输 
print 'length:', len(str) 
print str 
print repr(str) 
 
#---- result 
#length: 8 
#    ----这里是乱码 
#'/x14/x00/x00/x00/x90/x01/x00/x00' 

格式符"i"表示转换为int,'ii'表示有两个int变量。进行转换后的结果长度为8个字节(int类型占用4个字节,两个int为8个字节),可以看到输出的结果是乱码,因为结果是二进制数据,所以显示为乱码。可以使用python的内置函数repr来获取可识别的字符串,其中十六进制的0x00000014, 0x00001009分别表示20和400。

二,struct.unpack
struct.unpack做的工作刚好与struct.pack相反,用于将字节流转换成python数据类型。它的函数原型为:struct.unpack(fmt, string),该函数返回一个元组。
例子:
 

复制代码 代码示例:
str = struct.pack("ii", 20, 400) 
a1, a2 = struct.unpack("ii", str) 
print 'a1:', a1 
print 'a2:', a2 
 
#---- result: 
#a1: 20 
#a2: 400 

三,struct.calcsize
struct.calcsize用于计算格式字符串所对应的结果的长度,如:struct.calcsize('ii'),返回8。
因为两个int类型所占用的长度是8个字节。

struct.pack_into, struct.unpack_from
这两个函数在Python手册中有所介绍,但没有给出如何使用的例子。其实它们在实际应用中用的并不多。

例子:
 

复制代码 代码示例:
import struct 
from ctypes import create_string_buffer 
 
buf = create_string_buffer(12) 
print repr(buf.raw) 
 
struct.pack_into("iii", buf, 0, 1, 2, -1) 
print repr(buf.raw) 
 
print struct.unpack_from('iii', buf, 0) 
 
#---- result 
#'/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00/x00' 
#'/x01/x00/x00/x00/x02/x00/x00/x00/xff/xff/xff/xff' 
#(1, 2, -1) 

关于格式字符串
在Python手册中,给出了C语言中常用类型与Python类型对应的格式符:

格式符 C语言类型 Python类型
x pad byte no value  
c char string of length 1  
b signed char integer  
B unsigned char integer  
? _Bool bool  
h short integer  
H unsigned short integer  
i int integer  
I unsigned int integer or long  
l long integer  
L unsigned long long  
q long long long  
Q unsigned long long long  
f float float  
d double float  
s char[] string  
p char[] string  
P void * long

具体内容请参考Python手册 struct 模块(http://docs.python.org/library/struct.html#module-struct)中的介绍。