Python如何讀寫字節數據
問題
你想讀寫二進制文件,比如圖片,聲音文件等等。
解決方案
使用模式為 rb 或 wb 的 open() 函數來讀取或寫入二進制數據。比如:
# Read the entire file as a single byte stringwith open(’somefile.bin’, ’rb’) as f: data = f.read()# Write binary data to a filewith open(’somefile.bin’, ’wb’) as f: f.write(b’Hello World’)
在讀取二進制數據時,需要指明的是所有返回的數據都是字節字符串格式的,而不是文本字符串。 類似的,在寫入的時候,必須保證參數是以字節形式對外暴露數據的對象(比如字節字符串,字節數組對象等)。
討論
在讀取二進制數據的時候,字節字符串和文本字符串的語義差異可能會導致一個潛在的陷阱。 特別需要注意的是,索引和迭代動作返回的是字節的值而不是字節字符串。比如:
>>> # Text string>>> t = ’Hello World’>>> t[0]’H’>>> for c in t:... print(c)...Hello...>>> # Byte string>>> b = b’Hello World’>>> b[0]72>>> for c in b:... print(c)...72101108108111...>>>
如果你想從二進制模式的文件中讀取或寫入文本數據,必須確保要進行解碼和編碼操作。比如:
with open(’somefile.bin’, ’rb’) as f: data = f.read(16) text = data.decode(’utf-8’)with open(’somefile.bin’, ’wb’) as f: text = ’Hello World’ f.write(text.encode(’utf-8’))
二進制I/O還有一個鮮為人知的特性就是數組和C結構體類型能直接被寫入,而不需要中間轉換為自己對象。比如:
import arraynums = array.array(’i’, [1, 2, 3, 4])with open(’data.bin’,’wb’) as f: f.write(nums)
這個適用于任何實現了被稱之為”緩沖接口”的對象,這種對象會直接暴露其底層的內存緩沖區給能處理它的操作。 二進制數據的寫入就是這類操作之一。
很多對象還允許通過使用文件對象的 readinto() 方法直接讀取二進制數據到其底層的內存中去。比如:
>>> import array>>> a = array.array(’i’, [0, 0, 0, 0, 0, 0, 0, 0])>>> with open(’data.bin’, ’rb’) as f:... f.readinto(a)...16>>> aarray(’i’, [1, 2, 3, 4, 0, 0, 0, 0])>>>
但是使用這種技術的時候需要格外小心,因為它通常具有平臺相關性,并且可能會依賴字長和字節順序(高位優先和低位優先)。
以上就是Python如何讀寫字節數據的詳細內容,更多關于Python讀寫字節數據的資料請關注好吧啦網其它相關文章!
相關文章: