文章詳情頁

Python request中文亂碼問題解決方案

瀏覽：79日期：2022-07-11 08:07:16

Python request獲取網頁中文亂碼問題

r = requests.get(“http://www.baidu.com“)

**r.text返回的是Unicode型的數據。

使用r.content返回的是bytes型的數據。

也就是說，如果你想取文本，可以通過r.text。

如果想取圖片，文件，則可以通過r.content。**

方法1：使用r.text

Requests 會自動解碼來自服務器的內容。大多數 unicode 字符集都能被無縫地解碼。請求發出后，Requests 會基于 HTTP 頭部對響應的編碼作出有根據的推測。當你訪問 r.text 之時，Requests 會使用其推測的文本編碼。你可以找出 Requests 使用了什么編碼，并且能夠使用 r.encoding 屬性來改變它.

但是Requests庫的自身編碼為: r.encoding = ‘ISO-8859-1’

可以 r.encoding 修改編碼

url=’http://music.baidu.com’r=requests.get(url)r.encoding=’utf-8’print(r.text)

方法2：使用r.content

使用r.content，得到的是bytes型，再轉為str

url=’http://music.baidu.com’r = requests.get(url)html=r.contenthtml_doc=str(html,’utf-8’) #html_doc=html.decode('utf-8','ignore')print(html_doc)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：Python繪制組合圖的示例下一條：python如何使用騰訊云發送短信

相關文章：

1. 前端從瀏覽器的渲染到性能優化2. ASP實現加法驗證碼3. 利用CSS3新特性創建透明邊框三角4. 讀大數據量的XML文件的讀取問題5. 解析原生JS getComputedStyle6. 無線標記語言(WML)基礎之WMLScript 基礎第1/2頁7. css代碼優化的12個技巧8. ASP刪除img標簽的style屬性只保留src的正則函數9. ASP基礎入門第三篇(ASP腳本基礎)10. PHP循環與分支知識點梳理

排行榜

					
					基于SpringBoot bootstrap.yml配置未生效的解決
IntelliJ IDEA導出項目的方法
IntelliJ IDEA導入jar包的方法
idea設置自動導入依賴的方法步驟
django從后臺返回html代碼的實例
IntelliJ IDEA導入項目的方法
Docker容器如何更新打包并上傳到阿里云
ASP.NET MVC使用異步Action的方法
Vue如何提升首屏加載速度實例解析
Java JUC中操作List安全類的集合案例
利用CSS3新特性創建透明邊框三角