国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

更多QQ空间微信QQ好友腾讯朋友复制链接
您的位置:首頁/技術文章
文章詳情頁

python 如何使用find和find_all爬蟲、找文本的實現

【字号: 作者:豬豬瀏覽:3日期:2022-07-08 10:20:11

這篇文章我們來講講如何在python使用bs4模塊返回值中正確使用find和find_all來取值。

我們先來看看find函數在兩種場景使用: 一、 find在字符串(str)時可以查找使用。

在字符串(str)是怎么來使用find函數,find函數就是找到的意思。

我們來看看下面案例

#---------案例1-----------a=’0123456789’#因為我們電腦中的字節都是從0開始算第一個位置b=a.find(’0’)#這行代碼的意思就是我要查找a中0的位置print(b)

>>0

#這里就是打印出來的內容

應為0在a中的第0個位置

在來試試第二個案例

#---------案例2-----------a=’0123456789’ b=a.find(’5’)#我要查找a中5的位置print(b)

>>5

其中你要查找的內容不在a中,則會返回 -1 。在str中的使用方法說到這里。

二、 find在bs4模塊返回值中怎么使用

我們在課堂上學過,bs4返回的值是 <class ’bs4.BeautifulSoup’>

假設我把把bs4返回的值賦值給 bs

這時我們就要用 bs.find(class_=‘one’)

這個代碼就是在bs值中從上往下找,找到第一個類等于one的值。

如果下圖

python 如何使用find和find_all爬蟲、找文本的實現

從上到下找是不是我標出來藍色區域是我要找的類,對的我們把他賦值給one,我們把他打印出來

print(’one’)

這時候系統就會返回這樣一個值給我們,如下圖

python 如何使用find和find_all爬蟲、找文本的實現

大家看,他返回的是從 class=’one’開始到這個類標簽ul結束,對的,他不會返回其他值,他只會返回這個類的標簽開始到結束。

所以當bs4返回值時,第一步使用find找打包含自己要找的所有值中第一個父類,再賦值給函數,這樣這個函數就是我們進行下一步查找的對象。

接下倆我們就還可以使用find(找到)或者find_all(找到全部一樣的),來定位函數位置,像圖中:

python 如何使用find和find_all爬蟲、找文本的實現

class='navbar-branding'就只有一個,我們像打印出 開發者的網上家園 怎么寫

這時候我們假設,上面bs.find(class_=’one’)賦值給one函數那么我們就從one開始查找one.find(class='navbar-branding')這樣查找出來的內哦讓那個就會返回給我們這個區域內容

python 如何使用find和find_all爬蟲、找文本的實現

然后這個區域的文字再title值里面,我們就沒辦法直接用 .text 取值了,所以我們要接著查找

將one.find(class='navbar-branding')賦值給 one_1

然后用 one_1.find(’a’)來查找到a標簽

后面加一個中括號取值[‘title’]這樣打印出來內容就是“開發者的網上家園”了。

連起來就是這樣寫

print(one_1.find(’a’) [’title’])

下面我們把代碼連起來打一遍看圖

python 如何使用find和find_all爬蟲、找文本的實現

看代碼

one=bs.find(class_=’one’)one_1=one.find(class='navbar-branding')print(one_1.find(’a’) [’title’])>>開發者的網上家園#這就是最后返回的值

就這么簡單。

三、 find_all在bs4模塊返回值中怎么使用

還是用上圖舉例

python 如何使用find和find_all爬蟲、找文本的實現

我們可以看到如果我要取下面的 li 標簽中的值怎么辦

這時候我們就得用到find_al了(查找全部一樣的)

先補充代碼到這個li標簽的父類

one=bs.find(class_=’one’)one_1=one.find(class='navbar-branding')

然后我們用one_1來取值如下代碼

one_1.find_all(’li’)#這時候我們取值了再one_1區域中所有有li便簽的內容

他會返回給我們一個列表

列表時這樣的

<li>…</li>,<li>…</li>,<li>…</li>,<li>…</li>,<li>…</li>,<li>…</li>

每一個區域就是一個內容,中間的。。。我時為了圖省事,其實都是內容。

竟然得到這樣的一個列表我們就可以使用for I in one_1.find_all(’li’)

這樣取遍歷出這個列表的東西,然后取值,

或者我只要其中一個就是ne_1.find_all(’li’)[2] 后面加一個數字,

列表取值大家應該都會把,這樣就可以定位到我們想要的東西了。

總結一下find就是查找某一項的第一個數據,find_all就是找所有數據,然后用for遍歷就能取出

到此這篇關于python 如何使用find和find_all爬蟲、找文本的實現的文章就介紹到這了,更多相關python find和find_all爬蟲 內容請搜索好吧啦網以前的文章或繼續瀏覽下面的相關文章希望大家以后多多支持好吧啦網!

標簽: Python 編程
相關文章:
主站蜘蛛池模板: 欧美亚洲国产视频 | 免费看香港一级毛片 | 亚洲欧美综合国产不卡 | 久久成年人视频 | 免费视频网站一级人爱视频 | 97国产成人精品免费视频 | 亚洲在线观看视频 | 999热成人精品国产免 | 国产91九色刺激露脸对白 | 女人一级特纯黄大片色 | 天天都色| 九九99香蕉在线视频免费 | 男操美女| 99久久精品国产一区二区 | 亚洲激情黄色 | 久久视频一区 | 香蕉午夜 | 国产视频久久久 | 男人天堂男人天堂 | 亚洲天堂美女视频 | 国产成人精品在线 | 国产精品久久久久久小说 | 欧美人成人亚洲专区中文字幕 | 精品一区二区三区中文 | 亚洲成人777 | 九九九九在线视频播放 | 精品国产欧美一区二区三区成人 | 91精品啪在线看国产网站 | 免费人成在线观看 | 午夜宅宅宅影院在线观看 | 日韩欧美在线观看视频 | 极品丝袜高跟91白沙发在线 | 国产99视频精品免费视频7 | 欧美亚洲国产精品久久久 | 欧美日韩国产亚洲综合不卡 | 男人精品一线视频在线观看 | 欧洲成人r片在线观看 | 国产网址在线观看 | 国产精品亚洲欧美云霸高清 | 欧美一级视频精品观看 | 亚洲国产精品成人久久 |