文章詳情頁

python爬蟲selenium模塊詳解

瀏覽：87日期：2022-06-23 17:32:10

selenium模塊selenium基本概念

selenium優(yōu)勢

便捷的獲取網(wǎng)站中動態(tài)加載的數(shù)據(jù) 便捷實現(xiàn)模擬登陸

selenium使用流程：

1.環(huán)境安裝：pip install selenium

2.下載一個瀏覽器的驅動程序（谷歌瀏覽器）

3.實例化一個瀏覽器對象

基本使用

代碼

from selenium import webdriverfrom lxml import etreefrom time import sleepif __name__ == ’__main__’: bro = webdriver.Chrome(r'E:googleChromeApplicationchromedriver.exe') bro.get(url=’http://scxk.nmpa.gov.cn:81/xk/’) page_text = bro.page_source tree = etree.HTML(page_text) li_list = tree.xpath(’//*[@id='gzlist']/li’) for li in li_list: name = li.xpath(’./dl/@title’)[0] print(name) sleep(5) bro.quit()基于瀏覽器自動化的操作

代碼

#編寫基于瀏覽器自動化的操作代碼- 發(fā)起請求: get(url)- 標簽定位: find系列的方法- 標簽交互: send_ keys( ’xxx’ )- 執(zhí)行js程序: excute_script(’jsCod’)- 前進，后退: back(),forward( )- 關閉瀏覽器: quit()

代碼

https://www.taobao.com/

from selenium import webdriverfrom time import sleepbro = webdriver.Chrome(executable_path=r'E:googleChromeApplicationchromedriver.exe')bro.get(url=’https://www.taobao.com/’)#標簽定位search_input = bro.find_element_by_id(’q’)sleep(2)#執(zhí)行一組js代碼，使得滾輪向下滑動bro.execute_script(’window.scrollTo(0,document.body.scrollHeight)’)sleep(2)#標簽交互search_input.send_keys(’女裝’)button = bro.find_element_by_class_name(’btn-search’)button.click()bro.get(’https://www.baidu.com’)sleep(2)bro.back()sleep(2)bro.forward()sleep(5)bro.quit()selenium處理iframe：

- 如果定位的標簽存在于iframe標簽之中，則必須使用switch_to.frame(id)- 動作鏈(拖動) : from selenium. webdriver import ActionChains- 實例化一個動作鏈對象: action = ActionChains (bro)- click_and_hold(div) :長按且點擊操作- move_by_offset(x,y)- perform( )讓動作鏈立即執(zhí)行- action.release( )釋放動作鏈對象

代碼

https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable

from selenium import webdriverfrom time import sleepfrom selenium.webdriver import ActionChainsbro = webdriver.Chrome(executable_path=r'E:googleChromeApplicationchromedriver.exe')bro.get(’https://www.runoob.com/try/try.php?filename=jqueryui-api-droppable’)bro.switch_to.frame(’iframeResult’)div = bro.find_element_by_id(’draggable’)#動作鏈action = ActionChains(bro)action.click_and_hold(div)for i in range(5): action.move_by_offset(17,0).perform() sleep(0.3)#釋放動作鏈action.release()bro.quit()selenium模擬登陸QQ空間

代碼

https://qzone.qq.com/

from selenium import webdriverfrom time import sleepbro = webdriver.Chrome(executable_path=r'E:googleChromeApplicationchromedriver.exe')bro.get(’https://qzone.qq.com/’)bro.switch_to.frame('login_frame')switcher = bro.find_element_by_id(’switcher_plogin’)switcher.click()user_tag = bro.find_element_by_id(’u’)password_tag = bro.find_element_by_id(’p’)user_tag.send_keys(’1234455’)password_tag.send_keys(’qwer123’)sleep(1)but = bro.find_element_by_id(’login_button’)but.click()無頭瀏覽器和規(guī)避檢測

代碼

from selenium import webdriverfrom time import sleep#實現(xiàn)無可視化界面from selenium.webdriver.chrome.options import Options#實現(xiàn)規(guī)避檢測from selenium.webdriver import ChromeOptions#實現(xiàn)無可視化界面chrome_options = Options()chrome_options.add_argument(’--headless’)chrome_options.add_argument(’--disable-gpu’)#實現(xiàn)規(guī)避檢測option = ChromeOptions()option.add_experimental_option(’excludeSwitches’,[’enable-automation’])bro = webdriver.Chrome(executable_path=r'E:googleChromeApplicationchromedriver.exe',chrome_options=chrome_options,options=option)bro.get(’https://www.baidu.com’)print(bro.page_source)sleep(2)bro.quit()

到此這篇關于python爬蟲selenium模塊詳解的文章就介紹到這了,更多相關python爬蟲selenium模塊內容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持好吧啦網(wǎng)！

Python 編程

上一條：python將圖片轉為矢量圖的方法步驟下一條：python 多進程和多線程使用詳解

相關文章：

1. Python使用oslo.vmware管理ESXI虛擬機的示例參考2. 一篇文章帶你了解JavaScript-對象3. Java構建JDBC應用程序的實例操作4. IDEA EasyCode 一鍵幫你生成所需代碼5. Ajax引擎 ajax請求步驟詳細代碼6. javascript設計模式 ? 建造者模式原理與應用實例分析7. Express 框架中使用 EJS 模板引擎并結合 silly-datetime 庫進行日期格式化的實現(xiàn)方法8. ThinkPHP5 通過ajax插入圖片并實時顯示(完整代碼)9. IntelliJ IDEA設置條件斷點的方法步驟10. Spring應用拋出NoUniqueBeanDefinitionException異常的解決方案

排行榜

					
					IDEA EasyCode 一鍵幫你生成所需代碼
Java構建JDBC應用程序的實例操作
ThinkPHP5 通過ajax插入圖片并實時顯示(完整代碼)
Python使用oslo.vmware管理ESXI虛擬機的示例參考
一篇文章帶你了解JavaScript-對象
Docker 部署 Prometheus的安裝詳細教程
Express 框架中使用 EJS 模板引擎并結合 silly-datetime 庫進行日期格式化的實現(xiàn)方法
javascript設計模式 ? 建造者模式原理與應用實例分析
IntelliJ IDEA設置條件斷點的方法步驟
Ajax引擎 ajax請求步驟詳細代碼
Spring應用拋出NoUniqueBeanDefinitionException異常的解決方案