python 制作網(wǎng)站小說(shuō)下載器
· Python 3.6
· Pycharm
相關(guān)模塊使用輸入想看的小說(shuō)內(nèi)容,點(diǎn)擊搜索
這里會(huì)返回很多結(jié)果,我只選擇第一個(gè)
網(wǎng)頁(yè)數(shù)據(jù)是靜態(tài)數(shù)據(jù),但是要搜索,是post請(qǐng)求,需要提價(jià)data參數(shù),如下圖所示:
然后通過(guò)解析網(wǎng)站數(shù)據(jù),獲取第一個(gè)小說(shuō)i的詳情頁(yè)url即可
靜態(tài)網(wǎng)頁(yè)的獲取,難度是不大的。def search(): search_url = ’http://www.xbiquge.la/modules/article/waps.php’ data = {’searchkey’: name } response = requests.post(url=search_url, data=data, headers=headers) selector = get_parsing(response.text) novel_url = selector.css(’.even a::attr(href)’).extract_first()1、獲取每本小說(shuō)的章節(jié)名以及url地址
所有的章節(jié)名以及url地址,都包含在dd標(biāo)簽里面
’/23/23019/11409705.html’ # 這是網(wǎng)頁(yè)獲取到的url’http://www.xbiquge.la/23/23019/11409705.html’ # 這是真實(shí)的小說(shuō)章節(jié)內(nèi)容url地址3、小說(shuō)名字,直接獲取即可。
def download_one_book(index_url): response = get_response(index_url) response.encoding = response.apparent_encoding sel = get_parsing(response.text) book_name = sel.css(’#info h1::text’).get() # 提取了所有章節(jié)的下載地址 urls = sel.css(’#list dd a::attr(href)’).getall() # 不要最新的 12 章放在最前main for url in urls:chapter_url = ’http://www.xbiquge.la’ + urlprint(chapter_url)
保存下載每章小說(shuō)內(nèi)容
def download_one_chapter(chapter_url, book_name): response = get_response(chapter_url) response.encoding = response.apparent_encoding html = response.text selector = get_parsing(html) h1 = selector.css(’.bookname h1::text’).get() content = selector.css(’#content::text’).getall() lines = [] for c in content:lines.append(c.strip()) print(h1) text = ’n’.join(lines) file = open(book_name + ’.txt’, mode=’a’, encoding=’utf-8’) file.write(h1) file.write(’n’) file.write(text) file.write(’n’) file.close()小說(shuō)軟件界面
root = Tk()root.title(’小說(shuō)下載器’)root.geometry(’560x450+400+200’) label = Label(root, text=’請(qǐng)輸入下載小說(shuō)名字:’, font=(’華文行楷’, 20))label.grid() entry = Entry(root, font=(’隸書’, 20))entry.grid(row=0, column=1) text = Listbox(root, font=(’隸書’, 16), width=50, heigh=15)text.grid(row=2, columnspan=2) button1 = Button(root, text=’開(kāi)始下載’, font=(’隸書’, 15), command=search)button1.grid(row=3, column=0) button2 = Button(root, text=’退出程序’, font=(’隸書’, 15), command=root.quit)button2.grid(row=3, column=1) root.mainloop()顯示下載內(nèi)容
def novel_load(title): text.insert(END, ’正在保存:{}’.format(title)) # 文本框滾動(dòng) text.see(END) # 更新 text.update()實(shí)現(xiàn)效果
以上就是python 制作網(wǎng)站小說(shuō)下載器的詳細(xì)內(nèi)容,更多關(guān)于python 小說(shuō)下載器的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. PHP循環(huán)與分支知識(shí)點(diǎn)梳理2. ASP刪除img標(biāo)簽的style屬性只保留src的正則函數(shù)3. 前端從瀏覽器的渲染到性能優(yōu)化4. ASP基礎(chǔ)入門第三篇(ASP腳本基礎(chǔ))5. css代碼優(yōu)化的12個(gè)技巧6. ASP實(shí)現(xiàn)加法驗(yàn)證碼7. 無(wú)線標(biāo)記語(yǔ)言(WML)基礎(chǔ)之WMLScript 基礎(chǔ)第1/2頁(yè)8. 讀大數(shù)據(jù)量的XML文件的讀取問(wèn)題9. 利用CSS3新特性創(chuàng)建透明邊框三角10. 解析原生JS getComputedStyle
