国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

更多QQ空间微信QQ好友腾讯朋友复制链接
您的位置:首頁/技術文章
文章詳情頁

javascript - nodejs抓取網頁的問題

【字号: 作者:豬豬瀏覽:105日期:2023-09-13 15:18:42

問題描述

我準備抓用nodejs抓取下面這個網站的所有新聞, 按照一般的思路,是首先取得每頁新聞的URL,然后取得每個新聞的URL按照使用request把每個網址的內容取下來就OK了.

但是下面的這個網址的所有分頁信息, 還有每個新聞點擊進去URL都沒有任何變化, 貌似都是在后臺通過js實現的.用chrome的F12的newwork的tab也查看不到有什么請求,有哪位大神能指導一下我怎么來抓取嗎?

http://www.xxxxxxxxx.com/glob...

問題解答

回答1:

1.從上一篇與下一篇的地方可以看到,click綁定的函數:boardView(1);

2.通過boadrview在頁面中找到對應的函數:

function boardView(idx){ var listNum = 10; // ?? ? ?? var resultLenplistNum = Math.floor(idx/listNum); // ?? ??? ??? var resultLenRestlistNum = Math.floor(idx%listNum); // ?? ??? ??? if (resultLenRestlistNum == 0){ pageNum = resultLenplistNum; } else { pageNum = resultLenplistNum + 1; } cmsView.style.display = ’block’; cmsList.style.display = ’none’; resultViewStr = ’<p class='news_view'><p class='news_hd'>’; resultViewStr = resultViewStr + ’<strong>’+list.artCatTitles[resultSearch[idx]] +’</strong>’; resultViewStr = resultViewStr + ’<p>’+list.artTitles[resultSearch[idx]]+’</p>’; resultViewStr = resultViewStr + ’<span>’+list.artTimes[resultSearch[idx]]+’</span></p>’; resultViewStr = resultViewStr + ’<p class='news_bd'>’+list.artTexts[resultSearch[idx]]; resultViewStr = resultViewStr + list.artFiles[resultSearch[idx]]+’</p>’; resultViewStr = resultViewStr + ’<p class='news_link'><ul>’; resultViewStr = resultViewStr + ’<li><strong><span></span>’;

.........

3.看到數據來自于list這個變量,再尋找list

4.在1739行看到:

var artId = '';var catId = 'se14_24';var tplId = '';list = new jsList();list.cmsInit(catId, artId, tplId, new data()); // list ?? ??

5.調用了一個構造函數:jsList()找到相應的代碼在這里:http://www.samsungsem.com/js/...

6 看回第2步的代碼:list.artTitles-->這些數據是通過jsList的cmsInit方法設置的,而cmsInit中:

function cmsInit(catId, artId, tplId, data) { this.artIds = data.artIds; this.artCatTitles = data.artCatTitles; this.artTitles = data.artTitles; this.artUrls = data.artUrls; this.artTimes = data.artTimes; this.artImgs = data.artImgs; this.artTexts = data.artTexts; this.artTexts2 = data.artTexts2; this.artKeywords = data.artKeywords; this.artFiles = data.artFiles;

...的數據來自第四個參數data

7.再看第4步的傳的data是new data()于是,我們找到data這個函數定義的地方。往上找,找到了:<script src='http://www.cgvv.com.cn/global/news/data.js.jsp'></script>

8.打開后看一下:http://www.samsungsem.com/glo... 好奇怪的感覺,怎么樣式那么奇怪?

再右鍵查看源代碼:view-source:http://www.samsungsem.com/glo...可以看到data函數是在這里定義的,而你看到的數據也在這個頁面里。

回答2:

多謝回答,我先去看看去.....

基本看明白了,還有一點不是很懂的地方再慢慢去看,多謝了..

標簽: JavaScript
相關文章:
主站蜘蛛池模板: 久久免费网| 日本特黄特色 | 日本乱人伦在线观看免费 | 欧美日韩精彩视频 | 免费一级欧美在线观看视频片 | 黄色在线网站 | 免费国产99久久久香蕉 | 免费久 | 国产三香港三韩国三级不卡 | 亚洲精品系列 | 亚洲乱人伦精品图片 | 国产亚洲综合久久 | 欧美整片在线 | 国产成人精品高清免费 | 国产精品揄拍一区二区 | 毛色毛片免费看 | 偷拍精品视频一区二区三区 | 亚洲天堂视频在线 | 在线观看日本免费视频大片一区 | 色欧美在线 | 国产一级做a爰片久久毛片男 | 在线精品播放 | 日本精品久久久久久久 | 久久亚洲不卡一区二区 | 欧美区在线 | 国产黄a三级三级看三级 | 国产午夜亚洲精品理论片不卡 | 毛片高清一区二区三区 | 亚洲精品国产专区一区 | 99国产高清久久久久久网站 | 免费国产成人高清在线观看不卡 | 国产成人久久久精品一区二区三区 | 欧美白人和黑人xxxx猛交视频 | 真人真实毛片免费观看 | 国产成人精品一区二区三在线观看 | 午夜免费69性视频爽爽爽 | 亚洲日本中文字幕在线 | 久久99视频精品 | 国产一级毛片国语版 | 国产浮力第一页草草影院 | 久久九九精品一区二区 |