解析Linux高性能網(wǎng)絡(luò)IO和Reactor模型
在零拷貝機(jī)制篇章已介紹過 用戶空間和內(nèi)核空間和緩沖區(qū),這里就省略了
二、網(wǎng)絡(luò)IO的讀寫過程 當(dāng)在用戶空間發(fā)起對socket套接字的讀操作時(shí),會(huì)導(dǎo)致上下文切換,用戶進(jìn)程阻塞(R1)等待網(wǎng)絡(luò)數(shù)據(jù)流到來,從網(wǎng)卡復(fù)制到內(nèi)核;(R2)然后從內(nèi)核緩沖區(qū)向用戶進(jìn)程緩沖區(qū)復(fù)制。此時(shí)進(jìn)程切換恢復(fù),處理拿到的數(shù)據(jù) 這里我們給socket讀操作的第一階段起個(gè)別名R1,第二階段稱為R2 當(dāng)在用戶空間發(fā)起對socket的send操作時(shí),導(dǎo)致上下文切換,用戶進(jìn)程阻塞等待(1)數(shù)據(jù)從用戶進(jìn)程緩沖區(qū)復(fù)制到內(nèi)核緩沖區(qū)。數(shù)據(jù)copy完成,此時(shí)進(jìn)程切換恢復(fù)三、Linux五種網(wǎng)絡(luò)IO模型3.1、阻塞式I/O (blocking IO)ssize_t recvfrom(int sockfd,void *buf,size_t len,unsigned int flags, struct sockaddr *from,socket_t *fromlen);
int select(int nfds, fd_set *readfds, fd_set *writefds, fd_set *exceptfds, struct timeval *timeout);
1)使用copy_from_user從用戶空間拷貝fd_set到內(nèi)核空間
2)注冊回調(diào)函數(shù)__pollwait
3)遍歷所有fd,調(diào)用其對應(yīng)的poll方法(對于socket,這個(gè)poll方法是sock_poll,sock_poll根據(jù)情況會(huì)調(diào)用到tcp_poll,udp_poll或者datagram_poll)
4)以tcp_poll為例,其核心實(shí)現(xiàn)就是__pollwait,也就是上面注冊的回調(diào)函數(shù)
5)__pollwait的主要工作就是把current(當(dāng)前進(jìn)程)掛到設(shè)備的等待隊(duì)列中,不同的設(shè)備有不同的等待隊(duì)列,對于tcp_poll來說,其等待隊(duì)列是sk->sk_sleep(注意把進(jìn)程掛到等待隊(duì)列中并不代表進(jìn)程已經(jīng)睡眠了)。在設(shè)備收到一條消息(網(wǎng)絡(luò)設(shè)備)或填寫完文件數(shù)據(jù)(磁盤設(shè)備)后,會(huì)喚醒設(shè)備等待隊(duì)列上睡眠的進(jìn)程,這時(shí)current便被喚醒了
6)poll方法返回時(shí)會(huì)返回一個(gè)描述讀寫操作是否就緒的mask掩碼,根據(jù)這個(gè)mask掩碼給fd_set賦值
7)如果遍歷完所有的fd,還沒有返回一個(gè)可讀寫的mask掩碼,則會(huì)調(diào)用schedule_timeout是調(diào)用select的進(jìn)程(也就是current)進(jìn)入睡眠
8) 當(dāng)設(shè)備驅(qū)動(dòng)發(fā)生自身資源可讀寫后,會(huì)喚醒其等待隊(duì)列上睡眠的進(jìn)程。如果超過一定的超時(shí)時(shí)間(timeout指定),還是沒人喚醒,則調(diào)用select的進(jìn)程會(huì)重新被喚醒獲得CPU,進(jìn)而重新遍歷fd,判斷有沒有就緒的fd
9)把fd_set從內(nèi)核空間拷貝到用戶空間
select的缺點(diǎn):
每次調(diào)用select,都需要把fd集合從用戶態(tài)拷貝到內(nèi)核態(tài),這個(gè)開銷在fd很多時(shí)會(huì)很大 同時(shí)每次調(diào)用select都需要在內(nèi)核遍歷傳遞進(jìn)來的所有fd,這個(gè)開銷在fd很多時(shí)也很大 select支持的文件描述符數(shù)量太小了,默認(rèn)是10244.2、epollint epoll_create(int size); int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event); int epoll_wait(int epfd, struct epoll_event *events,int maxevents, int timeout); 調(diào)用epoll_create,會(huì)在內(nèi)核cache里建個(gè)紅黑樹用于存儲(chǔ)以后epoll_ctl傳來的socket,同時(shí)也會(huì)再建立一個(gè)rdllist雙向鏈表用于存儲(chǔ)準(zhǔn)備就緒的事件。當(dāng)epoll_wait調(diào)用時(shí),僅查看這個(gè)rdllist雙向鏈表數(shù)據(jù)即可 epoll_ctl在向epoll對象中添加、修改、刪除事件時(shí),是在rbr紅黑樹中操作的,非常快 添加到epoll中的事件會(huì)與設(shè)備(如網(wǎng)卡)建立回調(diào)關(guān)系,設(shè)備上相應(yīng)事件的發(fā)生時(shí)會(huì)調(diào)用回調(diào)方法,把事件加進(jìn)rdllist雙向鏈表中;這個(gè)回調(diào)方法在內(nèi)核中叫做ep_poll_callback
epoll的兩種觸發(fā)模式:
epoll有EPOLLLT和EPOLLET兩種觸發(fā)模式,LT是默認(rèn)的模式,ET是“高速”模式(只支持no-block socket)
LT(水平觸發(fā))模式下,只要這個(gè)文件描述符還有數(shù)據(jù)可讀,每次epoll_wait都會(huì)觸發(fā)它的讀事件 ET(邊緣觸發(fā))模式下,檢測到有I/O事件時(shí),通過 epoll_wait 調(diào)用會(huì)得到有事件通知的文件描述符,對于文件描述符,如可讀,則必須將該文件描述符一直讀到空(或者返回EWOULDBLOCK),否則下次的epoll_wait不會(huì)觸發(fā)該事件4.3、epoll相比select的優(yōu)點(diǎn)解決select三個(gè)缺點(diǎn):
對于第一個(gè)缺點(diǎn):epoll的解決方案在epoll_ctl函數(shù)中。每次注冊新的事件到epoll句柄中時(shí)(在epoll_ctl中指定EPOLL_CTL_ADD),會(huì)把所有的fd拷貝進(jìn)內(nèi)核,而不是在epoll_wait的時(shí)候重復(fù)拷貝。epoll保證了每個(gè)fd在整個(gè)過程中只會(huì)拷貝一次(epoll_wait不需要復(fù)制) 對于第二個(gè)缺點(diǎn):epoll為每個(gè)fd指定一個(gè)回調(diào)函數(shù),當(dāng)設(shè)備就緒,喚醒等待隊(duì)列上的等待者時(shí),就會(huì)調(diào)用這個(gè)回調(diào)函數(shù),而這個(gè)回調(diào)函數(shù)會(huì)把就緒的fd加入一個(gè)就緒鏈表。epoll_wait的工作實(shí)際上就是在這個(gè)就緒鏈表中查看有沒有就緒的fd(不需要遍歷) 對于第三個(gè)缺點(diǎn):epoll沒有這個(gè)限制,它所支持的FD上限是最大可以打開文件的數(shù)目,這個(gè)數(shù)字一般遠(yuǎn)大于2048,舉個(gè)例子,在1GB內(nèi)存的機(jī)器上大約是10萬左右,一般來說這個(gè)數(shù)目和系統(tǒng)內(nèi)存關(guān)系很大epoll的高性能:
epoll使用了紅黑樹來保存需要監(jiān)聽的文件描述符事件,epoll_ctl增刪改操作快速 epoll不需要遍歷就能獲取就緒fd,直接返回就緒鏈表即可 linux2.6 之后使用了mmap技術(shù),數(shù)據(jù)不在需要從內(nèi)核復(fù)制到用戶空間,零拷貝4.4、關(guān)于epoll的IO模型是同步異步的疑問概念定義:
同步I/O操作:導(dǎo)致請求進(jìn)程阻塞,直到I/O操作完成 異步I/O操作:不導(dǎo)致請求進(jìn)程阻塞,異步只用處理I/O操作完成后的通知,并不主動(dòng)讀寫數(shù)據(jù),由系統(tǒng)內(nèi)核完成數(shù)據(jù)的讀寫 阻塞,非阻塞:進(jìn)程/線程要訪問的數(shù)據(jù)是否就緒,進(jìn)程/線程是否需要等待異步IO的概念是要求無阻塞I/O調(diào)用。前面有介紹到I/O操作分兩階段:R1等待數(shù)據(jù)準(zhǔn)備好。R2從內(nèi)核到進(jìn)程拷貝數(shù)據(jù)。雖然epoll在2.6內(nèi)核之后采用mmap機(jī)制,使得其在R2階段不需要復(fù)制,但是它在R1還是阻塞的。因此歸類到同步IO
五、Reactor模型Reactor的中心思想是將所有要處理的I/O事件注冊到一個(gè)中心I/O多路復(fù)用器上,同時(shí)主線程/進(jìn)程阻塞在多路復(fù)用器上;一旦有I/O事件到來或是準(zhǔn)備就緒,多路復(fù)用器返回,并將事先注冊的相應(yīng)I/O事件分發(fā)到對應(yīng)的處理器中
5.1、相關(guān)概念介紹 事件:就是狀態(tài);比如:讀就緒事件指的是我們可以從內(nèi)核讀取數(shù)據(jù)的狀態(tài) 事件分離器:一般會(huì)把事件的等待發(fā)生交給epoll、select;而事件的到來是隨機(jī),異步的,所以需要循環(huán)調(diào)用epoll,在框架里對應(yīng)封裝起來的模塊就是事件分離器(簡單理解為對epoll封裝) 事件處理器:事件發(fā)生后需要進(jìn)程或線程去處理,這個(gè)處理者就是事件處理器,一般和事件分離器是不同的線程5.2、Reactor的一般流程1)應(yīng)用程序在事件分離器注冊讀寫就緒事件和讀寫就緒事件處理器
2)事件分離器等待讀寫就緒事件發(fā)生
3)讀寫就緒事件發(fā)生,激活事件分離器,分離器調(diào)用讀寫就緒事件處理器
4)事件處理器先從內(nèi)核把數(shù)據(jù)讀取到用戶空間,然后再處理數(shù)據(jù)
1)應(yīng)用程序在事件分離器注冊讀完成事件和讀完成事件處理器,并向系統(tǒng)發(fā)出異步讀請求
2)事件分離器等待讀事件的完成
3)在分離器等待過程中,系統(tǒng)利用并行的內(nèi)核線程執(zhí)行實(shí)際的讀操作,并將數(shù)據(jù)復(fù)制進(jìn)程緩沖區(qū),最后通知事件分離器讀完成到來
4)事件分離器監(jiān)聽到讀完成事件,激活讀完成事件的處理器
5)讀完成事件處理器直接處理用戶進(jìn)程緩沖區(qū)中的數(shù)據(jù)
以上就是解析Linux高性能網(wǎng)絡(luò)IO和Reactor模型的詳細(xì)內(nèi)容,更多關(guān)于Linux高性能網(wǎng)絡(luò)IO和Reactor模型的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!
相關(guān)文章:
1. Centos7下刪除virbr0網(wǎng)卡信息的方法2. Win10任務(wù)欄不顯示打開的應(yīng)用怎么辦?Win10任務(wù)欄不顯示打開的應(yīng)用的解決方法3. 如何在電腦PC上啟動(dòng)Windows11和Linux雙系統(tǒng)4. Win11怎么查看文件的后綴名?Win11顯示文件后綴名的方法5. Win11 Build預(yù)覽版25276怎么啟用新版文件管理器?6. Win10任務(wù)欄沒有開始菜單怎么辦?Win10任務(wù)欄沒有開始菜單的解決方法7. 鼠標(biāo)怎么設(shè)置為左手? deepin20左手鼠標(biāo)設(shè)置方法8. Debian11怎么添加桌面快捷圖標(biāo)? Debian桌面快捷方式的添加方法9. uos如何安裝微信? uos系統(tǒng)微信的安裝教程10. 蘋果 macOS 11.7.3 更新導(dǎo)致 Safari 收藏夾圖標(biāo)無法正常顯示
