騰訊PHP實習生筆試題目及答案解析
1.const的含義及實現機制,比如:const int i,是怎么做到i只可讀的?
分析及答案:
含義:const用來說明所定義的變量是只讀的。
實現機制:這些在編譯期間完成,編譯器使用常數直接替換掉對此變量的引用。
更多關于const的介紹和說明可參考這篇文章:/p/4679.html
2.到商店里買200的商品返還100優惠券(可以在本商店代替現金),請問實際上折扣是多少?
分析及答案:
由于優惠券可以代替現金,所以可以使用200元優惠券買東西,然后還可以獲得100元的優惠券。
假設開始時花了x元,那么可以買到 x + x/2 + x/4 + …的東西。所以實際上折扣是50%。(當然,大部分時候很難一直兌換下去,所以50%是折扣的上限)
如果使用優惠券買東西不能獲得新的優惠券,那么總過花去了200元,可以買到200+100元的商品,所以實際折扣為 200/300 = 67%。
3.tcp三次握手的過程,accept發生在三次握手哪個階段?
分析及答案:
accept發生在三次握手之后。
第一次握手:客戶端發送syn包(syn=j)到服務器。
第二次握手:服務器收到syn包,必須確認客戶的SYN(ack=j+1),同時自己也發送一個ASK包(ask=k)。
第三次握手:客戶端收到服務器的SYN+ACK包,向服務器發送確認包ACK(ack=k+1)。
三次握手完成后,客戶端和服務器就建立了tcp連接。這時可以調用accept函數獲得此連接。
4.用UDP協議通訊時怎樣得知目標機是否獲得了數據包?
分析及答案:
可以在每個數據包中插入一個唯一的ID,比如timestamp或者遞增的int。
發送方在發送數據時將此ID和發送時間記錄在本地。
接收方在收到數據后將ID再發給發送方作為回應。
發送方如果收到回應,則知道接收方已經收到相應的數據包;如果在指定時間內沒有收到回應,則數據包可能丟失,需要重復上面的過程重新發送一次,直到確定對方收到。
5.統計論壇在線人數分布:假設有一個論壇,其注冊ID有兩億個,每個ID從登陸到退出會向一個日志文件中記下登陸時間和退出時間,要求寫一個算法統計一天中論壇的用戶在線分布,取樣粒度為秒。
分析及答案:
一天總共有 3600*24 = 86400秒。
定義一個長度為86400的整數數組int delta[86400],每個整數對應這一秒的人數變化值,可能為正也可能為負。開始時將數組元素都初始化為0。
然后依次讀入每個用戶的登錄時間和退出時間,將與登錄時間對應的整數值加1,將與退出時間對應的整數值減1。
這樣處理一遍后數組中存儲了每秒中的人數變化情況。
定義另外一個長度為86400的整數數組int online_num[86400],每個整數對應這一秒的論壇在線人數。
假設一天開始時論壇在線人數為0,則第1秒的人數online_num[0] = delta[0]。第n+1秒的人數online_num[n] = online_num[n-1] + delta[n]。
這樣我們就獲得了一天中任意時間的在線人數。
6.在一個文件中有 10G 個整數,亂序排列,要求找出中位數,內存限制為 2G。
分析及答案:
不妨假設10G個整數是64bit的。
2G內存可以存放256M個64bit整數。
我們可以將64bit的整數空間平均分成256M個取值范圍,用2G的內存對每個取值范圍內出現整數個數進行統計。這樣遍歷一邊10G整數后,我們便知道中數在那個范圍內出現,以及這個范圍內總共出現了多少個整數。
如果中數所在范圍出現的整數比較少,我們就可以對這個范圍內的整數進行排序,找到中數。如果這個范圍內出現的整數比較多,我們還可以采用同樣的方法將此范圍再次分成多個更小的范圍(256M=2^28,所以最多需要3次就可以將此范圍縮小到1,也就找到了中數)。
詳解解釋(查看>>)
7.兩個整數集合A和B,求其交集
分析及答案:
1). 讀取整數集合A中的整數,將讀到的整數插入到map中,并將對應的值設為1。
2). 讀取整數集合B中的整數,如果該整數在map中并且值為1,則將此數加入到交集當中,并將在map中的對應值改為2。
通過更改map中的值,避免了將同樣的值輸出兩次。
8.找出1到10w中沒有出現的兩個數字
分析及答案:
有1到10w這10w個數,去除2個并打亂次序,如何找出那兩個數?
申請10w個bit的空間,每個bit代表一個數字是否出現過。
開始時將這10w個bit都初始化為0,表示所有數字都沒有出現過。
然后依次讀入已經打亂循序的數字,并將對應的bit設為1。
當處理完所有數字后,根據為0的bit得出沒有出現的數字。
首先計算1到10w的和,平方和。
然后計算給定數字的和,平方和。
兩次的到的數字相減,可以得到這兩個數字的和,平方和。
所以我們有
x + y = n
x^2 + y^2 = m
解方程可以得到x和y的值。
9.有1000瓶水,其中有一瓶有毒,小白鼠只要嘗一點帶毒的水24小時后就會死亡,至少要多少只小白鼠才能在24小時時鑒別出那瓶水有毒?
分析及答案:
最容易想到的就是用1000只小白鼠,每只喝一瓶。但顯然這不是最好答案。
既然每只小白鼠喝一瓶不是最好答案,那就應該每只小白鼠喝多瓶。那每只應該喝多少瓶呢?
首先讓我們換種問法,如果有x只小白鼠,那么24小時內可以從多少瓶水中找出那瓶有毒的?
由于每只小白鼠都只有死或者活這兩種結果,所以x只小白鼠最大可以表示2^x種結果。如果讓每種結果都對應到某瓶水有毒,那么也就可以從2^x瓶水中找到有毒的那瓶水。那如何來實現這種對應關系呢?
第一只小白鼠喝第1到2^(x-1)瓶,第二只小白鼠喝第1到第2^(x-2)和第2^(x-1)+1到第2^(x-1) + 2^(x-2)瓶….以此類推。
回到此題,總過1000瓶水,所以需要最少10只小白鼠。
10.根據上排給出十個數,在其下排填出對應的十個數, 要求下排每個數都是上排對應位置的數在下排出現的次數。上排的數:0,1,2,3,4,5,6,7,8,9。
分析及答案:
關鍵是理解“要求下排每個數都是先前上排那十個數在下排出現的次數”。
做以下分析:設總共有n個數,上排a[0...n-1],下排b[0...n-1],。
1)下排n個數的累加和為n,即b[0]+b[1]+...+b[n-1] = n
2)ai*bi的累加和也為n,即a[0]*b[0]+a[1]*b[1]+...+a[n-1]*b[n-1] = n
3)對于b中任意一個元素b[j], 都存在i,a[i] = b[j].
4)對于b中任意一個元素b[j],都有b[j] >= 0
5)如果a中存在負數。其在b中出現的次數一定為0. 如果a中數值大于n,則其出現次數也為0.
6)a中至少有兩個非0數值在b中出現的次數非0
a:由1)n > n*b[i],其中b[i]為最小值,則a b中一定均有數值0,否則無解。設a[0] = 0,b[0]為a[0]在b中出現次數。
b:由于b中一定存在0,則0的出現次數一定大于0,因此b[0]>0 且b[0] < n,b[1...n-1]中至少一個值為0. 非0元素出現的次數一共是n-b[0].
c:有2)和6)對任意a[i],a[i]*b[i] < n,即b[i] < n/a[i],對所有a[i]>=n/2的元素中,在b中出現的次數必須最多只有1個出現次數不為0,且為1.其余出現次數均為0,即[1, n/2)范圍內最多只有n/2-1個元素,故0出現的次數必不小于n/2, [n/2,n)范圍內的元素必有一個出現次數為1。因此a數列中也必須有1,否則無解。
d:有c得在數值范圍為(0,n/2)中(假設有x這樣的數)出現的次數和s為n - b[0]或n-b[0]-1。其中1出現的次數至少為1(由c得)。又如果1出現的次數為1,則1出現的次數已經為2,故1出現的次數必大于1.設為x,則x出現的次數至少為1,而x>1,如果x出現的次數大于1,那么必須要有其他數出現的次數為x,這樣無法收斂。故x出現的次數只能為1,1出現的次數只能為2.
另外:(感謝coolria提出)如果上排數列中無0,則下排數列全是0,是其唯一解。
結論:
1)如果上排數列中有0,此時如果上排數列中無0,1,2,n-4這四個數,則下排數列無解;否則下排數列中0出現的次數為n-4;1出現的次數為2;2出現的次數為1;n-4出現的次數為1;其余為0。
2)如果上排數列中無0,則下排數列全0,是其唯一解。
11.給40億個不重復的unsigned int的整數,沒排過序的,然后再給幾個數,如何快速判斷這幾個數是否在那40億個數當中?
分析及答案:
unsigned int 的取值范圍是0到2^32-1。我們可以申請連續的2^32/8=512M的內存,用每一個bit對應一個unsigned int數字。首先將512M內存都初始化為0,然后每處理一個數字就將其對應的bit設置為1。當需要查詢時,直接找到對應bit,看其值是0還是1即可。
相關文章:
