騰訊筆試題
剛剛完成了騰訊的2017年騰訊基礎研究筆試題,談一下感受。
考題分為選擇題(26/60分鐘)和簡答題(3/60分鐘),選擇題很基礎,儘管我基本上不會,但如果按照考研的那個水平,那是完全不用擔心的,不知道以前的高數都還給誰了,內容很基礎的,其中涉及到:
選擇題:
1) 概率計算問題:期望、方差、協方差、計算概率問題等
2)矩陣:矩陣計算、特徵值計算、秩,線代第二章看看基本上沒問題了
3)高數:定積分和不定積分計算、求偏導
4)資料結構:時間複雜度,排序
5)統計:分層抽樣
6)資料庫:基本命令考察
簡答題:
1)原假設和備擇假設問題
2)神經網路優缺點
3)藝人生活行為的挖掘問題
大公司一般筆試會很注重基礎重基礎重基礎,因為騰訊不讓公開筆試題,所有,列個考點。
校招前好好備戰,加油,讓自己的努力跟的上一線城市的房價。
- 應聘職位:基礎研究
- 崗位描述:探索和創新前沿網際網路技術,將高新技術轉化為產品,參與騰訊產品的開發與技術實現
- 崗位要求:2016年畢業,自然語言處理、多媒體、分散式網路、資料分析、智慧計算、安全等網際網路相關技術具有較深研究和專業積累,具有較好的創新能力和程式設計開發能力,具備較強的團隊合作力
選擇題
-
第1題 求定積分結果 ∫101dx
答案:1 -
第2題 已知總標準差=25,隨著樣本增加均值怎麼變化。
-
第3題 已知K是第四名,A的年齡不是最大但比D老,D不是第二名,年齡第2小的是第二名,第三名的年齡大於第一名,B比第三名年輕,求A、B、D和K的排名順序。
答案:D>B>A>K -
第4題 y=sin(x)+cos(x)的極大值
答案: 2√ -
第5題 max={Cx | Ax<=b, x>=0}為最優解,z>=0,當C、b被v和v/2乘時一下結果正確的是…
-
第6題 u檢驗的應用條件是:兩樣本來源得總體符合正太分佈…
-
第7題 設某商品需求滿足: yi=β0+β1∗xi+εi ,引數估計量…
-
第8題 齊次線性方程組Ax=0存在無窮解,其行列式m行、n列實數矩陣,則滿足:
A.m > n B.m < n C.rank(A) = m D.rank(A) = n -
第9題 已知x0=(1,1),求 f(x)=4∗x1+6∗x2−2∗x12−2∗x1∗x2−2∗x22 極大值。x1座標為:
A.(1,1) B.(-1,1) C.(-1/2,1) D.(1/2,1) -
第10題 相同樣本量下,重複抽樣與不重複抽樣平均誤差大小關係是:相同、重複抽樣大、不重複抽樣大選項
-
第11題 n階矩陣A行列式 |A|=1 ,則 |A−1|=?
-
第12題 一對夫婦兩孩子,已知一個是男孩,求兩個都是男孩的概率。猜測答案是0.5
-
第13題 x1,x2,x3...xn 來自 (μ,σ2) 一個樣本, x¯ 為均值, S2 為方差。其中答案包括: S2/σ2∼x(n−1)
-
第14題 隨機變數x概率分佈:x=2 f(x)=0.2、x=4 f(x)=0.3 、x=7 f(x)=0.4 、x=8 f(x)=0.1,x的標準差是。
-
第15題 一盒裝有6個乒乓球,4個位新球,第一次隨機取2個,使用後放回盒子;第二次隨機取2個,求第二次取全新的概率。
-
第16題 商品銷售量、方差分析,excel表分析顏色特徵對結果的影響。
-
第17題 k1、k2是矩陣A兩個不同特徵值,a與b是A分別屬於k1、k2的特徵向量,則a、b滿足,選項包括線性無關、線性相關等。
-
第18題 青蛙掉入21米井裡,每天向上爬10米,晚上再掉下7米,問幾天爬出。
答案:5天 -
第19題 人工批量盆景虎皮蘭,平均高度70cm,標準差5cm,隨機搬出100盤,則說法正確的是:選項包括至少75盆以上在70-80cm之間等。
-
第20題 行列式的值是多少:
∣∣∣∣a22a1aba+b1b22b1∣∣∣∣ -
第21題 資料庫系統描述錯誤的是:
A.DBMS是資料庫管理系統簡稱
B.Hive是開源的資料庫系統
C.資料庫事務有ACID屬性
D.SQL中create屬於DML語言
答案:D
分析:終於看到第一道與程式設計、OS、DB相關的題目了,淚流滿面啊!故簡單講解下:DBMS就是資料庫管理系統(Database Management System),事務包括ACID性質(原子性Atomicity、一致性Consistency、隔離性Isolation、永續性Durability),Hive是屬於Hadoop的資料倉儲工具。而create屬於DDL(資料庫模式定義語言),Insert、delete、update屬於DML(資料庫操縱語言)、Select屬於DQL(資料庫查詢語言)、grant屬於DCL(資料庫控制語言)。 -
第22題 甲乙兩人比射箭,水平一樣。甲射101箭,乙射100箭,求甲射中次數比乙射中次數多的概率。
-
第23題 一個對陣列A(n個元陣列)排序,程式碼如下:
- 1
- 2
- 3
- 4
- 5
求程式碼的時間複雜度: O(n2)
-
第24題 mysql中選課表learn(stu_id int, course_id int ),其中學生id和課程id,則獲取每個學生所選課程個數的語句是:
A.select stu_id, count(course_id) from learn;
B.select stu_id, sum(course_id) from learn;
C.select stu_id, count(course_id) from learn group by student_id;
D.select stu_id, sum(course_id) from learn group by student_id;
分析:count計數和sum求和的區別,group by分組 -
第25題 兩家工廠A和B,技術相同,合格率一樣平均80%,A大規模工廠,B小規模工廠,沒有出現故障某家企業合格率僅為70%,問哪家工廠的可能性更大?
問答題
第一題
進行特徵選擇時,即分析哪些協變數對目標變數有較大影響時,有哪些常用的方法?你本人更看好其中哪些?為什麼?
第二題
網路上流傳一個故事,關於資料的神奇性:某商場向一位未婚少女郵寄一些用於保胎的商品目標和折扣券,其父親發火,後證實該少女確實懷孕,解釋一下如何做到的?
個人從一下幾個方面答的,可能存在錯誤或不足之處:
1.搜尋引擎與推薦系統及演算法
2.資料探勘相關的關聯規則挖掘演算法,經典尿布與啤酒
3.知識圖譜 問答系統實現理解人類語言(畢設相關)
第三題
QQ空間相簿替換牆換一換功能。把聚類好的人臉進行圈人標註,系統根據使用者歷史標註記錄,分析每張照片最可能身份,使用者進行確認和否認。每次只從聚類人臉中抽取5張進行展示。假設利用資訊是每個人臉的相似度矩陣G,而且第k+1次抽樣並不知道第k次抽出的樣本,可用人臉數量N始終大於50張。
(1) 如何設計抽樣演算法,抽樣碰撞率儘可能低;
(2) 如果抽樣完成後,抽出5張人臉從中刪除,如何設計抽樣演算法,使得相鄰兩次間抽樣碰撞率儘可能低?
總結
面試了阿里和騰訊的NLP和資料探勘相關的演算法方向,個人感覺騰訊的題目偏重數學統計概率,其中選擇題就3道與程式和資料庫相關,而且比較簡單,更多的是數學知識;而三個大題感覺還是不錯的,很貼近生活和騰訊的實際產品,讓我也學到很多知識。但是阿里的題目都至少偏向演算法點,自己需要學習的東西還是非常多,也認識到了自己很多不足之處!接下來繼續努力吧。
作者:offer快來吧給跪了還不行嗎
連結:https://www.nowcoder.com/discuss/25919?type=0&order=0&pos=8&page=1
來源:牛客網
作者:牛客470556號
連結:https://www.nowcoder.com/discuss/5098
來源:牛客網
1. 數學問題:3sigma原理,T分佈,特徵根,特徵值,最大似然估計,馬爾科夫鏈。
(1)3sigma原理
在正態分佈中σ代表標準差,μ代表均值x=μ即為影像的對稱軸,三σ原則即為:
數值分佈在(μ—σ,μ+σ)中的概率為0.6526
數值分佈在(μ—2σ,μ+2σ)中的概率為0.9544
數值分佈在(μ—3σ,μ+3σ)中的概率為0.9974
工程中,當質量特性呈正態分佈時(實際上,當樣本足夠大時,二項分佈、泊松分佈等均趨近於正態分佈),3Sigma水平代表了99.73%的合格率(2700PPM);
(2)t-分佈
在概率論和統計學中,學生t-分佈(Student's t-distribution),可簡稱為t分佈。應用在估計呈正態分佈的母群體之平均數。它是對兩個樣本均值差異進行顯著性測試的學生t檢定的基礎。學生t檢定改進了Z檢定(Z-test),因為Z檢定以母體標準差已知為前提。雖然在樣本數量大(超過30個)時,可以應用Z檢定來求得近似值,但Z檢定用在小樣本會產生很大的誤差,因此必須改用學生t檢定以求準確。
t-檢驗近似於Z檢驗,通俗地說,是樣本量小於45時用於減小誤差的改進Z檢驗。改進原理就是拋棄母體標準差,而直接用樣本點構造分佈。
(3)特徵根、特徵值、特徵向量、特徵空間
設 A 是n階方陣,如果存在數m和非零n維列向量 x,使得 Ax=λx 成立,則稱 m 是A的一個特徵值(characteristic value)或本徵值(eigenvalue)。
非零n維列向量x稱為矩陣A的屬於(對應於)特徵值m的特徵向量或本徵向量,簡稱A的特徵向量。
特徵根對應特徵方程,是( A-λE)X=0的解。特徵值對應矩陣及特徵向量,是矩陣的屬性。
λ是A的一個特徵值,則一定是特徵方程的根, 因此又稱特徵根。
特徵空間:就是由所有有著相同特徵值的特徵向量組成的空間,還包括零向量,但要注意零向量本身不是特徵向量。
應用非常廣泛:
影像處理中的PCA方法,選取特徵值最高的k個特徵向量來表示一個矩陣,從而達到降維分析+特徵顯示的方法。
還有影像壓縮的K-L變換,以及很多人臉識別、資料流模式挖掘分析等方面。
在力學中,慣量的特徵向量定義了剛體的主軸。慣量是決定剛體圍繞質心轉動的關鍵資料。
在譜系圖論中,一個圖的特徵值定義為圖的鄰接矩陣A的特徵值,或者(更多的是)圖的拉普拉斯運算元矩陣, Google的PageRank演算法就是一個例子。
曾經有這麼一句話:「有振動的地方就有特徵值和特徵向量」
只要你真正理解了線性空間的矩陣的意義,你就明白了,幾乎無處不在。
網上還有一種更好理解的說法:
如果你把A*x=λ*x中的A看做一種變換或作用,那麼那些在這種作用下,只改變長短不改變方向的那些向量x就是特徵向量;而特徵值就是λ,是伸縮係數,起能量增幅或者削減作用。
具體的說,求特徵向量的關係,就是把矩陣A所代表的空間,進行正交分解,使得A的向量集合可以表示為每個向量a在各個特徵向量上面的投影長度。
(4)極大似然估計
這一方法是基於這樣的思想:我們所估計的模型引數,要使得產生這些給定樣本的可能性最大。即:
找到最佳的模型引數,使得模型實現對樣本的最大程度擬合,也就使樣本集出現的可能性最大,從而用樣本估計總體。。
舉個例子:一個隨機試驗如有若干個可能的結果A,B,C,…。若在僅僅作一次試驗中,結果A出現,則一般認為試驗條件對A出現有利,也即A出現的概率很大。一般地,事件A發生的概率與引數theta相關,A發生的概率記為P(A,theta),則theta的估計應該使上述概率達到最大,這樣的theta顧名思義稱為極大似然估計。
求極大似然函式估計值的一般步驟:(1) 寫出似然函式;(2) 對似然函式取對數,並整理;(3) 求導數 ;(4) 解似然方程 。
應用舉例:在機器學習的異常檢測中,根據模型(通過學習得來的)計算一個資料點出現的概率,如果這個概率小於某個我們事先設定的值,就把它判為異常。我們基於的是一個小事件的思想:如果一件可能性極小的事情竟然發生了,那麼就極有可能是異常。舉個例子,我這輩子跟奧巴馬成為哥們的可能性幾乎為零,如果哪一天我跟奧巴馬在燒烤攤喝3塊錢一瓶的啤酒,那麼絕對叫異常。
(5)馬爾科夫鏈
基本思路:指數學中具有馬爾可夫性質的離散事件隨機過程。該過程中,在給定當前知識或資訊的情況下,過去狀態對於預測將來的狀態是無作用的。
馬爾科夫性質的方程(條件概率方程)
應用:隱馬爾科夫模型,用於中文分詞。
相關文章
- 騰訊筆試題集筆試
- 騰訊筆試題--微信紅包筆試
- 騰訊往屆筆試面試題整理大全筆試面試題
- 騰訊9.6筆試筆試
- 騰訊PHP實習生筆試題目及答案解析PHP筆試
- 騰訊研發類筆試面試試題及答案(C++方向)筆試面試C++
- 2017騰訊Web前端實習生招聘筆試題總結Web前端筆試
- 騰訊社招筆面試題面試題
- 筆試題目——研發工程師筆試題筆試工程師
- java筆試題Java筆試
- shell 筆試題筆試
- SQL 筆試題SQL筆試
- 2019騰訊實習筆試題部分記錄+兩次電話面試筆記筆試面試筆記
- 測試筆試多選題筆試
- 軟體測試筆試題筆試
- php筆試題gtalentPHP筆試
- IT公司筆試題(四)筆試
- c++筆試題C++筆試
- SXF科技筆試題筆試
- linux筆試題Linux筆試
- DBA筆試題(轉)筆試
- DBA筆試試題-考試認證(zt)筆試
- 騰訊實習筆試題--簡單計算器程式的c語言實現筆試C語言
- HTML最新面試題(筆試面試題)HTML面試題筆試
- 前端筆試題面試題記錄前端筆試面試題
- 筆試題目——程式設計題筆試程式設計
- 華為秋招筆試題筆試
- JavaScript經典筆試題JavaScript筆試
- 3 .NET Core筆試題筆試
- Python 筆試 面試題Python筆試面試題
- Unity 筆試題目(一)Unity筆試
- 中興筆試選擇題筆試
- android筆試題整理Android筆試
- java基礎筆試題Java筆試
- 嵌入式筆試題筆試
- 幾道Java筆試題Java筆試
- 數學類筆試題筆試
- 測試筆試邏輯思維題筆試