攜程演算法筆試題知識點
判別式模型(Discriminative Model)是直接對條件概率p(y|x;θ)建模。常見的判別式模型有 線性迴歸模型、線性判別分析、支援向量機SVM、神經網路等。
生成式模型(Generative Model)則會對x和y的聯合分佈p(x,y)建模,然後通過貝葉斯公式來求得p(yi|x),然後選取使得p(yi|x)最大的yi,即:常見的生成式模型有 隱馬爾可夫模型HMM、樸素貝葉斯模型、高斯混合模型GMM、LDA等。
準確度並不適合於衡量不平衡類別問題
當資料有一個 0 均值向量時,PCA 有與 SVD 一樣的投射,否則在使用 SVD 之前,你必須將資料均值歸 0。
Stage 是spark 中一個非常重要的概念 ,
在一個job 中劃分stage 的一個重要依據是否有shuflle 發生 ,也就是是否會發生資料的重組 (重新組織資料)。
在一個stage 內部會有很多的task 被執行,在同一個stage 中 所有的task 結束後才能根據DAG 依賴執行下一個stage 中的task.
job 有很多工組成,每組任務可以任務是一個stage
Task 是spark 中另一個很重要的概念 ,
task 跟 partition block 等概念緊密相連 ,task 是執行job 的邏輯單元 ,在task 會在每個executor 中的cpu core 中執行
Job 是一個比task 和 stage 更大的邏輯概念,
job 可以認為是我們在driver 或是通過spark-submit 提交的程式中一個action ,在我們的程式中有很多action 所有也就對應很多的jobs
Batchsize就是每次把多少條資料輸入給神經網路
在r 維空間中,線性決策面的VC維為r+1。
機器學習中做特徵選擇時可能用到的方法有:卡方,資訊增益,平均互資訊,期望交叉熵
相關文章
- 筆試題知識點總結筆試
- 【筆試】計算機網路知識點整理筆試計算機網路
- 命題邏輯重要知識點筆記筆記
- C/C++字串筆試知識點及例項C++字串筆試
- numpy知識點筆記筆記
- 生物知識點筆記筆記
- 知識盲點 隨筆筆記筆記
- C++學習筆記,知識點+程式碼測試C++筆記
- 架構師課程學習筆記-第二週知識點架構筆記
- vueX基礎知識點筆記Vue筆記
- Redis知識點筆記總結Redis筆記
- Python小知識點隨筆Python
- C/C++【知識點筆記】C++筆記
- 物件與類_知識點筆記物件筆記
- 那些不能遺忘的知識點回顧——C/C++系列(筆試面試高頻題)C++筆試面試
- C/C++期末考試複習---知識點+習題C++
- CDAM知識點朗讀版-測試
- 考試寶典——軟體過程與管理重點知識總結_01
- React學習筆記知識點整理React筆記
- C++知識點隨筆(六):模板C++
- Java Web知識點--常用演算法(4)JavaWeb演算法
- Oracle 選擇題知識點整理Oracle
- 錯題知識點回顧1
- Redis知識點&面試題總結Redis面試題
- 筆試演算法題總結筆試演算法
- 藍橋杯知識點彙總:基礎知識和常用演算法演算法
- RHCE考試的一些知識點
- 知識點
- 最新Python筆試題2017 涵蓋知識面廣泛Python筆試
- Html標籤知識點學習筆記HTML筆記
- Kafka面試題——20道Kafka知識點Kafka面試題
- JavaScript的基礎知識點(面試題)JavaScript面試題
- 牛客網題目知識點收集
- 效能測試工具LoadRunner知識點總結
- Promise學習筆記(知識點 + 手寫Promise)Promise筆記
- 三、執行緒池知識點整理筆記執行緒筆記
- mysql--平日點滴知識隨筆(待續)MySql
- EXTJs學習筆記(知識點總結)JS筆記