機器之心開放中英詞彙庫:期待與讀者的共同進步

機器之心發表於2017-07-10

作為最早關注人工智慧技術的媒體,機器之心在編譯國外技術部落格、論文、專家觀點等內容上已經積累了超過兩年多的經驗。期間,從無到有,機器之心的編譯團隊一直在積累專業詞彙。雖然有很多的文章因為專業性我們沒能盡善盡美的編譯為中文呈現給大家,但我們一直在進步、一直在積累、一直在提高自己的專業性。

兩年來,機器之心編譯團隊整理過翻譯詞彙對照表「紅寶書」,編輯個人也整理過類似的詞典。而我們也從機器之心讀者留言中發現,有些人工智慧專業詞彙沒有統一的翻譯標準,這可能是因地區、跨專業等等原因造成的。舉個例子,DeepMind 的一篇論文中有個詞彙為 differentiable boundary tree,當時機器之心的翻譯為可微分界樹,但後來有讀者表示這樣的譯法如果不保留英文很難明白表達的意思且建議翻譯為可微分邊界樹。

因此,我們想把機器之心內部積累的人工智慧專業詞彙中英對照表開放給大家,希望為大家寫論文、中文部落格、閱讀文章提供幫助。同時,這也是一份開放的表單,希望越來越多的人能夠提供增添、修改建議,為人工智慧的傳播助力。

專案地址:https://github.com/jiqizhixin/Artificial-Intelligence-Terminology

組織形式

機器之心開放中英詞彙庫:期待與讀者的共同進步

讀者在此專案中,可透過以上表盤檢視自己想要了解的專業詞彙。在單個首字母中,表格的組織形式為:英文/縮寫、漢語、來源&擴充套件。

來源&擴充套件是對該詞彙的註解,內容為機器之心往期的相關文章。例如下圖所示的「演算法」,我們關聯到的三篇文章是《迴歸、分類與聚類:三大方向剖解機器學習演算法的優缺點》和《機器學習演算法附速查表》和《深度學習演算法全景圖:從理論證明其正確性》。因此,我們希望不僅能提供相對應的術語,同時還希望能為讀者提供每一個術語的來源和概念上的擴充套件。但由於這一部分工作量較大,我們還將與讀者共同推進這一部分擴充套件的程式。

機器之心開放中英詞彙庫:期待與讀者的共同進步

準確度

本專案中所有英文專業詞彙對照的中文都來自機器之心編譯的文章和系列機器學習教科書(如周志華的《機器學習》和李航的《統計學習方法》等),我們力求在提供準確翻譯的同時保留最常用的形式。同時,為了保證詞彙翻譯的準確性,我們將此專案向讀者開源,並希望能與讀者共同迭代術語的準確度。除此之外,我們還將為每一個詞彙提供來源與擴充套件進一步提升詞彙的置信度。

機器之心術語編譯標準

因為該專案很多術語都是機器之心平常編譯文章所積累的,所以我們首先需要向讀者說明機器之心術語編譯的標準。

1. 常見術語的編譯標準

機器之心常見術語的編譯首先會確保術語的正確性,其次再考慮術語的傳播廣度。例如常見術語。logistic regression,首先機器之心會保證該術語的準確度。我們常見 logistic regression 會翻譯為邏輯迴歸,但中文「邏輯」與 logistic 的含義還是有些差別,因此我們並不太傾向於採用這種譯法。在準確度的基礎上,我們會考慮術語的傳播廣度。例如有學者建議可以將 logistic regression 譯為對數機率迴歸,但鑑於該譯法的傳播度不廣,看到中文並不會馬上檢索到對應英文和概念,所以我們最終在常見術語編譯標準下將 logistic regression 譯為 logistical 迴歸。機器之心在對常見術語編譯時並不會保留英文,也不會做進一步說明。

2. 非常見術語的編譯標準

機器之心在編譯技術文章或論文時,常常會遇到非常見的術語。因為像論文那樣的文章是在特定領域下為解決特定問題而規範化書寫的,所以就會存在較多的非常見的術語。而機器之心在編譯非常見術語時,唯一的標準就是準確性,通常我們也會保留英文。因為非常見術語通常是數學、神經科學和物理學等領域上的專業術語,機器之心會盡可能地借鑑其他領域內的譯法和意義而確定如何編譯。例如 fixed-point theorem,在參考數學的情況下,我們會更傾向於譯為不動點定理,fixed-point 譯為不動點而不是定點。

3. 歧義術語的編譯標準

還有很多術語其實是有歧義的,而對於這一類詞,機器之心的編譯標準會根據語義進行確定,因此也會有一些誤差。例如 bias 在描述神經網路層級單元時可以譯為偏置項。而在描述訓練誤差和與叉驗證誤差間的關係或學習曲線時,bias 可以譯為偏差。這樣的例子還有很多,比如 Stationary 在馬爾可夫模型中可譯為穩態分佈(Stationary distribution),在最最佳化問題中可譯為駐點(Stationary point),而在涉及博弈論或對抗性訓練時,其又可能表達為靜態。

以上是機器之心大概編譯術語的標準,雖然我們在常用術語的編譯上錯誤率相對較少,但在非常見術語和歧義術語上仍然會出現一些錯誤。尤其是在非常見術語的編譯上,沒有特定的背景知識很容易在編譯上出現誤差。因此我們希望能與讀者共同加強術語的編譯質量。

詞彙更新

本詞彙庫目前擁有的專業詞彙共計 500 個,主要為機器學習基礎概念和術語,同時也是該專案的基本詞彙。機器之心將繼續完善術語的收錄和擴充套件閱讀的構建。詞彙更新主要分為兩個階段,第一階段機器之心將繼續完善基礎詞彙的構建,即透過權威教科書或其它有公信力的資料抽取常見術語。第二階段機器之心將持續性地把編譯論文或其他資料所出現的非常見術語更新到詞彙表中。

讀者的反饋意見和更新建議將貫穿整個階段,並且我們將在專案致謝頁中展示對該專案起積極作用的讀者。因為我們希望術語的更新更具準確度和置信度,所以我們希望讀者能附上該術語的來源地址與擴充套件地址。因此,我們能更客觀地更新詞彙,並附上可信的來源與擴充套件。

Letter A:

Accumulated error backpropagation累積誤差逆傳播
Activation Function啟用函式
Adaptive Resonance Theory/ART自適應諧振理論
Addictive model加性學習
Adversarial Networks對抗網路
Affine Layer仿射層
Affinity matrix親和矩陣
Agent代理 / 智慧體
Algorithm演算法
Alpha-beta pruningα-β剪枝
Anomaly detection異常檢測
Approximation近似
Area Under ROC Curve/AUCRoc 曲線下面積
Artificial General Intelligence/AGI通用人工智慧
Artificial Intelligence/AI人工智慧
Association analysis關聯分析
Attention mechanism注意力機制
Attribute conditional independence assumption 屬性條件獨立性假設
Attribute space屬性空間
Attribute value屬性值
Autoencoder自編碼器
Automatic speech recognition自動語音識別
Automatic summarization自動摘要
Average gradient平均梯度
Average-Pooling平均池化

Letter B:

Backpropagation Through Time透過時間的反向傳播
Backpropagation/BP反向傳播
Base learner基學習器
Base learning algorithm基學習演算法
Batch Normalization/BN批次歸一化
Bayes decision rule 貝葉斯判定準則
Bayes Model Averaging/BMA貝葉斯模型平均
Bayes optimal classifier貝葉斯最優分類器
Bayesian decision theory貝葉斯決策論
Bayesian network貝葉斯網路
Between-class scatter matrix類間散度矩陣
Bias偏置 / 偏差
Bias-variance decomposition偏差-方差分解
Bias-Variance Dilemma偏差 - 方差困境
Bi-directional Long-Short Term Memory/Bi-LSTM雙向長短期記憶
Binary classification二分類
Binomial test二項檢驗
Bi-partition二分法
Boltzmann machine玻爾茲曼機
Bootstrap sampling自助取樣法/可重複取樣/有放回取樣
Bootstrapping自助法
Break-Event Point/BEP平衡點

Letter C:

Calibration校準
Cascade-Correlation級聯相關
Categorical attribute離散屬性
Class-conditional probability類條件機率
Classification and regression tree/CART分類與迴歸樹
Classifier分類器
Class-imbalance類別不平衡
Closed -form閉式
Cluster簇/類/叢集
Cluster analysis聚類分析
Clustering聚類
Clustering ensemble聚類整合
Co-adapting共適應
Coding matrix編碼矩陣
COLT國際學習理論會議
Committee-based learning基於委員會的學習
Competitive learning競爭型學習
Component learner元件學習器
Comprehensibility可解釋性
Computation Cost計算成本
Computational Linguistics計算語言學
Computer vision計算機視覺
Concept drift概念漂移
Concept Learning System /CLS概念學習系統
Conditional entropy條件熵
Conditional mutual information條件互資訊
Conditional Probability Table/CPT條件機率表
Conditional random field/CRF條件隨機場
Conditional risk 條件風險
Confidence置信度
Confusion matrix混淆矩陣
Connection weight連線權
Connectionism連結主義
Consistency一致性/相合性
Contingency table列聯表
Continuous attribute連續屬性
Convergence收斂
Conversational agent會話智慧體
Convex quadratic programming 凸二次規劃
Convexity凸性
Convolutional neural network/CNN卷積神經網路
Co-occurrence同現
Correlation coefficient相關係數
Cosine similarity餘弦相似度
Cost curve成本曲線
Cost Function成本函式
Cost matrix成本矩陣
Cost-sensitive成本敏感
Cross entropy交叉熵
Cross validation交叉驗證
Crowdsourcing眾包
Curse of dimensionality維數災難
Cut point截斷點
Cutting plane algorithm 割平面法


Letter D:

Data mining資料探勘
Data set資料集
Decision Boundary決策邊界
Decision stump決策樹樁
Decision tree決策樹/判定樹
Deduction演繹
Deep Belief Network深度信念網路
Deep Convolutional Generative Adversarial Network/DCGAN深度卷積生成對抗網路
Deep learning深度學習
Deep neural network/DNN深度神經網路
Deep Q-Learning深度 Q 學習
Deep Q-Network深度 Q 網路
Density estimation 密度估計
Density-based clustering密度聚類
Differentiable neural computer可微分神經計算機
Dimensionality reduction algorithm降維演算法
Directed edge有向邊
Disagreement measure不合度量
Discriminative model判別模型
Discriminator判別器
Distance measure距離度量
Distance metric learning距離度量學習
Distribution分佈
Divergence散度
Diversity measure多樣性度量/差異性度量
Domain adaption領域自適應
Downsampling下采樣
D-separation (Directed separation)有向分離
Dual problem 對偶問題
Dummy node啞結點
Dynamic Fusion動態融合
Dynamic programming動態規劃

Letter E:

Eigenvalue decomposition特徵值分解
Embedding嵌入
Emotional analysis情緒分析
Empirical conditional entropy經驗條件熵
Empirical entropy經驗熵
Empirical error經驗誤差
Empirical risk經驗風險
End-to-End端到端
Energy-based model基於能量的模型
Ensemble learning整合學習
Ensemble pruning整合修剪
Error Correcting Output Codes/ECOC糾錯輸出碼
Error rate錯誤率
Error-ambiguity decomposition誤差-分歧分解
Euclidean distance歐氏距離
Evolutionary computation 演化計算
Expectation-Maximization期望最大化
Expected loss 期望損失
Exploding Gradient Problem梯度爆炸問題
Exponential loss function 指數損失函式
Extreme Learning Machine/ELM超限學習機

Letter F:

Factorization因子分解
False negative假負類
False positive假正類
False Positive Rate/FPR假正例率
Feature engineering特徵工程
Feature selection特徵選擇
Feature vector特徵向量
Featured Learning特徵學習
Feedforward Neural Networks/FNN前饋神經網路
Fine-tuning微調
Flipping output翻轉法
Fluctuation震盪
Forward stagewise algorithm前向分步演算法
Frequentist頻率主義學派
Full-rank matrix滿秩矩陣
Functional neuron功能神經元

Letter G:

Gain ratio增益率
Game theory博弈論
Gaussian kernel function高斯核函式
Gaussian Mixture Model高斯混合模型
General Problem Solving通用問題求解
Generalization泛化
Generalization error泛化誤差
Generalization error bound泛化誤差上界
Generalized Lagrange function廣義拉格朗日函式
Generalized linear model廣義線性模型
Generalized Rayleigh quotient廣義瑞利商
Generative Adversarial Networks/GAN生成對抗網路
Generative Model生成模型
Generator生成器
Genetic Algorithm/GA遺傳演算法
Gibbs sampling吉布斯取樣
Gini index基尼指數
Global minimum全域性最小
Global Optimization全域性最佳化
Gradient boosting梯度提升
Gradient Descent梯度下降
Graph theory圖論
Ground-truth真相/真實

Letter H:

Hard margin 硬間隔
Hard voting硬投票
Harmonic mean調和平均
Hesse matrix海塞矩陣
Hidden dynamic model隱動態模型
Hidden layer隱藏層
Hidden Markov Model/HMM隱馬爾可夫模型
Hierarchical clustering層次聚類
Hilbert space希爾伯特空間
Hinge loss function合頁損失函式
Hold-out留出法
Homogeneous同質
Hybrid computing混合計算
Hyperparameter超引數
Hypothesis假設
Hypothesis test假設驗證

Letter I:

ICML國際機器學習會議
Improved iterative scaling/IIS改進的迭代尺度法
Incremental learning增量學習
Independent and identically distributed/i.i.d.獨立同分布
Independent Component Analysis/ICA獨立成分分析
Indicator function指示函式
Individual learner個體學習器
Induction歸納
Inductive bias歸納偏好
Inductive learning歸納學習
Inductive Logic Programming/ILP歸納邏輯程式設計
Information entropy資訊熵
Information gain資訊增益
Input layer輸入層
Insensitive loss不敏感損失
Inter-cluster similarity 簇間相似度
International Conference for Machine Learning/ICML國際機器學習大會
Intra-cluster similarity簇內相似度
Intrinsic value固有值
Isometric Mapping/Isomap等度量對映
Isotonic regression等分迴歸
Iterative Dichotomiser迭代二分器

Letter K:

Kernel method核方法
Kernel trick核技巧
Kernelized Linear Discriminant Analysis/KLDA 核線性判別分析
K-fold cross validationk 折交叉驗證/k 倍交叉驗證
K-Means ClusteringK - 均值聚類
K-Nearest Neighbours Algorithm/KNNK近鄰演算法
Knowledge base知識庫
Knowledge Representation知識表徵

Letter L:

Label space標記空間
Lagrange duality拉格朗日對偶性
Lagrange multiplier拉格朗日乘子
Laplace smoothing拉普拉斯平滑
Laplacian correction拉普拉斯修正
Latent Dirichlet Allocation隱狄利克雷分佈
Latent semantic analysis潛在語義分析
Latent variable隱變數
Lazy learning 懶惰學習
Learner學習器
Learning by analogy類比學習
Learning rate學習率
Learning Vector Quantization/LVQ學習向量量化
Least squares regression tree最小二乘迴歸樹
Leave-One-Out/LOO留一法
linear chain conditional random field線性鏈條件隨機場
Linear Discriminant Analysis/LDA線性判別分析
Linear model線性模型
Linear Regression線性迴歸
Link function聯絡函式
Local Markov property區域性馬爾可夫性
Local minimum區域性最小
Log likelihood對數似然
Log odds/logit對數機率
Logistic RegressionLogistic 迴歸
Log-likelihood對數似然
Log-linear regression對數線性迴歸
Long-Short Term Memory/LSTM長短期記憶
Loss function損失函式

Letter M:

Machine translation/MT機器翻譯
Macron-P宏查準率
Macron-R宏查全率
Majority voting絕對多數投票法
Manifold assumption流形假設
Manifold learning流形學習
Margin theory間隔理論
Marginal distribution邊際分佈
Marginal independence 邊際獨立性
Marginalization 邊際化
Markov Chain Monte Carlo/MCMC馬爾可夫鏈蒙特卡羅方法
Markov Random Field馬爾可夫隨機場
Maximal clique最大團
Maximum Likelihood Estimation/MLE極大似然估計/極大似然法
Maximum margin最大間隔
Maximum weighted spanning tree最大帶權生成樹
Max-Pooling最大池化
Mean squared error均方誤差
Meta-learner元學習器
Metric learning度量學習
Micro-P微查準率
Micro-R微查全率
Minimal Description Length/MDL最小描述長度
Minimax game極小極大博弈
Misclassification cost誤分類成本
Mixture of experts混合專家
Momentum動量
Moral graph道德圖/端正圖
Multi-class classification多分類
Multi-document summarization多文件摘要
Multi-layer feedforward neural networks多層前饋神經網路
Multilayer Perceptron/MLP多層感知器
Multimodal learning多模態學習
Multiple Dimensional Scaling多維縮放
Multiple linear regression多元線性迴歸
Multi-response Linear Regression /MLR多響應線性迴歸
Mutual information互資訊

Letter N:

Naive bayes 樸素貝葉斯
Naive Bayes Classifier樸素貝葉斯分類器
Named entity recognition命名實體識別
Nash equilibrium納什均衡
Natural language generation/NLG自然語言生成
Natural language processing自然語言處理
Negative class負類
Negative correlation負相關法
Negative Log Likelihood負對數似然
Neighbourhood Component Analysis/NCA近鄰成分分析
Neural Machine Translation神經機器翻譯
Neural Turing Machine神經圖靈機
Newton method牛頓法
NIPS國際神經資訊處理系統會議
No Free Lunch Theorem/NFL沒有免費的午餐定理
Noise-contrastive estimation噪音對比估計
Nominal attribute列名屬性
Non-convex optimization非凸最佳化
Nonlinear model非線性模型
Non-metric distance非度量距離
Non-negative matrix factorization非負矩陣分解
Non-ordinal attribute 無序屬性
Non-Saturating Game非飽和博弈
Norm範數
Normalization歸一化
Nuclear norm核範數
Numerical attribute數值屬性

Letter O:

Objective function目標函式
Oblique decision tree斜決策樹
Occam's razor奧卡姆剃刀
Odds機率
Off-Policy離策略
One shot learning一次性學習
One-Dependent Estimator/ODE獨依賴估計
On-Policy在策略
Ordinal attribute有序屬性
Out-of-bag estimate包外估計
Output layer輸出層
Output smearing輸出調製法
Overfitting過擬合/過配
Oversampling過取樣

Letter P:

Paired t-test成對 t 檢驗
Pairwise成對型
Pairwise Markov property成對馬爾可夫性
Parameter引數
Parameter estimation引數估計
Parameter tuning調參
Parse tree解析樹
Particle Swarm Optimization/PSO粒子群最佳化演算法
Part-of-speech tagging詞性標註
Perceptron感知機
Performance measure效能度量
Plug and Play Generative Network即插即用生成網路
Plurality voting相對多數投票法
Polarity detection極性檢測
Polynomial kernel function多項式核函式
Pooling池化
Positive class正類
Positive definite matrix正定矩陣
Post-hoc test後續檢驗
Post-pruning後剪枝
potential function勢函式
Precision查準率/準確率
Prepruning預剪枝
Principal component analysis/PCA主成分分析
Principle of multiple explanations多釋原則
Prior先驗
Probability Graphical Model機率圖模型
Proximal Gradient Descent/PGD近端梯度下降
Pruning剪枝
Pseudo-label偽標記

Letter Q:

Quantized Neural Network量子化神經網路
Quantum computer量子計算機
Quantum Computing量子計算
Quasi Newton method擬牛頓法

Letter R:

Radial Basis Function/RBF徑向基函式
Random Forest Algorithm隨機森林演算法
Random walk隨機漫步
Recall查全率/召回率
Receiver Operating Characteristic/ROC受試者工作特徵
Rectified Linear Unit/ReLU線性修正單元
Recurrent Neural Network迴圈神經網路
Recursive neural network遞迴神經網路
Reference model 參考模型
Regression迴歸
Regularization正則化
Reinforcement learning/RL強化學習
Representation learning表徵學習
Representer theorem表示定理
reproducing kernel Hilbert space/RKHS再生核希爾伯特空間
Re-sampling重取樣法
Rescaling再縮放
Residual Mapping殘差對映
Residual Network殘差網路
Restricted Boltzmann Machine/RBM受限玻爾茲曼機
Restricted Isometry Property/RIP限定等距性
Re-weighting重賦權法
Robustness穩健性/魯棒性
Root node根結點
Rule Engine規則引擎
Rule learning規則學習

Letter S:

Saddle point鞍點
Sample space樣本空間
Sampling取樣
Score function 評分函式
Self-Driving自動駕駛
Self-Organizing Map/SOM自組織對映
Semi-naive Bayes classifiers 半樸素貝葉斯分類器
Semi-Supervised Learning半監督學習
semi-Supervised Support Vector Machine半監督支援向量機
Sentiment analysis情感分析
Separating hyperplane分離超平面
Sigmoid functionSigmoid 函式
Similarity measure相似度度量
Simulated annealing模擬退火
Simultaneous localization and mapping同步定位與地圖構建
Singular Value Decomposition奇異值分解
Slack variables鬆弛變數
Smoothing平滑
Soft margin 軟間隔
Soft margin maximization軟間隔最大化
Soft voting軟投票
Sparse representation稀疏表徵
Sparsity稀疏性
Specialization特化
Spectral Clustering譜聚類
Speech Recognition語音識別
Splitting variable切分變數
Squashing function擠壓函式
Stability-plasticity dilemma可塑性-穩定性困境
Statistical learning統計學習
Status feature function狀態特徵函
Stochastic gradient descent隨機梯度下降
Stratified sampling分層取樣
Structural risk結構風險
Structural risk minimization/SRM結構風險最小化
Subspace子空間
Supervised learning監督學習/有導師學習
support vector expansion 支援向量展式
Support Vector Machine/SVM支援向量機
Surrogat loss替代損失
Surrogate function替代函式
Symbolic learning符號學習
Symbolism符號主義
Synset同義詞集

Letter T:

T-Distribution Stochastic Neighbour Embedding/t-SNET - 分佈隨機近鄰嵌入
Tensor張量
Tensor Processing Units/TPU張量處理單元
The least square method最小二乘法
Threshold閾值
Threshold logic unit閾值邏輯單元
Threshold-moving閾值移動
Time Step時間步驟
Tokenization標記化
Training error訓練誤差
Training instance訓練示例/訓練例
Transductive learning直推學習
Transfer learning遷移學習
Treebank樹庫
Tria-by-error試錯法
True negative真負類
True positive真正類
True Positive Rate/TPR真正例率
Turing Machine圖靈機
Twice-learning 二次學習

Letter U:

Underfitting欠擬合/欠配
Undersampling欠取樣
Understandability可理解性
Unequal cost非均等代價
Unit-step function單位階躍函式
Univariate decision tree單變數決策樹
Unsupervised learning無監督學習/無導師學習
Unsupervised layer-wise training無監督逐層訓練
Upsampling上取樣

Letter V:

Vanishing Gradient Problem梯度消失問題
Variational inference變分推斷
VC TheoryVC維理論
Version space版本空間
Viterbi algorithm維特比演算法
Von Neumann architecture馮 · 諾伊曼架構

Letter W:

Wasserstein GAN/WGANWasserstein生成對抗網路
Weak learner弱學習器
Weight權重
Weight sharing權共享
Weighted voting加權投票法
Within-class scatter matrix類內散度矩陣
Word embedding詞嵌入
Word sense disambiguation詞義消歧

Letter Z:

Zero-data learning零資料學習
Zero-shot learning零次學習

相關文章