AdaBoost模型是提升方法的代表,对于之后理解XGBoost等集成学习模型很有帮助。但是,在学习AdaBoost模型之前,请务必要先搞懂回归树(CART),因为当AdaBoost的基本分类器是回归树时,需要用到回归树。本篇博客将详细讲解AdaBoost模型的原理,并会讲解梯度提升树模型(GBDT),并采用python与scikit-learn对其进行实现。
统计学习方法|决策树模型原理详解与实现
决策树模型一种基本的分类与回归方法,是shallow learning的Adaboost、XGBoost、Light GBM、catBoost等树模型的基础,对于理解这些模型大有裨益。这篇博客将详细地讲解基本的决策树模型,主要会侧重回归树的讲解,因为这是Adaboost、XGBoost、Light GBM、catBoost等树模型的核心组成部分。并采用python与scikit-learn来对其进行实现。
统计学习方法|K近邻算法原理详解与实现
KNN算法是一种较为简单的分类算法(也可用于回归问题),其可以实现多分类问题。本篇博客将详细地讲解KNN算法,并采用python与scikit-learn库两种方式,对KNN算法进行实现。
统计学习方法|条件随机场模型原理详解与实现
条件随机场(CRF),属于判别模型,它在自然语言处理领域用途非常广泛。由于其涉及较多的概率图模型的知识,所以,这篇博客将首先介绍一下关于CRF模型的提出的原因,接着再介绍CRF模型需要解决的问题,并针对每个问题介绍其解决的算法,最后将使用python与sklearn库来对其进行实现。
统计学习方法|隐马尔可夫模型原理详解与实现
隐马尔可夫模型(HMM),是一个可用来解决标注问题的生成模型,在自然语言处理、语音识别等领域有着广泛的应用。本篇博客将详细地介绍HMM模型的三个问题与解决算法,包括:前向-后向算法、Baum-Welch算法以及大名鼎鼎的Viterbi算法。最后,并采用python以及hmmlearn库这两种方式,来对HMM模型进行实现。
统计学习方法|EM算法原理详解与实现
EM算法,中文名叫期望最大算法,主要用来求解含有隐变量的概率模型的参数。在高斯混合模型(GMM)、隐马尔可夫模型(HMM)中都有应用(在HMM模型中叫做Baum-Welch算法)。本篇博客将对EM算法的原理以及高斯混合模型(GMM)进行详细地讲解,并对其采用python与scikit-learn库这两种方式进行实现。
C++|滑动窗口专题
最近在整理之前刷过的leetcode题目,想写写一些常见的、典型的解题技巧或者方法。最开始刷题的时候,总觉得题目好难,其实刷多了题,也就那么回事😆。这篇博客主要想介绍一下滑动窗口方法(sliding window),对于解决字符串问题非常有用🤩~
统计学习方法|最大熵模型原理详解与实现
最大熵模型(MaxEntropy),是机器学习中一个非常重要的分类模型,其是最大熵思想应用到分类问题的结果。本篇博客将对最大熵模型的原理进行详细的讲解,并采用python实现对最大熵模型进行实现(scikit-learn库没有关于最大熵的类库)。此外,还会对比讲解其logistic回归的区别,并实现logistic回归模型(python与scikit-learn库)。
统计学习方法|朴素贝叶斯模型详解与实现
朴素贝叶斯模型(naive bayes)属于分类模型,也是最为简单的概率图模型,对于之后理解HMM、CRF等模型,大有裨益。本篇博客将对朴素贝叶斯模型的原理进行详细的讲解,并采用纯python实现以及调用scikit-learn库实现,这两种方式对朴素贝叶斯模型进行实现。
统计学习方法|支持向量机模型原理详解与实现
支持向量机(SVM)是一种二类分类模型,属于监督学习,能够用来解决数据线性不可分的问题,是对感知机模型的补充和扩展。本篇博客将对SVM的三种情形进行详细地讲解,并采用纯python实现以及调用scikit-learn库实现,这两种方式对感知机模型进行实现。