逻辑斯蒂回归对鸾尾花进行分类
Sigmoid函数
逻辑回归也被称为广义线性回归模型,它与线性回归模型的形式基本上相同,都具有 ax+b,其中a和b是待求参数,其区别在于他们的因变量不同,多重线性回归直接将ax+b作为因变量,即y = ax+b,而logistic回归则通过函数S将ax+b对应到一个隐状态p,p = S(ax+b),然后根据p与1-p的大小决定因变量的值。这里的函数S就是Sigmoid函数
IRIS数据集介绍
Iris也称鸢尾花卉数据集,是常用的分类实验数据集,由R.A. Fisher于1936年收集整理的。其中包含3种植物种类,分别是山鸢尾(setosa)变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica),每类50个样本,共150个样本。
该数据集包含4个特征变量,1个类别变量。iris每个样本都包含了4个特征:花萼长度,花萼宽度,花瓣长度,花瓣宽度,以及1个类别变量(label)。我们需要建立一个分类器,分类器可以通过这4个特征来预测鸢尾花卉种类是属于山鸢尾,变色鸢尾还是维吉尼亚鸢尾。其中有一个类别是线性可分的,其余两个类别线性不可分,这在最后的分类结果绘制图中可观察到。
导入所需的包
1 | import numpy as np |
pandas进行数据预处理
1 | data = pd.read_csv(path, header=None) |
导入模型,调用逻辑回归LogisticRegression()函数。
训练LogisticRegression分类器
1 | x = x[:, :2] |
训练结果可视化
1 | mpl.rcParams['font.sans-serif'] = [u'simHei'] |
最后更新: 2019年03月15日 09:11
原始链接: https://zem12345678.github.io/2019/03/14/Logistic回归对鸾尾花进行分类/