首页 - 新闻世界 - 孕早期,广元天气预报,八大行星-简书咨询,大数据采集简书内容,分享给你最实用的信息

孕早期,广元天气预报,八大行星-简书咨询,大数据采集简书内容,分享给你最实用的信息

发布时间:2019-07-10  分类:新闻世界  作者:admin  浏览:187

决议计划树是一类常见的机器学习算法,它是根据树结构来进行决议计划的。

1、决议计划树,

    处理怎么进行高效地决议计划,挑选特征的先后顺序。

2、信息论,

   信息,消除随机不定性的东西。

   信息熵,消除了不定性的巨细,衡量信息量的巨细,

   信息增益,增加了某一个信息之后,不确定性削减的程度。

   决议计划树区分的根据之一是信息增益。

3、优缺陷

    长处,可视化,可解释能力强。

    缺陷,简单过拟合。

下面运用决议计划树算法对鸢尾花进行分类,

#!/usr/bin/env python# coding: utf-8
# ## 导包
# In[72]:import pandas as pdimport numpy as np#运用自带小数据集from sklearn.datasets import load_iris#拆分数据集from sklearn.model_selection import train_test_split#决议计划树算法from sklearn.tree import DecisionTreeClassifier,export_graphviz
# ### 决议计划树
# 决议计划树,# 怎么进行高效的决议计划,特征的先后顺序。# 信息论,# 信息,消除随机不定性的东西。# 信息熵,消除了不定性的巨细,衡量信息量的巨细,# 信息增益,增加了某一个信息之后,不确定性削减的程度。# 决议计划树区分的根据之一是信息增益。# 长处,可视化,可解释能力强。# 缺陷,简单过拟合。
# #### 鸢尾花分类
# ##### 获取数据集
# In[15]:

iris = load_iris()

# ##### 区分数据集
# In[16]:

x_train,x_test,y_train,y_test = train_test_split(iris.data,iris.target,random_state=6)

# ##### 运用决议计划树预估器分类
# In[17]:

estimator = DecisionTreeClassifier(criterion='entropy')estimator.fit(x_train,y_train)

# ##### 模型评价
# In[19]:

socre = estimator.score(x_train,y_train)print('准确率为:',socre)

# ##### 决议计划树的可视化
# In[22]:

export_graphviz(estimator,out_file='iris_tree.dot',feature_names=iris.feature_names, class_names=iris.target_names)#在本地生成了iris_tree.dot文件,放到http://webgraphviz.com/中,就可以看到树了。

下面是在jupyter中的成果,

决议计划树可视化办法,翻开http://webgraphviz.com这个网站,将iris_tree.dot中的文字复制到网站中,点击按钮即可看到树。

生成决议计划树如下,



下一篇
快捷导航
最新发布
标签列表