决策树(Decision Tree)是一种直观且易于理解的机器学习算法,它可以处理分类和回归问题。
- 分类问题是一种离散型输出的预测任务,模型需要预测输入数据属于哪个类别,例如:垃圾邮件预测
- 回归问题是一种连续型输出的预测任务,模型需要预测一个连续值,例如:房价预测
课程学习目标:
- 分类决策树如何构建
- 回归决策树如何构建
- 决策树过拟合方法
- 决策树 API 使用
授课环境:win11 + pycharm 2021.1.3 + python 3.8.19
1. 创建虚拟环境 dt-env:
conda create --name dt-env python=3.8
2. 安装课程需要的依赖包:
conda install scikit-learn==1.3.0 conda install matplotlib==3.7.2 conda install pandas==2.0.3
3. 创建 Python 项目:决策树学习
,并配置该项目的环境为 dt-env
。
4. 最后,将课程数据集导入到项目中。