一天,小迪与小西想养一只宠物。
小西:小迪小迪,好想养一只宠物呀,但是不知道养那种宠物比较合适。
小迪:好呀,养只宠物会给我们的生活带来很多乐趣呢。不过养什么宠物可要考虑好,这可不能马虎。我们需要考虑一些比较重要的问题。
小西:我也考虑了好多呀,可是还是很难去选择。我想养可爱的小兔兔,可是兔兔吃得很挑剔,又想养狗狗,可是狗狗每天都需要遛它,怕自己没有时间呀。
2024年07月29日
一天,小迪与小西想养一只宠物。
小西:小迪小迪,好想养一只宠物呀,但是不知道养那种宠物比较合适。
小迪:好呀,养只宠物会给我们的生活带来很多乐趣呢。不过养什么宠物可要考虑好,这可不能马虎。我们需要考虑一些比较重要的问题。
小西:我也考虑了好多呀,可是还是很难去选择。我想养可爱的小兔兔,可是兔兔吃得很挑剔,又想养狗狗,可是狗狗每天都需要遛它,怕自己没有时间呀。
2024年07月29日
决策树通常包括:
2024年07月29日
偏斜数据是指分布高度不均匀的数据:当变量数据显示为直方图时,大部分数据点要么聚集在分布的左侧,长尾向右延伸(右偏斜),要么反之(左偏斜),或呈现更复杂的偏斜模式。偏斜数据对可视化,特别是热力图的绘制,提出了很大的挑战。通常情况下,人们会使用对数变换来处理这些数据。然而,经典对数变换无法处理零或负数,而伪对数变换则能够更好地处理和可视化这些数据。
2024年07月29日
熵(Entropy)在机器学习中是一个重要的概念,尤其是在决策树算法和信息理论中。熵用于量化数据集的不确定性或杂乱无章的程度。在决策树中,熵帮助我们确定哪个特征最好地分割数据集,以便尽可能清晰地分类数据点。熵不仅用于构建决策树,也是评估分类问题中不同模型或特征选择方法效果的有用工具。理解和计算熵对于设计高效的机器学习模型至关重要。
2024年07月29日
导入所需的Python库
import numpy as np import pandas as pd eps = np.finfo(float).eps from numpy import log2 as log
2024年07月29日
映射{x}→{y}
定义:两个非空集合 X、 Y,若存在法则 f,使 X中每个元素 x在 Y中都能确定唯一元素 y与之对应,则称 f为
X到 Y的映射,即 作 f: x→y
2024年07月29日
决策树是一类极为常用的机器学习方法,尤其是在分类场景。决策树通过树形结构来递归地将样本分割到不同的叶子结点中去,并根据每个叶子结点中的样本构成对该结点中的样本进行分类。