数据预处理:随机化组件。
本节内容介绍随机化组件,作用是打乱输入数据集的类、属性和元数据。输入为数据集,输出为随机化的数据集。
·添加预处理器组件并打开,随机化组件中增加了数据集的比例控制。
·关闭预处理器窗口,选择其它组件并打开。
·打乱的列类型选择分类,拖动打乱行的比例。
·随机化结果中无变化,需要设置分类属性的角色为Target。
·再次调整打乱行的比例,查看随机化结果。
·打乱列调整为特征,查看随机化结果。
·查看原数据列姓名,打乱列调整为原数据。
·多次点击选项,观察右侧姓名列数据变化情况。当前打乱行比例为50%,姓名列数据随机变化。
·勾选下方选项,确保每次执行随机化操作时得到的结果都是可复现的。
这意味着无论何时运行随机化程序,只要参数设置相同,都将得到相同的结果。谢谢观看。