四时宝库

程序员的知识宝库

数据预处理(随机化组件)#数据分析

数据预处理:随机化组件。

本节内容介绍随机化组件,作用是打乱输入数据集的类、属性和元数据。输入为数据集,输出为随机化的数据集。

·添加预处理器组件并打开,随机化组件中增加了数据集的比例控制。

·关闭预处理器窗口,选择其它组件并打开。

·打乱的列类型选择分类,拖动打乱行的比例。

·随机化结果中无变化,需要设置分类属性的角色为Target。

·再次调整打乱行的比例,查看随机化结果。

·打乱列调整为特征,查看随机化结果。

·查看原数据列姓名,打乱列调整为原数据。

·多次点击选项,观察右侧姓名列数据变化情况。当前打乱行比例为50%,姓名列数据随机变化。

·勾选下方选项,确保每次执行随机化操作时得到的结果都是可复现的。

这意味着无论何时运行随机化程序,只要参数设置相同,都将得到相同的结果。谢谢观看。

发表评论:

控制面板
您好,欢迎到访网站!
  查看权限
网站分类
最新留言
    友情链接