登录
注册
乐鱼官网手机版下载
解决方案
乐鱼体育安装
定价
合作伙伴
公司
你好,陌生人!
看起来你是新来的。登录或注册开始。
使用RapidMiner登录
使用RapidMiner登录
登录
注册
快速链接
类别
最近的讨论
最好的…
没有回答
组
类别
17.5 k
所有类别
19.5 k
帮助
442
知识库
Altair RapidMiner社区
得到帮助。学习最佳实践。与你的同事建立联系。
讨论
如何将结果文件中的数值转换回输入的原始标称值
作者
日期内
1天
3天
1周
2周
1个月
2个月
6个月
1年
的
例如:周一,今天,上周,3月26日,3/26/04
搜索
0评论
0的讨论
0成员
0在线
问一个问题
寻找有用的视频
首页
;
帮助
如何将结果文件中的数值转换回输入的原始标称值
Hung_Bui_221
成员
职位:
5
学我
2022年11月
2022年11月编辑
在
帮助
大家好!我只是一个刚开始学习RM几个月的初学者。我遇到了一个群体问题,需要检测异常值
银行营销数据集
。这是我的过程。
下图
).
数据集有超过40000个例子,离群检测算子对于标称值和数值似乎都太慢了,所以我决定将所有标称值更改为数值。
在运行此过程之后,我获得了结果文件,我想将之前更改的所有数值转换回原始标称值,如输入文件。手动转换绝对是最后的选择,但我想知道我是否可以通过使用RM或其他操作符尽可能快地做到这一点。
请尽快帮我找出解决这个案子的最好办法
非常感谢。
标记:
异常检测
标称到数值
0
最好的答案
BalazsBarany
管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家
职位:
915
独角兽
2022年11月
解决方案接受
嗨!
你的资料里有身份证吗?如果没有,也可以使用
生成ID
接线员来接电话。然后使用Join获取原始数据,并将生成的离群值添加到原始数据中。
顺便说一下,局部离群因子是一种基于最近邻的方法,所以它对规范化输入效果最好。使用
正常化
在应用它之前,你应该得到更好的结果。用于获取原始数据的基于连接的方法也适用于此。
问候,
Balazs
1
BalazsBarany
管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家
职位:
915
独角兽
2022年11月
解决方案接受
嗨!
规范化将所有数值属性更改为大致在0和1之间(或-1和1),具体取决于方法。
最近邻方法相互比较不同属性的值。这意味着具有较大数值的属性(例如金钱金额)将支配所有其他属性(以年为单位的年龄,名义到数值转换的0/1等),并单独确定邻域。规范化避免了这种情况,并为所有属性提供了更好的机会来确定距离计算。
问候,
Balazs
1
答案
Hung_Bui_221
成员
职位:
5
学我
2022年11月
非常感谢您的回复。你的回答对我很有帮助。我能再问你一个问题吗?
在我使用
规范化操作符
对于所有属性,数据类型和值都已更改。如
年龄
,首先这个属性包含客户的年龄
(40、50、60岁……)
,但随后数据类型和值被更改为真实的
(附图片)
。
我想知道这是否会影响结果。
请多告诉我一些。再次感谢你。
0
Hung_Bui_221
成员
职位:
5
学我
2022年11月
非常感谢,Mr.Balázs。
你的回答非常好。
0
登录
或
注册
置评。
答案
在我使用规范化操作符对于所有属性,数据类型和值都已更改。如年龄,首先这个属性包含客户的年龄(40、50、60岁……),但随后数据类型和值被更改为真实的(附图片)。
我想知道这是否会影响结果。