替换(字典)

abevenseeabevensee 成员职位:4贡献我
2019年11月编辑 帮助
我有一个有30多个属性的数据集。每个数据行在每个列中都有与分类相关的数字代码。例如;性别是一个属性,代码1-3分别表示男性、女性和未提供。对于民族、种族等也有类似的代码结构。我已经为这些属性中的每一个设置了一个字典,这样我的模型就可以引用特定的字典并将代码转换为有意义的数据。我有两个问题:

1):代码对于我执行的每个属性转换都有不同的含义,因此我为每个属性转换设置了单独的字典。例如,1在性别上表示男性,但在种族上也表示白人,在婚姻状况上也表示单身。是否有一种方法可以使用循环操作符让RM使用不同的字典运行所有30多个转换,或者我是否需要在我的过程中有30个单独的“替换(字典)”操作符?

在一些字典中有分层代码,例如在我的用例中
1 =拉丁裔/西班牙裔
4 = n / a
其他西班牙裔或拉丁裔

对于等于14的代码,操作符不是返回“Other Hispanic or Latino”,而是返回“Latino/HispanicN/A”。我已经看到,正则表达式选项可以防止这种情况,但是,因为我有操作符设置为运行在一个子集(各种种族相关的属性),我不希望它应用到整个人口,我不确定这将工作。我该如何着手解决这个问题?

最佳答案

    登录注册置评。