我怎样才能只取至少有5000个观测值的变量?

ceci_roceci_ro 成员职位:3.贡献我
你好各位,

我这里需要帮助……
我怎样才能只取至少有5000个观测值的变量?
我的变量太多了,提前谢谢你。


塞西莉亚


最好的答案

  • BalazsBaranyBalazsBarany 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家职位:876独角兽
    解决方案接受
    @ceci_ro,

    一种方法是使用Quality Measures操作符。它计算每个属性的缺失值等度量。
    然后“exampleeset to Weights”从转换器扩展。在这里,您可以选择属性名称和所需的度量(缺少的值)。
    然后“按权重选择”,其中包含原始数据的副本和您创建的权重。权重关系= less =,权重=例如0.2或任何适合您的数据的值。

    问候,
    Balazs
  • ceci_roceci_ro 成员职位:3.贡献我
    解决方案接受
    有一个操作符可以完成这个函数:工具箱扩展,过滤缺少值的属性操作符。简单而美丽。
    BalazsBarany

答案

登录注册置评。