如何使用Groovy脚本创建示例集

MartinLiebigMartinLiebig 管理员,版主,员工,RapidMiner认证分析师,RapidMiner认证专家,大学教授职位:3362年RM数据科学家
2018年12月编辑 知识库

有时,您希望创建超出Generate data操作符选项范围的自定义数据集。

一种方法是使用Execute Script操作符,它利用了groovy脚本。下面是一个groovy脚本。它生成一个带有两个属性的示例集。一种是数值的,在中有不同的泊松分布值。另一个是标称的,在中有两个不同的类值。

进口com.rapidminer.example.utils.ExampleSetBuilder;
进口com.rapidminer.example.utils.ExampleSets;
进口com.rapidminer.tools.Ontology;
进口org.apache.commons.math3.distribution.PoissonDistribution;

List attributes = new ArrayList();
attributes.add (AttributeFactory.createAttribute(“数据”,Ontology.REAL));
attributes.add (AttributeFactory.createAttribute(“阶级”,Ontology.STRING));
exampleesetbuilder exampleesetbuilder = exampleesets .from(attributes);
PoissonDistribution pos = new PoissonDistribution(20)
Double [] row = new Double [2];
For (int I = 0;I < 10000;+ + i) {
Row [0] = pos.sample();
row[1] = attributes.get(1).getMapping().mapString("Class1")
examplesetBuilder.addRow(行)

泊松分布pos2 = new泊松分布(40)
For (int I = 0;I < 10000;+ + i) {
Row [0] = pos2.sample();
row[1] = attributes.get(1).getMapping().mapString("Class2")
examplesetBuilder.addRow(行)

//这一行返回第一个输入作为第一个输出
返回examplesetBuilder.build ();
- RapidMin乐鱼平台进入er数据科学服务主管
德国多特蒙德
标记:
Thomas_Ott Edin_Klapic pschlunder
    登录注册置评。