“循环集群?”

PrablyPrably 成员职位:3.贡献我
2019年6月编辑 帮助
嗨,RM Masters!

我是RM的新手,对循环和宏没有经验。我需要关于如何构建流程以循环集群的建议。我试图获得三个质心-每个位置和疾病组合的低/中/高(见下文)。这样,当将来收到来自[地点B]的关于[疼痛]的合同需要多长时间的数据时,我就可以判断它是花费了太长时间,还是按计划进行,还是提前了。

我非常确定我想要运行聚类(k-means),对属性Location和Illness的所有唯一组合进行循环。所以我想为[地点A和埃博拉]子集获取3个质心,为[地点B和寒冷],[地点C和寒冷]获取3个质心,等等。属性Milestone 1, Milestone 2, Milestone Final是我想在集群中使用的数值属性。

我的数据集大约有13000个样本,我还有一些其他的多项式属性,在这里没有列出。

请原谅格式;以下是示例集的代表性示例:


合同ID地点疾病合同状态合同类型开始日期里程碑1里程碑2里程碑最终
2013年10月1日78 133 154
2 A Aids未完成小型2009年1月5日1 125 162
2012年8月17日40 118 214
7 B awesome Finished Small 2007年9月27日42 150 209
8 C胃部不适未完成的小12/20/2009 10 101 219
2009年1月16日,埃博拉病毒大爆发
10 D头痛未完成大2005年9月11日57 127 238
11d俱乐部脚未完成小12/2/2005 55 141 204
2012年2月3日15 106 191
13 D胃部不适完成小11/27/2009 48 103 194
D埃博拉病毒于2005年5月18日大爆发86 101 160
15 D埃博拉大爆发2009年11月15日7 148 164
16 D疼痛未完成小5/25/2005 29 117 242
18d俱乐部脚未完成大2011年4月28日41 147 190
19d梅花脚未完成小2007年4月20日48 113 229

此外,任何关于如何学习使用循环宏的想法都会很棒。

提前感谢您的建议!

答案

  • jaysunice3401jaysunice3401 成员职位:6因素二世
    这可能会有所帮助。首先,使用Generate Concatenation操作符创建一个连接Location和Illness的新字段。然后,将其输入Loop Values操作符。当您处于循环的Subprocess中时,您将希望根据新的连接属性进行筛选。诀窍在于,您将希望使用%{loop_value}——即Location_Illness=%{loop_value}。然后,从那里继续。希望这对你有所帮助。
    <?xml version="1.0" encoding="UTF-8" standalone="no"?>
    <过程version = " 5.3.000 " >
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文





    < /操作符>






    < /操作符>





    > < /过程
    < /操作符>





    > < /过程
    < /操作符>
    > < /过程
登录注册置评。