使用自动模型检测数据集中的串通投标

Ric1Ric1 成员职位:3.新手
嗨,我会做一个投标操纵分析与RapidMiner,使用自动模型。
我不是专家,所以我需要大家的支持。

所以,在你看来,要在我的数据集中找到一些操纵投标的行为,我必须做什么类型的分析:预测,聚类还是大纲?

我有一个具有以下属性的数据集:招标结果(授予/未授予的旗帜),获胜者名称公司,获胜者投标金额和其他属性;但我没有一个属性,包含所有的非赢家提供的参与者,每一行肯定。

如果你是我,你会怎么做?

谢谢你以后的回答。

致以最亲切的问候。
里克

答案

  • rfuentealbarfuentealba 主持人,RapidMiner认证分析师,会员,大学教授职位:568独角兽
    嗯,这让我很困扰。
    我有一个具有以下属性的数据集:招标结果(授予/未授予的旗帜),获胜者名称公司,获胜者投标金额和其他属性;但我没有一个属性,包含所有的非赢家提供的参与者,每一行肯定
    不管怎样,操纵投标是一种欺诈。如果巧妙地做到这一点(我不是骗子,但我研究了很多),这将是一种异常或异常的检测。另一方面,你应该做你的统计,检查某个出价被操纵的概率(取决于参数),并使用分类算法,如决策树或可能回归(与信用风险评分非常相似)。这取决于你拥有的数据类型,你有多少比较数据等等。


  • Ric1Ric1 成员职位:3.新手
    例如,如果我的数据集是由这些属性组成的:

    地段编号(编号类型字符串);
    地段名称(类型字符串),
    参与者公司名称(类型字符串),
    参与者结果(字符串,有两个可能的值:赢家/输家),
    获奖日期(日期);

    使用自动模型,特别是其中的预测部分,你选择什么属性来进行串通投标分析?

    预测部分的最佳属性是什么,以便在数据集中找到最终的串通投标事件?
登录注册置评。