使用自动模型检测数据集中的串通投标

Ric1 · 2021年1月

嗨，我会做一个投标操纵分析与RapidMiner，使用自动模型。
我不是专家，所以我需要大家的支持。

所以，在你看来，要在我的数据集中找到一些操纵投标的行为，我必须做什么类型的分析:预测，聚类还是大纲?

我有一个具有以下属性的数据集:招标结果(授予/未授予的旗帜)，获胜者名称公司，获胜者投标金额和其他属性;但我没有一个属性，包含所有的非赢家提供的参与者，每一行肯定。

如果你是我，你会怎么做?

谢谢你以后的回答。

致以最亲切的问候。
里克

rfuentealba · 2021年2月

嗯，这让我很困扰。

我有一个具有以下属性的数据集:招标结果(授予/未授予的旗帜)，获胜者名称公司，获胜者投标金额和其他属性;但我没有一个属性，包含所有的非赢家提供的参与者，每一行肯定．

不管怎样，操纵投标是一种欺诈。如果巧妙地做到这一点(我不是骗子，但我研究了很多)，这将是一种异常或异常的检测。另一方面，你应该做你的统计，检查某个出价被操纵的概率(取决于参数)，并使用分类算法，如决策树或可能回归(与信用风险评分非常相似)。这取决于你拥有的数据类型，你有多少比较数据等等。

Ric1 · 2021年2月

例如，如果我的数据集是由这些属性组成的:

地段编号(编号类型字符串);

地段名称(类型字符串)，

参与者公司名称(类型字符串)，

参与者结果(字符串，有两个可能的值:赢家/输家)，

获奖日期(日期);

使用自动模型，特别是其中的预测部分，你选择什么属性来进行串通投标分析?

预测部分的最佳属性是什么，以便在数据集中找到最终的串通投标事件?

快速链接