从工作室到服务器的连接结果不同

bb 成员职位:5学我
我正致力于将两个相当大的数据集连接在一起。由于它们的大小,我将不得不在服务器上执行连接。在RMstudio中使用来自每个数据集的一小部分数据进行测试,正如我所期望的那样,成功地完成了连接。但是,当我在服务器上使用相同的测试数据运行相同的进程时,join只添加新特性的名称,并将数据记录为缺失。换句话说,相同的确定性过程在Studio和服务器中产生不同的结果。

你知道这里会发生什么吗?我有点困惑的是,这个过程在Studio中按预期完成,但在服务器上却没有。
标记:

答案

  • bb 成员职位:5学我
    我将把这个打开,以防将来有人遇到类似的问题。现在,我的问题解决了。在连接之前,我的原始流程在其中一个数据集上有几个步骤。我创建了一个单独的进程来运行这些步骤并存储输出。只运行连接,不运行其他步骤,就解决了这个问题。
登录注册置评。