使用来自另一个ExampleSet的引用值创建属性
hugomsouto
成员职位:4贡献我
在帮助
你好,每个人。
有几天,我在创建一个属性时遇到了麻烦,这个属性必须用来自另一个示例集的值填充,该示例集是聚合操作的结果。在主示例集中有一个“CNPJ”属性,它的值在25000多行中重复。聚合集由700多行唯一的CNPJ值和第二列组成,其中包含它的计数([count(CNPJ)])。我需要的是创建一个列与计数(CNPJ)值在每次相同的ecnpj出现在主集上。
到目前为止,我发现更好的方法是Python脚本,这是完全有效的。我让他们通读了一遍:
有几天,我在创建一个属性时遇到了麻烦,这个属性必须用来自另一个示例集的值填充,该示例集是聚合操作的结果。在主示例集中有一个“CNPJ”属性,它的值在25000多行中重复。聚合集由700多行唯一的CNPJ值和第二列组成,其中包含它的计数([count(CNPJ)])。我需要的是创建一个列与计数(CNPJ)值在每次相同的ecnpj出现在主集上。
到目前为止,我发现更好的方法是Python脚本,这是完全有效的。我让他们通读了一遍:
但我已经尝试过这些代码,都失败了:import pandasdef rm_main(cnpj, data): # cnpj是聚合集,数据是保存集# code返回数据
data["CNPJ"] = CNPJ ["CNPJ"] in data["CNPJ"]] return dataimport pandas def rm_main(CNPJ, data): data["CNPJ_count"] = [CNPJ ["count(CNPJ)]”)
import pandas def rm_main(cnpj, data): CNPJ_count = [] for count in data[" cnpj "]: if data[" cnpj "] == CNPJ_count.append(cnpj["count(cnpj)"]) data["CNPJ_count"] = CNPJ_count返回数据有人能帮忙吗?
0
最佳答案
-
kayman 成员职位:662独角兽你正试图比较2个不同形状的表彼此,这不起作用。过于简化的过程将查看集合1的第一行,并与集合2的第一行进行比较,并以这种方式遍历整个集合。但这意味着您的表需要具有相同数量的记录,而这里的情况并非如此。
我想知道如果一个简单的连接没有做什么你是什么
附带的示例显示了您想要获得的相同映射(如果我正确理解它:-))
< ?xml version="1.0" encoding="UTF-8"?><进程版本="9.3.001">
<参数key="logverbosity" value="init"/> <参数key="random_seed" value="2001"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="" "/> <参数key="process_duration_for_mail" value="30"/> <参数key="encoding" value="UTF-8"/> Exclusão final de attributos Ordenação dos atributos
1
答案
MarlaBot
德国多特蒙德
谢谢@mschmitz,我已经尝试使用连接,但我没有设置两个列的角色,它没有工作。