为什么格式正确的Excel日期导入为一长行标称数字?
你好,
想知道为什么我在Excel (dd/mm/yyyy)中正确格式化的(短日期)在使用xlsx时导入为长行标称数字?
我看过大量关于这方面的报道,但没有一个能解释为什么一串(对我来说毫无意义!)名义数字会更容易解释?特别是如果你使用RM的原因是预测资产的未来价格,也就是说,当你在数据中查看时,你希望看到的是日期而不是一串数字。我确实尝试了操作符将标称数字转换为日期,但它什么也没做,我仍然留下标称数字?
如果我先将我的xlsx转换成csv文件,我才能够得到出现的日期。将xlsx文件或csv文件导入RM的原因/优点/缺点是什么(在csv的情况下,除了能够看到实际日期之外)?
欢呼,
想知道为什么我在Excel (dd/mm/yyyy)中正确格式化的(短日期)在使用xlsx时导入为长行标称数字?
我看过大量关于这方面的报道,但没有一个能解释为什么一串(对我来说毫无意义!)名义数字会更容易解释?特别是如果你使用RM的原因是预测资产的未来价格,也就是说,当你在数据中查看时,你希望看到的是日期而不是一串数字。我确实尝试了操作符将标称数字转换为日期,但它什么也没做,我仍然留下标称数字?
如果我先将我的xlsx转换成csv文件,我才能够得到出现的日期。将xlsx文件或csv文件导入RM的原因/优点/缺点是什么(在csv的情况下,除了能够看到实际日期之外)?
欢呼,
0
最好的答案
-
Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽如果没有看到数据和特定的格式化问题,这很难诊断。我能够在xlsx电子表格中从Excel导入格式化日期到RapidMiner而不会出现问题。您是否确定“读取Excel”操作符中的日期格式参数已正确设置为您的格式?
有时,如果RapidMiner在自动导入方面有问题,最好在导入时简单地将字段设置为多名(这不会对其进行转换),然后在ETL过程中使用日期转换操作符之一,这将使您能够更好地控制如何解释它。5 -
Telcontar120 主持人,RapidMiner认证分析师,RapidMiner认证专家,会员职位:1635年独角兽如果没有看到您的数据和RapidMiner进程的配置,就不可能诊断这里可能发生的事情。正如我上面提到的,您应该确保日期格式参数实际上与Excel中显示的日期相匹配,因为默认选项可能不是正确的匹配。
就一般观点而言,导入xlsx文件的优点是有许多关于数据类型的嵌入式元数据,这些元数据将由RapidMiner自动读取,这可以节省您在后续ETL中的时间和麻烦。现实世界中的许多数据也存在于Excel工作簿中。缺点是有时额外的编码可能导致错误或意外的结果(就像您现在试图解决的问题)。
csv的优点是,它基本上只是一个文本文件,附加的编码很少,所以通常不会出现同样的问题。事实上,您可以选择将整个文件导入为多标称数据,然后使用ETL操作符在RapidMiner中手动处理所有后续数据转换,这为您提供了更精细的控制程度。缺点是,如果原始数据源来自Excel或其他格式,您可能必须首先将其转换为csv文件,并且在RapidMiner中进行转换等额外的数据ETL可能会有点痛苦。5
答案
将xlsx文件或csv文件导入RM的原因/优点/缺点是什么?
欢呼,