类别

版本

读取XML(高级文件连接器)

剧情简介

该操作符用于读取XML文件。

描述

该操作符可以读取XML文件,其中示例由匹配给定XPath的元素表示,功能是每个元素及其子元素的属性和文本内容。

该操作符试图通过读取前几个元素并检查出现的值来确定属性的适当类型。如果所有值都是整数,则属性将变为整数,如果出现实数,则属性将为real类型。包含不能被解释为数字的值的列将是标称的,只要它们与控件的日期和时间模式不匹配日期格式参数。如果是这样,则该属性将自动解析为日期,相应的特性将是日期类型。

输入

  • 文件

    XML文件应该是一个文件对象,它可以用其他带有文件输出端口的操作符(如Read file操作符)创建。

输出

  • 输出(数据表)

    该端口以表格形式提供XML文件以及元数据。该输出类似于Retrieve操作符的输出。

参数

  • parse_numbers指定是否解析数字。范围:布尔
  • decimal_character该字符用作十进制字符。范围:字符
  • grouped_digits该选项决定是否解析分组数字。如果此选项设置为true,则a分组的性格参数。范围:布尔
  • grouping_character该字符用作分组字符。如果在数字之间找到此字符,则将数字组合并忽略此字符。例如,CSV文件中存在“22-14”,将“-”设置为分组的性格,则存储“2214”。范围:字符
  • infinity_string此参数可以设置为解析特定的无穷大表示(例如:“∞”)。如果未设置,则将使用特定于本地的无穷大表示。范围:字符串
  • date_format日期和时间格式在这里指定。存在许多预定义的选项;用户还可以指定新的格式。如果CSV文件列中的文本与此日期格式匹配,则该列将自动转换为日期类型。有些更正是自动输入的日期类型值。例如,值'32-March'将自动转换为'1-April'。包含不能被解释为数字的值的列将被解释为标称的,只要它们不匹配的日期和时间模式日期格式参数。如果是这样,CSV文件的这一列将自动解析为日期而对应的属性是of日期类型。范围:字符串
  • first_row_as_names如果将此选项设置为true,则假定CSV文件的第一行具有属性的名称。然后自动命名属性,并且不将CSV文件的第一行视为数据行。范围:布尔
  • 注释如果第一行作为名称未设置为true,则可以使用该参数的“编辑列表”按钮添加注释,该按钮将打开一个新菜单。此菜单允许您选择任意行并为其分配注释。名字评论单位可以分配注释。如果第0行赋值为a名字注释,它相当于设置第一行为姓名参数设置为true。如果要忽略任何行,可以将它们注释为评论。请记住,此菜单中的行数不包括注释行。范围:菜单
  • time_zone这是一个专家参数。提供了一个长长的时区列表;用户可以选择其中的任何一个。选择范围:
  • 语言环境这是一个专家参数。提供了一长串区域设置列表;用户可以选择其中的任何一个。选择范围:
  • read_all_values_as_polynominal此选项允许您禁用此操作符的类型处理。每个xpath条目都将作为多标称属性读取。范围:布尔
  • data_set_meta_data_information这个选项很重要。它允许您调整CSV文件的元数据。可以在这里指定列索引、名称、类型和角色。Read CSV操作符尝试通过读取前几行并检查出现的值来确定属性的适当类型。如果所有值都是整数,则属性将变为整数。类似地,如果所有值都是实数,则属性将变为实数类型。包含不能被解释为数字的值的列将被解释为标称的,只要它们不匹配的日期和时间模式日期格式参数。如果是这样,CSV文件的这一列将自动解析为日期,相应的属性将为type日期。可以使用此参数覆盖自动确定的类型。范围:菜单
  • read_not_matching_values_as_missings如果此值设置为true,则与预期值类型不匹配的值将被视为缺失值,并由'?'替换。例如,如果'abc'被写入整数列,它将被视为缺失值。CSV文件中的问号(?)也被视为缺失值。范围:布尔
  • datamanagement这是一个专家参数。提供了一长串清单;用户可以从这个列表中选择任何选项。选择范围: