"JSON到数据运算符"

fmehraliyevfmehraliyev 成员职位:2贡献我
2019年5月编辑 帮助

你好。我是RapidMiner的新手。

基本上,我有一个扩展名为。json的数据集。

我被建议使用JSON数据操作符,以便能够使用数据集。

不幸的是,我不能使用接线员。它没有说任何地方,在操作符中指定我打算使用哪个数据集。我基本上不知道,怎么用这个算子。

附:我读过一些回应,但他们似乎是先进的xml代码。我需要在xml代码中指定文件的名称吗?谢谢你提前。

标记:

答案

  • sgenzersgenzer 管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理

    @fmehraliyev-欢迎来到社区。要对本地JSON文件使用"JSON To Data"操作符,只需在其前面使用"Read Document"操作符:

    截屏2018-10-16下午7.14.53 .png

    至于共享XML,这就是我们RapidMiner彼此共享进程的方式。你可以在这里阅读如何做到这一点:

    https://community.www.turtlecreekpls.com/t5/RapidMiner-Studio-Knowledge-Base/How-can-I-share-processes-without-RapidMiner-Server/ta-p/37047

    斯科特

  • fmehraliyevfmehraliyev 成员职位:2贡献我

    非常感谢!

    一步完成了。现在是第二个问题。

    Json到数据操作符无法适当地将文件转换为数据集。

    这就是我的json文件的样子:

    @{"review_id":"x7mDIiDB3jEiPGPHOmDzyw","user_id":"msQe1u7Z_XuqjGoqhB0J5g","business_id":"iCQpiavjjPzJ5_3gPD5Ebg","stars":2,"date":"2011-02-25","text":"披萨还行。不是我吃过的最好的。我更喜欢Biaggio在Flamingo / Fort Apache上的作品。那里的厨师可以做出更好的纽约风格的披萨。这家披萨店@ Cosmo的价格过高,因为它的质量和食物缺乏个性。如果你想吃意大利菜,Biaggio’s是一个更好的选择——家庭拥有,家庭自制的食谱,人们实际上关心你是否喜欢他们的食物。在赌场里的披萨店是不会有这种感觉的。,"有用":0,"有趣":0,"酷":0}
    {"review_id":"dDl8zu1vWPdKGihJrwQbpw","user_id":"msQe1u7Z_XuqjGoqhB0J5g","business_id":"pomGBqfbxcqPv14c3XH-ZQ","stars":5,"date":"2012-11-13","text":"我爱这个地方!我和我未婚夫每周至少来一次。份量很大!食物太棒了。我喜欢他们的烤肉。他们有很棒的特价午餐……莱蒂西亚人非常好,很在意你对她餐厅的看法。你也要尝尝他们的芝士卷饼,酱汁很不一样,棒极了!!","有用":0,"有趣":0,"酷":0}

    这是一个yelp数据集,据我所知,每个{}符号应该代表一行。

    但是,操作符将所有内容转换为一行,并且所有属性名称都以businesssid开头(附带的截图.jpg文件)。

    下面是xml代码。

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.0.001”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    < /操作符>






    > < /过程
    < /操作符>
    > < /过程

    我已经读了很多关于json扩展在快速矿工,希望它可以修复虽然。谢谢大家

  • David_ADavid_A 管理员、版主、员工、RMResearcher、会员职位:295RM研究

    你好,

    要将JSON文档处理成示例集,需要对集合中的条目进行分组。

    这可以很容易地完成将文档拆分为集合操作符从文本处理扩展。

    如果文档看起来与示例完全相同,则分割字符串为" \n",表示新行(作为参数,不带引号)。

    请看下面的示例过程:

    <?xml version="1.0" encoding="UTF-8"?> <过程version = " 9.0.003”>
    > <上下文
    <输入/ >
    <输出/ >
    <宏/ >
    > < /上下文

    <过程扩展= " true " >


    < /操作符>


    < /操作符>








    > < /过程
    < /操作符>
    > < /过程

    sgenzer Somnath_Das
  • kaymankayman 成员职位:662独角兽

    处理这个问题的另一种方法是首先使用jsonpath构造器来删除你的“根”,这将允许你“扁平化”你的树,这样示例集的结果将更符合你的期望。这在JSON中很常见,特别是在调用webservices时,因为实际的JSON仍然封装在结果节点中。

    所以加载json ->用jsonpath(像$..已经可以做奇迹)-> json数据

    sgenzer
  • tftemmetftemme 管理员、员工、RapidMiner认证分析师、RapidMiner认证专家、RMResearcher、会员职位:164RM研究

    @David_A写道:

    你好,

    要将JSON文档处理成示例集,需要对集合中的条目进行分组。

    这可以很容易地完成将文档拆分为集合操作符从文本处理扩展。

    你好,

    只是一个小小的补充将文档拆分为集合操作符来自操作符工具箱扩展。但是,随着@David_A说,这可能正是你需要的。

    最好的问候,
    费边

    David_A
登录注册置评。