将包含文章的文本文件转换为solr索引json格式

维姬维姬 成员职位:3.新手
2019年11月编辑 帮助
嗨,伙计们,
我正在创建一个聊天机器人从一篇文章检索内容。我有大约10个文本文件。当我尝试使用solr时,它接受json/xml中的键/值对格式。
如何将文本转换为这种格式?

请帮助。

答案

  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
    @Vicky是的,这很容易做到。你有JSON格式/样例JSON, Solr正在寻找?
  • 维姬维姬 成员职位:3.新手
    我没有。这是一个一般的博客文章集合。想知道如何转换。

    我在solr示例中看到的一个示例是

    (
    {
    "id": "978-0641723445",
    "cat": ["book","hardcover"],
    "name": "The Lightning Thief",
    “作者”:“里克·赖尔登”;
    "series_t": "珀西·杰克逊和奥运选手";
    "sequence_i": 1,
    "genre_s": "奇幻";
    "inStock": true;
    “价格”:12.50,
    pages_i: 384
    }
  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
    是的,所以你只是建造它。让我看看我是否可以为你建立这个例子,这样你就可以看到…


  • sgenzersgenzer 12管理员,版主,员工,RapidMiner认证分析师,社区经理,成员,大学教授,PM版主职位:2959年社区经理
    好了,这是除了“cat”字段之外的所有内容,如果你明白我在这里做什么,可以以类似的方式构建:

    <?xml version="1.0" encoding="UTF-8"?><进程版本="9.5.000-BETA4">      <参数key="logverbosity" value="init"/> <参数key="random_seed" value="-1"/> <参数key="send_mail" value="never"/> <参数key="notification_email" value="30"/> <参数key="encoding" value="SYSTEM"/> <进程扩展="true">                  除cat外的所有         [    [            



    斯科特

    PS不错的选书——我爱珀西·杰克逊!]
    Tghadially
  • 维姬维姬 成员职位:3.新手
    谢谢。要走几个小时。我去查一下。
    sgenzer
登录注册置评。