“如何在RapidMiner中开发一个新算法?”
最好的答案
-
rfuentealba 主持人,RapidMiner认证分析师,会员,大学教授职位:568独角兽你好,@Obaeissa,欢迎来到这个社区。
RapidMiner扩展模板提供给你,这样你就不必连接到RapidMiner并从那里导入东西。如果您精通Java,那么这是最推荐的实现算法的方法。您也可以使用Apache Groovy编程语言来实现它,并将其作为“Execute Script”运行。然而,我还没有看到很多关于这方面的文档(也许是我的好朋友@mschmitz,@David_A和@land我可以给你更多的技巧。也许@IngoRM)。
如果你的算法想法是你第一次尝试的东西,我建议你首先创建一个Python(或任何你觉得舒服的语言)实现,然后基于它构建一个RapidMiner操作符(或超级操作符)。至少当我“发明”Naïve贝叶斯算法时是这样做的(是的,我比托马斯·贝叶斯晚了200年,但直到我看到我的第一本数据科学书籍,我才知道它,所以……)乐鱼平台进入抱歉)。如果您选择这条路线,请确保使用Anaconda Python发行版和Python Scripting扩展,以便通过RapidMiner更容易测试它。
顺便说一句,写一篇关于你的算法的论文。尽可能保持科学是很重要的,不是因为这是RapidMiner的要求,而是因为数据科学家喜欢学术过程。是的,你会听到的@yyhuang说“很多学术数据科学家没有在现实生活中看到问题”,但创建一个算法(而不是利用它)是完全不同的事情。
希望这能帮到你,
罗德里戈。
9 -
IngoRM 管理员、版主、员工、RapidMiner认证分析师、RapidMiner认证专家、社区经理、RMResearcher、会员、大学教授职位:1751年RM创始人补充一下罗德里戈的评论:我会的肯定建议始终使用您已经熟悉的语言。如果您了解Java,那么首先学习Python是没有意义的,但是直接构建Java扩展可能是最简单的方法。但是如果你已经知道R或Python,或者已经有了一个实现,那么首先要做的就是先把它们集成起来。就像罗德里戈说的。
假设你做了解Java并想要扩展它。那么请使用下面的文档:https://docs.www.turtlecreekpls.com/latest/developers/creating-your-own-extension/your-own-operator/
如果你已经熟悉Java, Git, Gradle和你最喜欢的IDE (IntelliJ, Eclipse),你应该能够在不到一个小时内启动并运行…
关于自由职业:虽然我肯定能够为您编写代码,但我怀疑您是否愿意为此支付每日费率-所以我希望有人能在你需要的时候帮帮你。
希望这能帮到你,Ingo
8
答案
第一步是创建一个进程,并使用Python Scripting扩展来解决问题。
当该流程正常工作并且输入、输出和参数正确时,可以使用Custom Operators扩展将该流程转换为操作符。
自定义操作符:https://marketplace.www.turtlecreekpls.com/UpdateServer/faces/product_details.xhtml?productId=rmx_process_defined_operators
教程:https://community.www.turtlecreekpls.com/discussion/56872/tutorial-for-creating-custom-operators
在构建自定义操作符(一个或多个)之后,您将创建自定义扩展。它将是一个普通的RapidMiner扩展(在你的情况下取决于Python脚本扩展),你可以把它放在服务器上,给别人,甚至发布在市场上,如果它对别人有帮助。
问候,
Balazs