类别

版本

项目版本控制

AI Hub的数据存储由集成Git而且大文件系统(LFS)服务器用于保存您的所有数据项目

集成的git服务器用于跟踪较小的文件,集成的LFS服务器负责处理较大的文件。默认情况下,如果LFS为项目,文件扩展名.ioo.rmhdf5table.collection而且.conninfo存储在LFS服务器中。

建议总是在LFS中存储二进制数据,如Excel表格或图片,并默认为所有项目启用LFS !

属性可以定义附加的文件扩展名,这些扩展名将被跟踪.gitattributes项目中的文件。

存储后端

集成的git和LFS服务器将数据存储在RapidMiner AI Hub主目录并且所有文件都驻留在美元/ git_server rmHomeDir /数据/存储库而且美元/ git_lfs_server rmHomeDir /数据/存储库分别。在git术语中,git数据存储在里面裸露的git存储库。在集成的LFS服务器中,文件名总是匹配它们各自的SHA-256校验和。

用于上传、磁盘空间可用性和一致性检查的高级配置

集成的git和LFS服务器,将它们的数据存储在RapidMiner AI Hub主目录依赖于有足够的可用磁盘空间。

为了避免上传后文件损坏,无论上传的文件大小如何,都需要一定的可用磁盘空间。此外,当大文件上传到项目,它们的预期大小和SHA-256校验和由集成的LFS服务器验证。

属性中的磁盘空间和一致性检查可以更改的重要属性execution.properties文件。

财产 描述 可用性
repositories.maxUploadSize 默认情况下,LFS服务器只允许上传小于5gb的文件。标识符像GbMb支持千兆字节和兆字节。 支持的任何版本项目
repositories.gitEnableDiskspaceCheckHook 至少验证一下gitDiskspaceCheckThreshold可在RapidMiner AI Hub主目录 > = 9.10.4
repositories.gitDiskspaceCheckThreshold 默认为5120米.标识符像G支持千兆字节和兆字节。 > = 9.10.4
repositories.lfsEnableDiskspaceCheck 至少验证一下minLfsDiskspaceCheckThreshold可在RapidMiner AI Hub主目录 > = 9.10.4
repositories.minLfsDiskspaceCheckThreshold 默认为5120米当它加倍时lfsRemoveUnsuccessfulUploads启用。标识符像G支持千兆字节和兆字节。 > = 9.10.4
repositories.lfsRemoveUnsuccessfulUploads 默认为真正的.当一致性检查在上传过程中失败(校验和或大小),这些文件将直接删除之后,以避免保留失败的上传。 > = 9.10.4
repositories.lfsEnableUploadSizeCheck 默认为真正的.启用检查上传的LFS文件。 > = 9.10.4
repositories.lfsEnableUploadChecksumCheck 默认为真正的.启用上传LFS文件的校验和验证。 > = 9.10.4