项目版本控制
AI Hub的数据存储由集成Git而且大文件系统(LFS)服务器用于保存您的所有数据项目.
集成的git服务器用于跟踪较小的文件,集成的LFS服务器负责处理较大的文件。默认情况下,如果LFS为项目,文件扩展名.ioo
,.rmhdf5table
,.collection
而且.conninfo
存储在LFS服务器中。
建议总是在LFS中存储二进制数据,如Excel表格或图片,并默认为所有项目启用LFS !
属性可以定义附加的文件扩展名,这些扩展名将被跟踪.gitattributes
项目中的文件。
存储后端
集成的git和LFS服务器将数据存储在RapidMiner AI Hub主目录并且所有文件都驻留在美元/ git_server rmHomeDir /数据/存储库
而且美元/ git_lfs_server rmHomeDir /数据/存储库
分别。在git术语中,git数据存储在里面裸露的git存储库。在集成的LFS服务器中,文件名总是匹配它们各自的SHA-256校验和。
用于上传、磁盘空间可用性和一致性检查的高级配置
集成的git和LFS服务器,将它们的数据存储在RapidMiner AI Hub主目录依赖于有足够的可用磁盘空间。
为了避免上传后文件损坏,无论上传的文件大小如何,都需要一定的可用磁盘空间。此外,当大文件上传到项目,它们的预期大小和SHA-256校验和由集成的LFS服务器验证。
属性中的磁盘空间和一致性检查可以更改的重要属性execution.properties
文件。
财产 | 描述 | 可用性 |
---|---|---|
repositories.maxUploadSize |
默认情况下,LFS服务器只允许上传小于5gb的文件。标识符像Gb 或Mb 支持千兆字节和兆字节。 |
支持的任何版本项目 |
repositories.gitEnableDiskspaceCheckHook |
至少验证一下gitDiskspaceCheckThreshold 可在RapidMiner AI Hub主目录. |
> = 9.10.4 |
repositories.gitDiskspaceCheckThreshold |
默认为5120米 .标识符像G 或米 支持千兆字节和兆字节。 |
> = 9.10.4 |
repositories.lfsEnableDiskspaceCheck |
至少验证一下minLfsDiskspaceCheckThreshold 可在RapidMiner AI Hub主目录. |
> = 9.10.4 |
repositories.minLfsDiskspaceCheckThreshold |
默认为5120米 当它加倍时lfsRemoveUnsuccessfulUploads 启用。标识符像G 或米 支持千兆字节和兆字节。 |
> = 9.10.4 |
repositories.lfsRemoveUnsuccessfulUploads |
默认为真正的 .当一致性检查在上传过程中失败(校验和或大小),这些文件将直接删除之后,以避免保留失败的上传。 |
> = 9.10.4 |
repositories.lfsEnableUploadSizeCheck |
默认为真正的 .启用检查上传的LFS文件。 |
> = 9.10.4 |
repositories.lfsEnableUploadChecksumCheck |
默认为真正的 .启用上传LFS文件的校验和验证。 |
> = 9.10.4 |