图像数据集的特征提取与交叉验证

HelveticusHelveticus 成员职位:1贡献我
2019年9月编辑 帮助


我有一个由功能磁共振成像图像组成的数据集。每个图像属于一个类。数据集如下:

类别1:9个图像
类别2:10张图片
第三类:6张图片
第4类:12个图像

每张图像都是4D(时间序列),即90x60x10x350,其中350为时间维度(即350个3D体积)。我想在这些数据上训练一个分类器。

现在我想先提取特征,然后通过例如PCA进行特征选择,然后进行聚类,就像论文“Principal feature Analysis: A Multivariate feature selection Method for fMRI Data”中描述的那样(http://www.hindawi.com/journals/cmmm/2013/645921/)。对于特征提取,我看到以下可能性:

1.每个体素是一个特征,是每个体素时间序列的平均值
。每个图像都有一个特征向量,尺寸为90*60*10 = 54'000

2.每个体素是一个特征,每个时间点(即每个3D体)是一个数据点。每张图像有350个特征向量,每个特征向量的维度为90*60*10 = 54'000。

3.将一幅图像的整个时间序列的所有体素放入一个特征向量中
尺寸90*60*10*350 = 18'90 '000。每张图像只有一个特征向量。

4.将体素之间的相关值作为特征值。但这是
计算上是不可行的。


我更喜欢2。但我不确定这是不是个好主意。

如何进行特征提取?在计算可行的情况下,基于相关性的方法是如何工作的?

最后但并非最不重要的是,如何对数据集进行交叉验证?问题在于不同的职业是不平衡的。

非常感谢你之前的回答。
标记:
    登录注册置评。