研究目的
研究像素N-gram特征与视觉词袋(BoVW)特征在糖尿病视网膜病变图像自动分类中的性能表现,重点关注其在智能手机等受限设备上的计算效率。
研究成果
像素N-gram特征计算高效,在乳腺X光片、纹理和形状分类中表现优异,与BoVW相当,但在糖尿病视网膜病变分类中性能欠佳。无免费午餐定理和IBIS论证框架对此作出解释,表明数据集特定属性(如确定性、帕累托原则、抽象层级)会影响性能。未来工作包括预处理视网膜图像、探索特征值比例及应用深度学习。
研究不足
与BoVW方法相比,像素N-gram特征在糖尿病视网膜病变图像上的表现欠佳,这可能是由于缺乏预处理(如去除视盘和血管)、数据集不平衡,或无法捕捉复杂视网膜图像中的多层次抽象信息所致。计算限制使得N值只能取较小范围(1-4),以避免产生过大的特征向量。
1:实验设计与方法选择:
本研究比较了像素N-gram特征与BoVW特征在图像分类中的表现。像素N-gram通过提取水平和垂直方向上N个连续灰度像素强度序列,经归一化后作为分类器输入;BoVW特征则从SIFT、SURF、HOG和LTP等局部描述符生成视觉词典。采用的分类器包括SVM、MLP和KNN,通过交叉验证和F值指标评估性能。
2:样本选择与数据来源:
数据集包含Lake Imaging的乳腺X光片(80幅:20例边界清晰肿块、20例毛刺状肿块、40例正常)、UIUC纹理库图像、人工生成的几何形状图像(不同尺寸位置的圆形/方形/三角形),以及糖尿病视网膜病变图像(筛查诊所提供的272例轻度、124例中度、47例重度、450例无DR图像,分辨率2048×1360像素)。
3:实验设备与材料清单:
使用MATLAB软件进行图像处理(裁剪/缩放),DICOM呈现状态对象标注乳腺X光片,标准计算硬件用于特征提取与分类。
4:实验流程与操作步骤:
乳腺X光片经双三次插值统一至最低分辨率,在病灶区域或中心裁剪140×140像素ROI,灰度级降至8阶,提取N=1-4的像素N-gram特征并归一化计数后训练分类器;视网膜病变图像转为灰度后计算3-gram计数,经归一化后采用SVM分类器配合10折交叉验证。
5:数据分析方法:
通过F值、真阳性率、假阳性率及交叉验证(留一法/10折)评估性能,并与直方图、Haralick和BoVW特征进行对比。
独家科研数据包,助您复现前沿成果,加速创新突破
获取完整内容