使用二进制精度(Acc-2)、7 级精度(Acc-7)和 F-Score 作为评估指标。 结果如表 3 和表 4 所示,方法在这些极具挑战性和竞争性的数据集上,始终优于以前的方法。 例如,与以前性能最好的方法 MISA 相比,Acc-7 在 MOSI 上从 42.3 上升到 43.3,从 52.2 上升到MOSEI 52.7。 结果发现,在不优化负样本的情况下统一设置 αk 会导致 NYUv2 语义分割任务的 mIoU 下降 1.7%,SUN RGB-D 3D 对象检测任务的 mAP 下降 0.5%,MOSI 上的 Acc-7 下降 0.6,Acc-7 下降 0.4在 MOSEI 上。 结果显示,使用这四种模式,达到了 52.6 Acc-7,仅比以前低 0.1%。
DLF 在 MSA 领域最权威的两个数据集 CMU-MOSI 和 CMU-MOSEI 上进行了验证: 超越经典:在与 MISA、MulT、DMD 等 11 种主流方法的对比中,DLF 在几乎所有指标(Acc
平均绝对误差(MAE)、7类别准确度(ACC-7)和2类别准确度(ACC-2)用于多模态情感分析。WA和加权F1分数 (WF1) 用于对话中的情绪识别。
(4)评价标准CMU-MOSI和CMU-MOSEI:均方误差(MSE)、平均绝对误差(MAE)、Pearson相关性(Corr)、二元精度(Acc-2)、F-Score(F1)和多级精度(Acc-7和Acc5