摘要:手术流程识别可以监控手术过程,提高在外科手术时的安全性,也可以应用到手术质量评估和手术训练系统当中。针对手术视频中场景模糊、复杂性高、流程差异大,且传统手术流程识别方法依赖手工注释、效率低下等问题,提出了一种基于卷积神经网络(Convolutional Neural Networks, CNN)与双向长短期记忆(Bidirectional Long Short-Term Memory,BiLSTM)网络融合的手术流程自动识别方法。该方法利用卷积神经网络提取手术视频的空间特征,并通过双向长短期记忆网络捕捉手术阶段序列的时间依赖关系,解决了相邻帧高相关性导致的误识别问题。采用了中值滤波器和数据增强技术增强模型的泛化能力,并通过Adam优化器提升训练效率。在Cholec80数据集上对模型进行验证,离线模式下的手术流程识别准确率达96.16%,在线模式下的准确率为91.84%。实验结果表明,所提出的手术流程识别模型准确率高,能够为手术机器人流程识别提供显著结果方案。