沙龙国际网址多少

 
2018模式識別會議心得體會
发布时间:2018-09-28   浏览次数:13


2018年8.20-8.24日,由中國自動化協會和中國科學院自動化研究所主辦的第24屆模式識別國際會議在北京召開。此次會議集結了來自世界各地的從事模式識別相關方向的權威和精英,共同討論模式識別、機器學習和計算機視覺領域的最新進展以及在各個領域的應用,是從事模式識別相關方向人士的一屆盛會。

大會邀請了六位模式識別方向的權威專家做主講報告,我有幸聆聽學習:

1)来自香港科技大学的权龙教授,主讲题目为“The Challenges of 3D Reconstruction with Deep Learning”。最近,他与香港科技大学的毕业生一起创建了zure.com,這是世界上第一個通過無人機和智能手機照片轉化成3D的门户网站。在权龙教授的主讲报告中,回顾了计算机视觉的发展。然后,重点介绍了在深度视觉学习和三维重建方面的最新突破。权教授展示了在大规模数百平方公里的高层都市区和不发达的农村地区,无人驾驶飞机的重建方法。还演示了由香港科技大学团队开发和资助的在线云平台和门户网站www.zure.com,几乎可以与流行的Google Earth相竞争!

2)来自美国Ford Motor Company的K. Venkatesh Prasad,其主讲题目为“Automobiles and Mobility Solutions”。2011年,Dr Prasad构建了业界首个开源硬件和开源软件平台OpenXC,这是一个“创新者工具包”,于2013年推出,如今已是福特员工以及世界各地的研究人员和实验人员用于设计,测试和发布产品的工具之一。随着人类智慧,想象力和创造力不断创造,机器智能的进步,沙龙国际网址多少有了新的方式来满足地球的移动需求。沙龙国际网址多少拥有大约76亿的世界人口和巨大的人力和机器智能,沙龙国际网址多少有机会创造与从“A”到“B”旅行相关的新颖体验和相关服务。在很大程度上要归功于模式识别,计算机视觉和图像处理方面的进步,汽车变得“聪明”并且越来越智能地意识到周围环境,世界也变得“聪明”。在Dr prasad的演讲中,概述了解决人员移动需求的背景下,机器智能应用的一些关键应用领域。

3)来自美国微软的毛建昌博士,其主讲题目为“Achieving Human Parity Performance in Pattern Recognition and Language Understanding by Machines”。Dr Mao是微软Bing广告市场和服务,人工智能和研究部门的企业副总裁。近年来,随着深度学习的突破,由于计算能力的快速提升,大数据和机器学习算法的进步,这些系统的最新性能的进步已经获得了强劲的势头。今天,人工智能的突破正在加速。计算机系统在若干感知和认知任务上的表现已达到人类平等。例如,2015年,微软研究人员在ImageNet计算机视觉挑战赛中获得了96%的准确率,这与斯坦福大学的研究生一样好。不到一年之后,微软的语音识别系统在Switchboard数据集上实现了5.1%的错误率,这与转录的专业人士相当。在Dr Mao的报告中,展示了微软的同声翻译系统,其精确程度已经达到了与人类相当的程度。Dr Mao简要描述了微软团队在这些任务上实现过程以及突破的技术,并介绍深度学习的其他应用,例如在无约束环境和广告中的OCR等。

4)来自美国Google, Inc.的Ashok Popat ,其主讲报告为“Advice to  a promising OCR Researcher”.Dr popat 毕业于麻省理工学院,在Google参与多个项目的开发,包括Books,Translate和OCR等。文档分析和识别仍然是一个充满活力和挑战性的领域,涵盖和涉及多个领域,包括模式识别,计算机视觉,语言学,数字人文学等。Dr popat近期的研究工作重点为OCR(光学字符识别系统),在本次演讲中,

Dr popat将从导师、同事以及其他相关部门(包括麻省理工学院,施乐帕洛阿尔托研究中心和谷歌)收到的一些建议介绍给大家,并将Google团队在OCR开发实践过程中的经验也与大家做了分享。

5)來自南京大學的周志華教授,其主講題目爲“An Exploration to Non-NN Style Deep Learning”。周志華教授的大名早已如雷貫耳,他的經典著作“西瓜書”,曾是初識學習機器學習的入門教材,這次有幸能現場聆聽周教授的報告並進行交流,非常的榮幸。深度學習是近幾年來的熱門話題。通常,“深度學習”一詞被認爲是“深度神經網絡(DNN)”的同義詞。周教授在報告中,闡述了深度學習的基本要素,並分析它不一定是通過神經網絡來實現的。然後,將NON-NN風格的深度學習進行探索的過程做了介紹,其中構建塊是不可微分的模塊,並且訓練過程不依賴于反向傳播。在周教授的報告中,對最近的工作進展做了彙報,受益匪淺。

6)来自Oxford University的Alison Noble,其主讲报告为“Human Intelligence, Artificial Intelligence and How They Are Changing Ultrasound Image Analysis”。Alison Noble是英國牛津大學生物醫學工程研究所的知名教授其團隊的主要工作是對超聲圖像分析的研究。 Professor Alison Noble是一名令人敬佩的科学家,其获得荣誉不计其数,她多年致力于为不发达国家的妇女及婴幼儿提供超声影像服务,并根据其当地实际情况,研究开发超声图像分析的关键技术。超声成像在临床实践中被广泛使用,但需要专业知识来获取图像并对其进行解释。应用于成像的机器学习的最新进展正在改变分析超声图像并从超声图像和视频中提取临床有用信息的方式。在报告中,Alison Noble介绍了应用于超声图像分析的机器学习方面的一些工作,以及在实际应用过程中的一些挑战,并突出了一些新型的研究课题。

另外,大會主辦方也組織了多個分會場,例如:learning based vision, image processing, machine learning and classification, deep learning, structural pattern recognition,3D vision, biometric analysis and synthesis, document image analysis, medical image analysis, object detection等等。根据自己的工作,我将重点放在了以下几个分会场。

1、Medical Image Analysis

He W等在报告中提出了一种在体育锻炼过程基于可穿戴设备的心率评估算法。在算法中应用了基于心率的VMD(variational mode decomposition),随后采用后验处理代替原来的MA(motion artifacts)。该算法在2015 IEEE信号处理数据集上获得了较高的精确率和可信度,也预示了在基于可穿戴设备技术的健康监测方面的应用潜力。心率不齐是由于心脏自律性异常或者传导障碍引起的心动过速或者过缓,有几种类型的心律不齐是有害并且非常危险的,有的甚至能在短时之内造成死亡,并且发病率呈年轻化趋势。最传统的检测方法是单独使用心电图或者与超声心动图,压力测试等其他检测技术相结合。Sara S等在报告中提出了一种基于机器学习方法的心率不齐分类方法。该方法使用了ECG信号在时域和光谱域的纹理进行检测和分类,并且在MIT-BIH数据集上获得了99.81%的准确率,98.17的敏感性和99.98%的特异性,优于目前已有的检测方法,增强了心率不齐的检出率。针对传统自闭症儿童检测方法昂贵、费时、依赖于医生的主观经验等弊端,Li J等提出了一种利用原始视频数据自动识别自闭症儿童的方法。首先采用眼动跟踪方法获得受试者的眼动轨迹,然后采用累积直方图分析这些轨迹,并对其进行降维。最后通过SVM进行分类。该团队的工作还包括收集了189例视频数据集,期中53例ASD患者以及136例正常儿童。所提出的方法在该数据集上获得93.7的精确率,能够有效的识别出ASD儿童。神经影像已经被广泛的应用于复杂脑部结构的神经性病变分析,但是数据集的不平衡性导致的高维特征集和有限的样本数量是诊断任务的重大挑战。Lei HJ等人提出了一种稀疏的低秩学习框架进行帕金森患者(PD)的自动检测。在算法中建立一个正则化矩阵特征网络,根据局部聚类系数获得特征权重,并通过特征选择筛选出最相关特征集用以验证PD患者的不同阶段。该算法在PPMI数据集上获得了理想的分类性能,并优于传统的分类方法。对于乳腺癌的计算机辅助检测方法来说,有丝分裂的精确检测以及技术是非常重要的,这项耗时乏味的工作通常需要病理学家手工完成,并且还会导致人工的误差。另外在二值分类问题中,FN和FP这两个指标过高也是计算机辅助检测面临的问题。MA M等人在报告中提出了一种基于多尺度和相似性预测网络的二阶段检测方法。在第一阶段,采用FNR模型融合多个子模型的输出产生可能的候选者,用来降低假阴性指标。第二阶段FPR模型扩大了边缘约束来降低假阳性指标,并获得最后的检测结果。在2014和2012ICPR MITOSIS数据集上,该算法获得优于现有算法的较高回归率和F-score。

2、Object Detection

Jeong J在报告中提出了一种选择集成深度网络结构用来进行人群密度估计。该结构有两个子网络构成:一个学习稀疏密度区域和一个学习密集密度区域。来自两个子网络结构的局部估计密度通过门控网络选择性的组合在一起,来估计初始的人群密度分布。此外,在训练过程中还提出了一种新颖的自适应的损失方案来处理人群边界的模糊问题。经过实验验证,该方法提高了人群密度估计的准确率。遮挡问题一直是目标检测与跟踪过程中不可忽视的问题,即使使用DNN,也很难检测到重度遮挡的目标。Kataoka H采用了基于相机阵列系统的图像再聚焦技术,消除噪音的影响。该团队收集了基于相机阵列系统的再聚焦数据集(RHDB),并采用基于单眼相机的HOG+SVM方法,图像再聚焦技术的使用提高了10.1%的准确率。将图像再聚焦和AlexNet方法融合,在RHDB上再次实验获得94.6%的准确率。Jyoti S在报告中提出了一种基于深度学习的视线方向估计算法。首先,由面部局部基准点提取几何学特征,并以此训练DNN。接着用纹理特征训练三个CNN网络。最后四个通道的信息进行串联融合,并训练全连接层进行最后的视线预测。所提出的方法在两个公开数据集上进行了实验,实验效果优于现有的一些视线估计算法。CNN在视觉跟踪方面表现出了优异的性能,但是也存在费时、计算复杂度高、以及过拟合的风险。Du YH在报告中提出了一种目标自适应的LSTM网络,可以有效地利用序列依赖关系并动态适应目标变化。另外报告中提出了一种方案选择的有效策略,首先使用基于快速匹配的方法预先评估基于密度采样的proposals,然后选择精心挑选的高质量的proposals到序列特定的LSTM网络进行学习。这种策略保证了所提出的方法能够自适应的跟踪任意目标并且在执行效率上优于基于传统CNN的目标跟踪方法。

3、Deep Learning

Kingkan C等人在报告中提出了学习点云潜在空间的框架,并将它们映射到3D形状。将点云直接作为输入,并生成其对应目标的符号距离函数(SDF)。报告中证明了潜在空间的维度会影响网络的性能,因为它决定了从编码器到生成器可以传递多少信息。利用点云的局部和全局特征的模型可以正确地重建具有平滑表面特性的相应SDF,并提供了定性结果评估。VGGNet是广泛用于图像分类的一种有效方法。目前大多数方法使用单一类型的特征,并且传统的融合方法采用了的是多种人工创建的特征。因此,在遥感领域获得有效的多层特征是仍然是一大挑战。Muhammad U等人在报告中介绍了一种基于典型相关分析和4层SVM分类器的有效框架来处理这一问题。具体而言,预训练的VGGNet被用作深度特征提取器,以提取遥感场景图像的中级和深级特征。然后,选择由VGGNet生成的两个卷积(中级)和两个全连接层,其中每个层被视为单独的特征描述符。接下来,典型相关分析作为特征融合策略改善所提取的特征。最后用SVM构建图像的4层表示。实验结果表明,所提出的方法即使在不经过图像增强、微调以及编码的情况下,仍然获得了显著的性能。为了获得更好的性能,卷积网络趋向于更深入地发展。但是,网络深度的增加导致计算复杂度的线性增长,但不能带来分类精度的等效增加。为了缓解这种不一致性,Zheng W等人在报告中提出了一种加速深度卷积神经网络分类的级联方法。通过利用熵度量来分析正确和错误分类图像之间基本网络的统计差异,将易于区分的图像分配给浅层网络以降低计算复杂度,并将难以分类的图像留给深层网络以维持整体性能。此外,所提出的级联网络可以利用不同网络之间的互补性,再度提高分类精度。Zhao KK等人在报告中提出了一种新的启发式训练程序,以帮助深度神经网络(DNN)逃离局部最小值并趋向更优解。此方法需要多次重复以下步骤:随机重新初始化聚合DNN的最后一层的权重,同时保留剩余层的权重,然后进行新一轮的训练。其动机是使新一轮的训练基于前一轮学到的“好”初始参数以便学习到更好的参数。基于上述方法所得的多个随机初始化的DNN,可以获得与更准确和多样化的DNN集成。近年来,已经研究出了各种贪婪算法用于稀疏信号恢复。 然而,它们中的大多数利用基于L2範數的損失函數並且對非高斯噪聲和異常值敏感。Wang YL等人在报告中提出了一种Cauchy匹配追踪CauchyMP)算法,用于鲁棒的稀疏表示和分类。 通过利用基于Cauchy估计器的损失函数,所提出的方法可以稳健地学习各种严重噪声破坏的嘈杂数据的稀疏表示。 作为一种贪心算法,CauchyMP在计算上也是有效的。 该团队还开发了基于CauchyMP的分类器,用于稳健分类,并应用于人脸识别,获得了显著地应用效果。

深度學習已經爲計算機視覺、語音識別、自然語言處理等方面帶了巨大的進步。當前的研究前沿包括引入外部知識,如知識圖譜等;深度學習與傳統方法的結合,如遷移學習與神經網絡的結合,強化學習與神經網絡的結合等;無監督的深度生成模型,以及新的網絡結構與訓練方法等。個人建議以下兩點:(1)基礎的內容要深入學習,所涉及的數學知識,編程工具,算法思想,要熟練掌握才能開展後續科研工作,同時也要多讀相關方面的優秀論文,開拓思想。(2)以項目消化基礎內容,要開展項目,不能僅限于紙上談兵。可以先從一個簡單項目開始,理清思路,熟悉流程,繼而再進行創新。所需要學習的東西還很多,任重而道遠。

  

                                                                                秦彩杰

                                                                                2018.9.11