计算机视觉

无论是医疗诊断、无人车、摄像监控还是智能滤镜,计算机视觉领域的诸多应用都与我们当下和未来的生活息息相关。近年来,深度学习技术深刻推动了计算机视觉系统性能的提升。可以说,当下最先进的计算机视觉应用几乎离不开深度学习。

我们在“卷积神经网络”一章中已经介绍了计算机视觉领域常使用的深度学习模型,并实践了简单的图像分类任务。本章中,我们先进一步介绍图像增广(image augmentation)和微调(fine tuning)的方法,并将它们应用于图像分类。然后,我们会探究目标检测(object detection)的各类方法。之后,我们将了解如何使用全卷积网络对图像做语义分割(semantic segmentation)。接下来,我们再解释如何使用样式迁移技术生成像本书封面一样的图像。最后,我们在两个计算机视觉的重要数据集上实践本章和前几章的内容。