上一讲中,我们了解了python打开图片的方法,当图片被读入内存后,我们便可以对图像按照自己的意愿进行处理了(它的本质就是一个数组,对应于数学中的矩阵)。对于一些常见的图像操作,我们可以自己来编写处理方法,也就是自己造轮子,但这样做有一个弊端——会让我们陷入各种编程技巧的汪洋大海中。我们编程的目的是为了处理图像,所以我们只应关注算法本身。为了避免让更多的人重复造轮子,本文的主角——opencv(上图为opencv Logo)诞生了,它是由英特尔(就是造PC处理器的那家)主导的一个开源项目(由C&C++编写),它里面提供了大量的图像操作方法及处理算法。太科罗技的前三期视频中介绍了opencv C语言版本的一些简单应用。本文就将介绍如何在python中使用opencv算法库。
YOLOV3算法解读
在yolov3前,还有yolov2以及yolo 2个版本,YOLO 的核心思想是用整张图作为网络的输入,直接在输出层回归 bounding box(边界框) 的位置及其所属的类别,由于yolo前2个版本的缺陷,作者发布了第三个版本yolov3,其yolov3在不同训练集上的速度与精确度远远大于Faster R-CNN,ResNet,SSD等训练算法,yolo算法的发布便引起了大家的广泛关注