什么是计算机视觉?
计算机视觉是一个多学科的领域,专注于计算机如何从数字图像/视频中获得更高的理解。这是将人类视觉系统执行的活动自动化的一种尝试。这是发现、处理、分析和理解数字图像,并在现实世界中提取高质量数据的过程。
计算机视觉在现实世界中的一些应用包括-
自动驾驶汽车-需要计算机视觉才能实现自动驾驶汽车。特斯拉(Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪(Audi)等制造商使用多个摄像头、激光雷达、雷达和超声波传感器从大自然中捕捉图像,以便自动驾驶车辆可以检测物体、线条、标志和路标,以安全驾驶。
旅行和送货应用程序-在这个大流行时期,许多公司,如Uber Eats,Door Dash,Menu Log等都在他们的应用程序中加入了口罩检测功能。应用程序在检测到用户是否戴着口罩后打开。
实时运动跟踪-在板球、棒球、足球等运动中,篮球目标检测是在球上执行的。相机的焦点会自动移动到球要去的地方。此外,计算机视觉还有助于游戏和策略分析、玩家表现和评级。
医疗保健-拥有所有医学成像信息的90%,计算机在医疗实践中的应用范围很广。从赋予新的医疗诊断技术能力,到X射线分析、乳房X光照相和其他扫描,以识别问题和协助手术,我们的医疗设施和专家以及患者今天和未来都将从计算机视觉中受益。
和更多的…。
什么是OpenCV?
OpenCV是一个大型的开源计算机视觉、机器学习和图像处理库。通过使用它,人们可以处理照片和视频来识别对象、面孔或笔迹。
安装OpenCV
我们可以使用终端安装OpenCV2,如下所示:
pip install opencv-python
在IDE中导入OpenCV
import cv2
cv2.__version__
OpenCV基础知识
阅读图像
要使用OpenCV读取图像,我们需要使用内置函数imread()
img = cv2.imread(r'C:\Users\Hp\Desktop\nature.jpg',1)
在指定图像路径之后,我们可以传递flag的值。该标志可以采用三个值:
1-加载彩色图像。
0-加载灰度图像。
1-加载具有Alpha通道的图像。
显示图像
要使用OpenCV显示图像,我们需要使用内置函数imshow(),它在适合图像大小的窗口中显示图像。第一个参数是窗口名称-一个字符串;第二个参数是图像。
cv2.imshow('image',img)
cv2.waitKey(0)
waitKey(0)将无限显示窗口,直到任何按键。
划一条线
我们可以使用line()方法绘制一条线。这需要五个论点。首先是我们需要在其上绘制的图像,然后是线条的起始和结束坐标,然后是线条颜色和线条粗细。
img_black = np.zeros((512,512,3),np.uint8)
cv2.line(img_black,(0,0),(511,511),(255,0,0),5)
绘制矩形
与LINE类似,我们也可以使用Rectangle()方法绘制矩形。它取左上角和右下角的坐标。
cv2.rectangle(img_black,(100,320),(400,128),(0,255,0),3)
向图像添加文本
我们可以使用putText()方法在图像上显示文本。第一个参数是图像,然后是需要显示的文本、文本字符串左下角的坐标、字体类型、字体比例、颜色、粗细、线型(可选)、左下角原点(可选)。
cv2.putText(image, 'OpenCV', org, font, fontScale, color, thickness, cv2.LINE_AA)
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/06/16/%e4%bd%bf%e7%94%a8opencv%e7%9a%84%e8%ae%a1%e7%ae%97%e6%9c%ba%e8%a7%86%e8%a7%89%e5%85%a5%e9%97%a8/