从…开始的一些数学知识。
在我之前的帖子中,我给出了一个定义,现在我有义务详细说明,
图像可以定义为2D函数f(x,y),其中x和y是空间坐标,并且f在任何一对坐标处的振幅是在该点的强度或灰度级。
数字图像是由图像元素或像素组成的图像,每个图像元素或像素都具有表示其强度或灰度的有限且离散的数值数量。
在上面的10*10图像中,考虑原点为(0,0)-左下角,查看像素(7,3)。
如果黑色的强度为1,而白色的强度为0,则
每个像素可以用‘k’比特表示,并且将具有2^k个不同的亮度或灰度值。
‘k’的值称为位深度。
因此,如果有一个位深度为3的图像,那么我们将有8个不同的灰度级,而对于位深为8的图像,我们将有256个不同的灰度级。
位深度还有助于提高数字化的效率,并为我们提供尽可能接近真实事物的图像。我们得到了转换成图像的信号的更准确的表示。使我们能够记录信号中的细微变化。
这与我们如何增加小数点后的位数以提高测量精度相当。不要将其与图像分辨率混淆,图像分辨率是一个独立的概念。
为什么我们不能继续提高比特深度呢?在…上阅读
频道:
我们将需要定义每个像素的颜色值的数字的数量确定像素具有的通道的数量,例如,RGB图像中的每个像素具有3个通道,即红色、绿色和蓝色通道,每个通道具有灰度级,
因此,通过组合不同级别的红、绿和蓝,每个通道中像素的强度将最终决定像素的颜色。要想对这个主题有更多的直觉,请阅读这篇文章。this
一个大小为800×400、位深度为8的RGB图像总共有800x400x3=960,000像素,如果每个像素有8位,我们将得到一个大小为7,680,000位=960,000字节=960千字节的图像,这对此图像来说太多了。然而,这是图像的原始大小,它是未压缩的,我们可以使用各种压缩算法(如PNG和JPG)来压缩图像,以减小大小。
PNG图像在没有任何损失的情况下减小,因此质量更好,但尺寸更大,但JPG图像不是这样,它有一些损失,反而有助于通过更大的处理来减小尺寸。
什么是RGB信号?
有了您所阅读的内容,您现在应该能够理解视频是如何播放…的很简单,
上图显示了RGB信号的外观,连续更改像素的3个通道的值。
图像处理类型:
根据过程输出的不同,图像处理可以分为3种类型。
底层处理包括图像采集、图像增强、图像恢复、彩色图像处理等。
中层处理包括表示和描述、分割、目标识别等。
高级过程包括,Agent必须根据之前理解的关系对场景或图像做出响应的任务,这是一个不断发展的领域,通常与人工智能相关。然而,这一领域受到有限的计算能力的高度限制。
图像处理算法通常涉及大量的矩阵乘法运算,并且需要GPU来运行,这就是它变得昂贵的地方。
与卷积神经网络相关的一些算法可能需要几天甚至几周才能完成,这给程序员留下了非常低的错误容限。
图像是如何创建的?你为什么要知道这件事?请继续阅读我的下一篇博文…
原创文章,作者:fendouai,如若转载,请注明出处:https://panchuang.net/2021/07/14/%e6%95%b0%e5%ad%97%e5%9b%be%e5%83%8f%e5%a4%84%e7%90%863/