
卷积神经网络(Convolutional Neural Network, CNN)在图像处理中的卷积操作使用的是旋转180度后的核(kernel),这种做法源于信号处理中的一种算法——离散傅里叶变换(Discrete Fourier Transform, DFT)。在本文中,我们将探讨为什么卷积神经网络需要使用旋转180度的卷积核。
首先,让我们简单回顾一下CNN中卷积操作的基础知识。CNN通过卷积层来提取图像特征,具体地说,卷积层通过对输入的图像进行卷积操作得到输出的特征图。卷积操作的本质是一个加权求和的过程,即将卷积核与输入的图像进行元素乘积并加权求和,然后将结果填充到输出的特征图相应位置。而在CNN中,卷积核的大小、步幅、填充方式等都是需要指定的超参数。不同的超参数组合可以使得卷积层提取到不同的特征,从而实现对图像的分类、目标检测等任务。
那么为什么要旋转卷积核呢?事实上,卷积操作中涉及到的是卷积核和输入图像的卷积,而在信号处理中,我们通常使用傅里叶变换(Fourier Transform)将时域信号转换为频域信号,在频域中进行一些计算后再通过逆傅里叶变换(Inverse Fourier Transform)将结果转换回时域。这种转换的好处在于可以更方便地对信号进行处理,例如将时域卷积转换为频域乘法,从而提高计算效率。
回到CNN中的卷积操作,我们发现其实也存在时域和频域的转换。具体来说,卷积操作中的输入图像可以看作是一个二维离散时域信号,而卷积核可以看作是一个二维离散滤波器。那么我们是否也可以将它们转换到频域中进行处理呢?
答案是肯定的。在频域中,卷积操作被称为“点乘”,即将两个信号在频域中对应位置的值相乘,并将结果求和得到输出信号。因此,如果我们想要在频域中进行卷积操作,就需要将卷积核旋转180度,然后进行点乘运算。
为了进一步理解这个过程,我们可以通过DFT来进行演示。DFT是一种将时域离散信号转换为频域离散信号的算法,其基本思想是将时域信号分解为不同频率的正弦波和余弦波组合而成。下面是一个简单的示例:
假设我们有一个长度为4的时域信号f[n]=[1,2,3,4],则其DFT可以表示为F[k],其中k=0,1,2,3。这个转换过程可以使用numpy库中的fft函数进行计算。
import numpy as np
# 定义时域信号
f = np.array([1, 2, 3, 4])
# 计算DFT
F = np.fft.fft(f)
print(F)
输出结果为:
[10.+0.j -2.+2.j -2.+0.j -2.-2.j]
其中,F[0]对应的是直流分量,即时域信号的平均值。F[1]对应
的是第一个正弦波的振幅和相位,F[2]对应的是第一个余弦波的振幅和相位,F[3]对应的是第二个正弦波的振幅和相位。
现在,我们将f[n]和一个长度为3的卷积核h[n]=[1,0,-1]进行卷积操作。根据卷积操作的定义,可以得到结果g[n]=[2,2,2,2]。我们也可以使用DFT来计算这个结果,并验证旋转180度后的卷积核是否能够实现频域中的点乘运算。
首先,我们需要将f[n]和h[n]通过零填充扩展到长度为6和4,这样可以使它们与DFT计算所需的长度相等。然后,我们分别计算它们的DFT,并将结果相乘得到输出信号G[k]。最后,我们通过逆DFT将G[k]转换回时域,得到卷积操作的输出g[n]。
import numpy as np
# 定义时域信号和卷积核
f = np.array([1, 2, 3, 4])
h = np.array([1, 0, -1])
# 将f[n]和h[n]进行零填充扩展
f_padding = np.pad(f, (0, 2), 'constant')
h_padding = np.pad(h, (0, 1), 'constant')
# 计算DFT
F = np.fft.fft(f_padding)
H = np.fft.fft(h_padding)
# 频域中的点乘运算
G = F * H
# 逆DFT回到时域
g = np.fft.ifft(G).real
print(g)
输出结果为:
[2. 2. 2. 2.]
可以看到,使用DFT计算得到的卷积操作的输出与直接计算得到的输出是一致的。这也说明了旋转180度后的卷积核确实能够在频域中实现点乘运算。
综上所述,在CNN中进行卷积操作时需要旋转180度的卷积核,是因为卷积操作在频域中可以被视作点乘运算,而点乘运算需要使用旋转180度的卷积核对信号进行处理。这种做法充分利用了傅里叶变换的性质,使得卷积操作的计算更加高效、简洁,从而提高了CNN在图像处理中的性能和效率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
剖析 CDA 数据分析师考试题型:解锁高效备考与答题策略 CDA(Certified Data Analyst)数据分析师考试作为衡量数据专业能力的 ...
2025-07-04SQL Server 字符串截取转日期:解锁数据处理的关键技能 在数据处理与分析工作中,数据格式的规范性是保证后续分析准确性的基础 ...
2025-07-04CDA 数据分析师视角:从数据迷雾中探寻商业真相 在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力,CDA(Certifie ...
2025-07-04CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03从招聘要求看数据分析师的能力素养与职业发展 在数字化浪潮席卷全球的当下,数据已成为企业的核心资产,数据分析师岗位也随 ...
2025-07-03Power BI 中如何控制过滤器选择项目数并在超限时报错 引言 在使用 Power BI 进行数据可视化和分析的过程中,对过滤器的有 ...
2025-07-03把握 CDA 考试时间,开启数据分析职业之路 在数字化转型的时代浪潮下,数据已成为企业决策的核心驱动力。CDA(Certified Da ...
2025-07-02CDA 证书:银行招聘中的 “黄金通行证” 在金融科技飞速发展的当下,银行正加速向数字化、智能化转型,海量数据成为银行精准 ...
2025-07-02探索最优回归方程:数据背后的精准预测密码 在数据分析和统计学的广阔领域中,回归分析是揭示变量之间关系的重要工具,而回 ...
2025-07-02CDA 数据分析师报考条件全解析:开启数据洞察之旅 在当今数字化浪潮席卷全球的时代,数据已成为企业乃至整个社会发展的核心驱 ...
2025-07-01深入解析 SQL 中 CASE 语句条件的执行顺序 在 SQL 编程领域,CASE语句是实现条件逻辑判断、数据转换与分类的重要工 ...
2025-07-01SPSS 中计算三个变量交集的详细指南 在数据分析领域,挖掘变量之间的潜在关系是获取有价值信息的关键步骤。当我们需要探究 ...
2025-07-01CDA 数据分析师:就业前景广阔的新兴职业 在当今数字化时代,数据已成为企业和组织决策的重要依据。数据分析师作为负责收集 ...
2025-06-30探秘卷积层:为何一个卷积层需要两个卷积核 在深度学习的世界里,卷积神经网络(CNN)凭借其强大的特征提取能力 ...
2025-06-30探索 CDA 数据分析师在线课程:开启数据洞察之旅 在数字化浪潮席卷全球的当下,数据已成为企业决策、创新与发展的核心驱 ...
2025-06-303D VLA新范式!CVPR冠军方案BridgeVLA,真机性能提升32% 编辑:LRST 【新智元导读】中科院自动化所提出BridgeVLA模型,通过将 ...
2025-06-30LSTM 为何会产生误差?深入剖析其背后的原因 在深度学习领域,LSTM(Long Short-Term Memory)网络凭借其独特的记忆单元设 ...
2025-06-27LLM进入拖拽时代!只靠Prompt几秒定制大模型,效率飙升12000倍 【新智元导读】最近,来自NUS、UT Austin等机构的研究人员创新 ...
2025-06-27探秘 z-score:数据分析中的标准化利器 在数据的海洋中,面对形态各异、尺度不同的数据,如何找到一个通用的标准来衡量数据 ...
2025-06-26Excel 中为不同柱形设置独立背景(按数据分区)的方法详解 在数据分析与可视化呈现过程中,Excel 柱形图是展示数据的常用工 ...
2025-06-26