京公网安备 11010802034615号
经营许可证编号:京B2-20210330
卷积神经网络(Convolutional Neural Network, CNN)在图像处理中的卷积操作使用的是旋转180度后的核(kernel),这种做法源于信号处理中的一种算法——离散傅里叶变换(Discrete Fourier Transform, DFT)。在本文中,我们将探讨为什么卷积神经网络需要使用旋转180度的卷积核。
首先,让我们简单回顾一下CNN中卷积操作的基础知识。CNN通过卷积层来提取图像特征,具体地说,卷积层通过对输入的图像进行卷积操作得到输出的特征图。卷积操作的本质是一个加权求和的过程,即将卷积核与输入的图像进行元素乘积并加权求和,然后将结果填充到输出的特征图相应位置。而在CNN中,卷积核的大小、步幅、填充方式等都是需要指定的超参数。不同的超参数组合可以使得卷积层提取到不同的特征,从而实现对图像的分类、目标检测等任务。
那么为什么要旋转卷积核呢?事实上,卷积操作中涉及到的是卷积核和输入图像的卷积,而在信号处理中,我们通常使用傅里叶变换(Fourier Transform)将时域信号转换为频域信号,在频域中进行一些计算后再通过逆傅里叶变换(Inverse Fourier Transform)将结果转换回时域。这种转换的好处在于可以更方便地对信号进行处理,例如将时域卷积转换为频域乘法,从而提高计算效率。
回到CNN中的卷积操作,我们发现其实也存在时域和频域的转换。具体来说,卷积操作中的输入图像可以看作是一个二维离散时域信号,而卷积核可以看作是一个二维离散滤波器。那么我们是否也可以将它们转换到频域中进行处理呢?
答案是肯定的。在频域中,卷积操作被称为“点乘”,即将两个信号在频域中对应位置的值相乘,并将结果求和得到输出信号。因此,如果我们想要在频域中进行卷积操作,就需要将卷积核旋转180度,然后进行点乘运算。
为了进一步理解这个过程,我们可以通过DFT来进行演示。DFT是一种将时域离散信号转换为频域离散信号的算法,其基本思想是将时域信号分解为不同频率的正弦波和余弦波组合而成。下面是一个简单的示例:
假设我们有一个长度为4的时域信号f[n]=[1,2,3,4],则其DFT可以表示为F[k],其中k=0,1,2,3。这个转换过程可以使用numpy库中的fft函数进行计算。
import numpy as np
# 定义时域信号
f = np.array([1, 2, 3, 4])
# 计算DFT
F = np.fft.fft(f)
print(F)
输出结果为:
[10.+0.j -2.+2.j -2.+0.j -2.-2.j]
其中,F[0]对应的是直流分量,即时域信号的平均值。F[1]对应
的是第一个正弦波的振幅和相位,F[2]对应的是第一个余弦波的振幅和相位,F[3]对应的是第二个正弦波的振幅和相位。
现在,我们将f[n]和一个长度为3的卷积核h[n]=[1,0,-1]进行卷积操作。根据卷积操作的定义,可以得到结果g[n]=[2,2,2,2]。我们也可以使用DFT来计算这个结果,并验证旋转180度后的卷积核是否能够实现频域中的点乘运算。
首先,我们需要将f[n]和h[n]通过零填充扩展到长度为6和4,这样可以使它们与DFT计算所需的长度相等。然后,我们分别计算它们的DFT,并将结果相乘得到输出信号G[k]。最后,我们通过逆DFT将G[k]转换回时域,得到卷积操作的输出g[n]。
import numpy as np
# 定义时域信号和卷积核
f = np.array([1, 2, 3, 4])
h = np.array([1, 0, -1])
# 将f[n]和h[n]进行零填充扩展
f_padding = np.pad(f, (0, 2), 'constant')
h_padding = np.pad(h, (0, 1), 'constant')
# 计算DFT
F = np.fft.fft(f_padding)
H = np.fft.fft(h_padding)
# 频域中的点乘运算
G = F * H
# 逆DFT回到时域
g = np.fft.ifft(G).real
print(g)
输出结果为:
[2. 2. 2. 2.]
可以看到,使用DFT计算得到的卷积操作的输出与直接计算得到的输出是一致的。这也说明了旋转180度后的卷积核确实能够在频域中实现点乘运算。
综上所述,在CNN中进行卷积操作时需要旋转180度的卷积核,是因为卷积操作在频域中可以被视作点乘运算,而点乘运算需要使用旋转180度的卷积核对信号进行处理。这种做法充分利用了傅里叶变换的性质,使得卷积操作的计算更加高效、简洁,从而提高了CNN在图像处理中的性能和效率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 SQL Server 安装、服务启动、数据库文件操作等场景中,经常会遇到 “实例已在使用” 类报错,不同触发场景的原因与处理方式差 ...
2026-06-29在Excel数据统计、财务核算、销售复盘、库存盘点等办公场景中,经常需要在数据透视表中实现一列数据乘以另一列数据的计算需求, ...
2026-06-29在数据分析中,指标是连接业务与数据的核心语言。它并非一个简单的数字,而是一个将模糊的业务需求(如“提升用户粘性”)转化为 ...
2026-06-29【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18