1、傅里叶公式

一维:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_频域

一维逆变换公式:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_频域_02

M×N图像的二维离散傅里叶变换:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_#include_03

从公式上可以看出,F(u,v)所对应的不是某一个f(x,y)而是所有的f(x,y)与e^(-j2TT(ux/M+vy/N))的乘积的和。从opencv的代码实现来看:u、v的值与原图大小m、n一致。

M×N图像的傅里叶变换:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_#include_04

 

2、空间域 、频域

傅里叶变换的理论基础任一函数都可以表示成 无数 个正弦和余弦函数的和的形式。傅里叶变换就是一个将函数分解的工具。

容易理解,从一维的公式来看,是随负无穷到正无穷的随着x变化累加起来的和。然后根据欧拉公式:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_傅里叶变换_05

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_#include_06

相加推断出:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_傅里叶变换_07

这里 涉及到傅里叶变换公式的推断,这里就不详述了,可参考其他博客。总之,利用 欧拉公式采用实数或者虚数(频域)来表示无数个正余弦相加。

在运用傅里叶变换的时候一般数据是离散的,即离散傅里叶变换,如图像的傅里叶变换。

傅里叶变换是将空间域 转化为 频域,那空间域和频域有什么关系,着一直是我们很难理解的地方,幸好上面博客中的一张图让我很好的理解了:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_#include_08

左边为频域,右边为空间域(无数个正余弦累加)

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_傅里叶变换_09

因此进行傅里叶变换后的图像需要实数图像虚数图像 或者 幅度图像相位图。根据上面的图我们知道进行傅里叶变换后有2部分:实数部分 虚数部分。 pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_傅里叶变换_10为 相位谱,幅度为圆的半径(类似于 xy坐标 和圆角坐标系)

F(w)=R(w)+iI(w)

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_#include_11

频谱、幅度:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_傅里叶变换_12

能量谱:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_频域_13

相位谱:

pytorch实现RGB图像的傅里叶变换和反变换 opencv傅里叶变换_傅里叶变换_14

 

下面是opencv3 编程入门的代码:

//--------------------------------------【程序说明】-------------------------------------------
//		程序说明:《OpenCV3编程入门》OpenCV2版书本配套示例程序28
//		程序描述:离散傅里叶变换
//		开发测试所用IDE版本:Visual Studio 2010
//		开发测试所用OpenCV版本:	3.0 beta
//		2014年11月 Created by @浅墨_毛星云
//		2014年12月 Revised by @浅墨_毛星云
//------------------------------------------------------------------------------------------------



//---------------------------------【头文件、命名空间包含部分】-----------------------------
//		描述:包含程序所使用的头文件和命名空间
//-------------------------------------------------------------------------------------------------
#include "opencv2/core/core.hpp"
#include "opencv2/imgproc/imgproc.hpp"
#include "opencv2/highgui/highgui.hpp"
#include <iostream>
using namespace cv;


//-----------------------------------【ShowHelpText( )函数】----------------------------------
//		 描述:输出一些帮助信息
//----------------------------------------------------------------------------------------------
void ShowHelpText()
{
	//输出欢迎信息和OpenCV版本
	printf("\n\n\t\t\t非常感谢购买《OpenCV3编程入门》一书!\n");
	printf("\n\n\t\t\t此为本书OpenCV3版的第28个配套示例程序\n");
	printf("\n\n\t\t\t   当前使用的OpenCV版本为:" CV_VERSION );
	printf("\n\n  ----------------------------------------------------------------------------\n");
}



//--------------------------------------【main( )函数】-----------------------------------------
//          描述:控制台应用程序的入口函数,我们的程序从这里开始执行
//-------------------------------------------------------------------------------------------------
int main( )
{

	//【1】以灰度模式读取原始图像并显示
	Mat srcImage = imread("1.jpg", 0);
	if(!srcImage.data ) { printf("读取图片错误,请确定目录下是否有imread函数指定图片存在~! \n"); return false; } 
	imshow("原始图像" , srcImage);   

	ShowHelpText();

	//【2】将输入图像延扩到最佳的尺寸,边界用0补充
	int m = getOptimalDFTSize( srcImage.rows );
	int n = getOptimalDFTSize( srcImage.cols ); 
	//将添加的像素初始化为0.
	Mat padded;  
	copyMakeBorder(srcImage, padded, 0, m - srcImage.rows, 0, n - srcImage.cols, BORDER_CONSTANT, Scalar::all(0));

	//【3】为傅立叶变换的结果(实部和虚部)分配存储空间。
	//将planes数组组合合并成一个多通道的数组complexI
	Mat planes[] = {Mat_<float>(padded), Mat::zeros(padded.size(), CV_32F)};
	Mat complexI;
	merge(planes, 2, complexI);         

	//【4】进行就地离散傅里叶变换
	dft(complexI, complexI);           

	//【5】将复数转换为幅值, sqrt(Re(DFT(I))^2 + Im(DFT(I))^2)
	split(complexI, planes); // 将多通道数组complexI分离成几个单通道数组,planes[0] = Re(DFT(I), planes[1] = Im(DFT(I))
	magnitude(planes[0], planes[1], planes[0]);// planes[0] = magnitude  
	Mat magnitudeImage = planes[0];

	//【6】幅值范围不在屏幕显示范围,
//进行对数尺度(logarithmic scale)缩放 即=>log(1 + sqrt(Re(DFT(I))^2 + Im(DFT(I))^2))
	magnitudeImage += Scalar::all(1);
	log(magnitudeImage, magnitudeImage);//求自然对数

	//【7】剪切和重分布幅度图象限
	//若有奇数行或奇数列,进行频谱裁剪      
	magnitudeImage = magnitudeImage(Rect(0, 0, magnitudeImage.cols & -2, magnitudeImage.rows & -2));
	//重新排列傅立叶图像中的象限,使得原点位于图像中心  
	int cx = magnitudeImage.cols/2;
	int cy = magnitudeImage.rows/2;
	Mat q0(magnitudeImage, Rect(0, 0, cx, cy));   // ROI区域的左上
	Mat q1(magnitudeImage, Rect(cx, 0, cx, cy));  // ROI区域的右上
	Mat q2(magnitudeImage, Rect(0, cy, cx, cy));  // ROI区域的左下
	Mat q3(magnitudeImage, Rect(cx, cy, cx, cy)); // ROI区域的右下
	//交换象限(左上与右下进行交换)
	Mat tmp;                           
	q0.copyTo(tmp);
	q3.copyTo(q0);
	tmp.copyTo(q3);
	//交换象限(右上与左下进行交换)
	q1.copyTo(tmp);                 
	q2.copyTo(q1);
	tmp.copyTo(q2);

	//【8】归一化,用0到1之间的浮点值将矩阵变换为可视的图像格式
	//此句代码的OpenCV2版为:
	//normalize(magnitudeImage, magnitudeImage, 0, 1, CV_MINMAX); 
	//此句代码的OpenCV3版为:
	normalize(magnitudeImage, magnitudeImage, 0, 1, NORM_MINMAX); 

	//【9】显示效果图
	imshow("频谱幅值", magnitudeImage);    
	waitKey();

	return 0;
}