原理
模拟退火算法来源于固体退火原理,将固体加温至充分高,再让其徐徐冷却,加温时,固体内部粒子随温升变为无序状,内能增大,而徐徐冷却时粒子渐趋有序,在每个温度都达到平衡态,最后在常温时达到基态,内能减为最小。根据Metropolis准则,粒子在温度T时趋于平衡的概率为e(-ΔE/(kT)),其中E为温度T时的内能,ΔE为其改变量,k为Boltzmann常数。用固体退火模拟组合优化问题,将内能E模拟为目标函数值f,温度T演化成控制参数t,即得到解组合优化问题的模拟退火算法:由初始解i和控制参数初值t开始,对当前解重复“产生新解→计算目标函数差→接受或舍弃”的迭代,并逐步衰减t值,算法终止时的当前解即为所得近似最优解,这是基于蒙特卡罗迭代求解法的一种启发式随机搜索过程。退火过程由冷却进度表(Cooling Schedule)控制,包括控制参数的初值t及其衰减因子Δt、每个t值时的迭代次数L和停止条件S。
算法实现
模板代码
type fun(...args){ //状态函数用于计算答案.
.......
return value;
}
const double eps=1e-8;// 终止条件
void sa(){
double x=init_value;//初始化自变量,越接近目标答案越好.
double delta=0.997 //设置降温系数,0.7-0.99之间 越接近1得到的答案精度越高.
doulbe t=init_value;//设置初始温度t
double now=fun(x);//用来保存目前的答案.
ans=now;
while(t>eps){
double nx=x+(rand()*2-RAND_MAX)*t;// (rand*2-RAND_MAX)在[-RAND_MAX,RAND_MAX]之间.
double nf=fun(nx),de=nf-now;
if(de<0){ //如果更优的话,更新最优解.
x=nx,ans=now=nf;
}
else if(exp(-de/t)*RAND_MAX>rand()) x=nx; //多项式概率调整自变量.
t*=delta; //徐徐降温.
}
}
int main(){
srand(xxxx);
sa();
}
例题1:Strange fuction
code
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
typedef unsigned long long ull;
const int N=1e3+5,M=2e4+5,inf=0x3f3f3f3f,mod=1e9+7;
#define mst(a,b) memset(a,b,sizeof a)
#define PII pair<int,int>
#define fi first
#define se second
#define pb emplace_back
#define SZ(a) (int)a.size()
#define IOS ios::sync_with_stdio(false),cin.tie(0)
void Print(int *a,int n){
for(int i=1;i<n;i++)
printf("%d ",a[i]);
printf("%d\n",a[n]);
}
double y,ans;
const double eps=1e-8;
double f(double x){ //status function 状态函数.
return 6*pow(x,7.0)+8*pow(x,6.0)+7*pow(x,3.0)+5*pow(x,2.0)-y*x;
}
void sa(){
double x=50;//自变量初始值.
double now;//暂存答案
ans=now=f(x);
double t=100;//初始温度
double delta=0.997;//降温系数
while(t>eps){
double nx=x+(rand()*2-RAND_MAX)*t;
if(nx>=0&&nx<=100){ //首先要保证自变量在范围之内
double nf=f(nx),de=nf-now;
if(de<0){ //如果更优,则更新答案.
x=nx,now=ans=nf;
}
else if(exp(-de/t)*RAND_MAX>rand()) x=nx; //多项式概率,调整自变量.
}
t*=delta;//根据降温系数降温.
}
}
int main(){
int t;scanf("%d",&t);
srand(20010718); //随机一个时间种子.
while(t--){
scanf("%lf",&y);
sa();
printf("%.4f\n",ans);
}
return 0;
}
例题2:P1337
见下面文文章