一、引言

  哈喽大家好,有一段时间没更新Blog了,最近身体不太舒服哈,今天开始继续更了。言归正传,这次要讲的是“粒子群算法”。这个算法是由两个科学家在1995年,根据对鸟类捕食行为的研究所得到启发而想出来的。好的,接下来让我们开始吧。

二、鸟类捕食行为

用python实现粒子群算法_粒子群算法

 

  鸟妈妈有7个鸟宝宝,有一天,鸟妈妈让鸟宝宝们自己去找虫子吃。于是鸟宝宝们开始了大范围的捕食行为。一开始鸟宝宝们不知道哪里可以找得到虫子,于是每个鸟宝宝都朝着不同的方向独自寻找。

  但是为了能够更快的找到虫子吃,鸟宝宝们协商好,谁发现了虫子,就互相说一声。

  找了一会,终于有一个鸟宝宝(称之为小蓝),似乎发现在他附近不远处有虫子的踪迹。于是它传话给其他鸟宝宝,其他鸟宝宝,收到消息后,边开始改变轨迹,飞到小蓝这边。最终,随着小蓝越来越接近虫子。其他虫宝宝也差不多都聚集到了小蓝这边。最终,大家都吃到了虫子。

三、粒子群算法

3.1 故事分析

  鸟宝宝捕食的故事,正是这个粒子群算法存在的原因。因此,如果想更好的了解粒子群算法,我们就要来分析鸟宝宝捕食的故事。首先,我们来分析分析鸟宝宝们的运动状态,即鸟宝宝自身是怎么决定自己的飞翔速度和位置的。

惯性”——当前的速度$v_{current}$是一个因素。

认知”——经验,也是一个因素。

社会共享”,这也是鸟宝宝在移动时考虑的一个因素。

同伴分享的信息,而对于捕食经验高的鸟宝宝,则更看重自己的经验。因此,我们的公式,在“认知”和“社会共享”这部分,是具有随机性的。

3.2 公式表达

  我们的粒子群算法是这样的:

解,称之为“粒子”,而我们的虫子,就是我们问题的最优解。也就是说,鸟宝宝捕食过程,也就是所有的粒子在解空间内寻找到最优解的过程。

  (2) 每一个粒子,都由一个fitness function来确定fitness value,以此来确定粒子位置的好坏。(这个其实就是模仿鸟宝宝的“经验”判断部分,通过fitness function来确定这个位置是不是所谓的贫瘠地或是虫子可能出现的位置)。

  (3) 每一个粒子被赋予了记忆功能,能够记忆所搜寻过的最佳位置。

  (4) 每一个粒子都有一个速度以及决定飞行的距离和方向,这个根据它本身的飞行经验和同伴共享的信息所决定。

  现在,在d维空间中,有n个粒子。其中:

  粒子i的位置:

$X_{i} = (x_{i1}, x_{i2}, \cdot \cdot \cdot, x_{id})$

  粒子i的速度:

$V_{i} = (v_{i1}, v_{i2}, \cdot \cdot \cdot, v_{id})$

  粒子i所搜寻到的最好的位置(personal best):

$Pbest_{id} = (pbest_{i1}, pbest_{i2}, \cdot \cdot \cdot, pbest_{id})$

  种群所经历的最好的位置(global best):

$Gbest_{d} = (gbest_{1}, gbest_{2}, \cdot \cdot \cdot, gbest_{d})$

  另外,我们要给我们的粒子速度和位置做一个限制,毕竟我们不希望鸟宝宝的速度过快或者以及飞出我们要搜寻的范围。因此对于每个粒子i,有:

$X_{i} \in [X_{min}, X_{max}]$

$V_{i} \in [V_{min}, V_{max}]$

根据前面的分析,我们可以写出下面两条公式:

  • 在d维空间中,粒子i的速度更新公式为:

$V_{i}^{k} = wV_{i}^{k-1}+c_{1}rand()\left (Pbest_{i} - X_{i}^{k-1} \right ) + c_{2}Rand() \left( Gbest_{i} - X_{i}^{k-1} \right )$

  • 在d维空间中,粒子i的位置更新公式为:

$X_{i}^{k} = X_{id}^{k-1}+ V_{i}^{k-1}$

   在上式中,上标k-1和k表示粒子从k-1次飞行操作到下一次飞行操作的过程。

惯性”、“认知”、“社会共享”这三大块。而rand()和Rand()分别给“认知”和“社会共享”提供随机性,即每个粒子对这两部分的看重是不一样的。其中c_{1}和c_{2}是我们自己加的,表示我们自己对这两部分的分量的控制。另外w是一个惯性的权重,是用于调节对解空间的搜索范围。关于这个w的出现还有一段历史,大家感兴趣的可以去查查论文,这里就不细讲了。

  (2) 接着是位置更新公式,这部分很简单,我们都知道$x = x_{0} + vt$。可是这里为什么少了个$t$呢,这里我们可以简单理解为从k-1次飞行到下一次飞行,耗费了一个单位时间$t$,因此就没有$t$出现了。

  好了,上面那两个公式就是粒子群算法的核心了。

3.3 算法流程

  (1) Initial:

  初始化粒子群体(群体规模为n),每个粒子的信息包括随机位置和随机速度。

  (2) Evaluation

  根据fitness function,算出每个粒子的fitness value。

  (3) Find the Pbest

  对于每个粒子,将其当前的fitness value与历史最佳的位置(Pbest)所对应的fitness value做比较。若当前的fitness value更高,则将当前的位置更新Pbest。

  (4) Find the Gbest

  对于每个粒子,将其当前的fitness value与群体历史最佳的位置(Gbest)所对应的fitness value做比较。若当前的fitness value更高,则将当前的位置更新Gbest。

  (5) Update the Velocity and Position:

  根据公式更新每个粒子的速度和位置

  (6) 如果未找到最佳值,则返回步骤2。(若达到了最佳迭代数量或者最佳fitness value的增量小于给定的阈值,则停止算法)

四、粒子群算法Matlab代码示例

4.1 利用粒子群算法计算一元函数的最大值


%% 题目1:利用粒子群算法计算一元函数的最大值

%% I. 清空环境
clc
clear all

%% II. 绘制目标函数曲线图
x = 1: 0.01: 2;
y = sin(10*pi*x) ./ x;
figure
plot(x, y)
hold on

%% III. 参数初始化
c1 = 1.49445;
c2 = 1.49445;

maxgen = 50;                                        % 进化次数(迭代次数)  
sizepop = 10;                                       % 种群规模(粒子数数目)
dimension = 1;                                      % 这里因为是一元函数的求解,即一维,故列数为1
% 速度的边界
Vmax = 0.5;
Vmin = -0.5;
% 种群的边界
popmax = 2;
popmin = 1;
% 用于计算惯性权重,经验值
ws = 0.9;
we = 0.4;

% 给矩阵预分配内存
pop = zeros(sizepop, dimension);
V = zeros(sizepop, dimension);
fitness = zeros(sizepop, 1);
yy = zeros(maxgen);
w = zeros(maxgen);
%% IV. 产生初始粒子和速度
for i = 1: sizepop
    % 随机产生一个种群
    pop(i, :) = (rands(1) + 1) / 2 + 1;             % 初始种群
    V(i, :) = 0.5 * rands(1);                       % 初始化速度
    % 计算适应度
    fitness(i) = fun(pop(i, :));   
end

%% V. 初始化Personal best和Global best
[bestfitness, bestindex] = max(fitness);
gbest = pop(bestindex,:);                           % Global best
pbest = pop;                                        % 一开始的个体数据都是最佳的
fitnesspbest = fitness;                             % 个体最佳适应度值
fitnessgbest = bestfitness;                         % 全局最佳适应度值

%% VI. 迭代寻优
for i = 1: maxgen                                   % 迭代循环
    w(i) = ws - (ws - we) * (i / maxgen);           % 让惯性权重随着迭代次数而动态改变,控制搜索精度
    for j = 1: sizepop                              % 遍历所有粒子
        % 速度更新
        V(j, :) = w(i)*V(j, :) + c1*rand*(pbest(j, :) - pop(j, :)) + c2*rand*(gbest - pop(j, :));
        if V(j, :) > Vmax
            V(j, :) = Vmax;
        end
        if V(j, :) < Vmin
            V(j, :) = Vmin;
        end
        
        % 种群更新(位置更新)
        pop(j, :) = pop(j, :) + V(j, :);
        if pop(j, :) > popmax
            pop(j, :) = popmax;
        end
        if pop(j, :) < popmin
            pop(j, :) = popmin;
        end
        
        % 适应度值更新
        fitness(j) = fun(pop(j, :)); 
    end
    
    for j = 1: sizepop    
        % 个体最优更新
        if fitness(j) > fitnesspbest(j)
            pbest(j, :) = pop(j, :);
            fitnesspbest(j) = fitness(j);
        end
        
        %群体最优更新
        if fitness(j) > fitnessgbest
            gbest = pop(j, :);
            fitnessgbest = fitness(j);
        end
    end 
    yy(i) = fitnessgbest;                               % 记录每次迭代完毕的群体最优解
end

%% VII. 输出结果并绘图
[fitnessgbest gbest]                                    % 输出数据
figure
plot(yy)
title('最优个体适应度', 'fontsize',12);
xlabel('进化代数', 'fontsize', 12);
ylabel('适应度', 'fontsize',12);


  其中,适应值函数被封装到fun.m中,如下:



function y = fun(x) % 函数用于计算粒子适应度值 %x input 输入粒子 %y output 粒子适应度值 y = sin(10 * pi * x) / x;



  运行上述代码,得到的数据和图如下:



ans = 0.9528 1.0490



用python实现粒子群算法_初始化_02

  可以看到,红点处正是我们函数的最大值处。

4.2 利用粒子群算法计算二元函数的最大值



%% 题目2: 利用粒子群算法计算二元函数的最大值

%% I. 清空环境
clc
clear

%% II. 绘制目标函数曲线
figure
[x, y] = meshgrid(-5: 0.1: 5, -5: 0.1: 5);
z = x.^2 + y.^2 - 10*cos(2*pi*x) - 10*cos(2*pi*y) + 20;
mesh(x,y,z)
hold on


%% III. 参数初始化
c1 = 1.49445;
c2 = 1.49445;

maxgen = 1000;                                                  % 进化次数  
sizepop = 100;                                                  % 种群规模
dimension = 2;                                                  % 这里因为是二元函数的求解,即二维,故列数为2

% 速度的边界
Vmax = 1;
Vmin = -1;
% 种群的边界
popmax = 5;
popmin = -5;
% 用于计算惯性权重,经验值
ws = 0.9;
we = 0.4;

% 给矩阵预分配内存
pop = zeros(sizepop, dimension);
V = zeros(sizepop, dimension);
fitness = zeros(sizepop, 1);
yy = zeros(maxgen);
w = zeros(maxgen);
%% IV. 产生初始粒子和速度
for i = 1: sizepop
    % 随机产生一个种群
    pop(i, :) = 5 * rands(1, 2);                                % 初始种群
    V(i, :) = rands(1, 2);                                      % 初始化速度
    % 计算适应度
    fitness(i) = fun(pop(i, :));
end

%% V. 初始化Personal best和Global best
[bestfitness, bestindex] = max(fitness);
gbest = pop(bestindex, :);                                      % Global best
pbest = pop;                                                    % 个体最佳
fitnesspbest = fitness;                                         % 个体最佳适应度值
fitnessgbest = bestfitness;                                     % 全局最佳适应度值

%% VI. 迭代寻优
for i = 1: maxgen
    w(i) = ws - (ws - we) * (i / maxgen);                       % 让惯性权重随着迭代次数而动态改变,控制搜索精度    
    for j = 1: sizepop
        % 速度更新
        V(j, :) = w(i)*V(j, :) + c1*rand*(pbest(j, :) - pop(j, :)) + c2*rand*(gbest - pop(j, :));
        for k = 1: dimension
            if V(j, k) > Vmax
                V(j, k) = Vmax;
            end
            if V(j, k) < Vmin
                    V(j, k) = Vmin;
            end
        end
        
        % 种群更新(位置更新)
        pop(j, :) = pop(j, :) + V(j, :);
        for k = 1: dimension
            if pop(j, k) > popmax
                pop(j, k) = popmax;
            end
            if pop(j, k) < popmin
                pop(j, k) = popmin;
            end
        end
        % 适应度值更新
        fitness(j) = fun(pop(j, :)); 
    end
    
    for j = 1: sizepop    
        % 个体最优更新
        if fitness(j) > fitnesspbest(j)
            pbest(j, :) = pop(j, :);
            fitnesspbest(j) = fitness(j);
        end
        
        %群体最优更新
        if fitness(j) > fitnessgbest
            gbest = pop(j, :);
            fitnessgbest = fitness(j);
        end
    end 
    yy(i) = fitnessgbest;                                           % 记录每次迭代完毕的群体最优解
end
%% VII.输出结果
[fitnessgbest, gbest]
plot3(gbest(1), gbest(2), fitnessgbest, 'bo','linewidth', 1.5)

figure
plot(yy)
title('最优个体适应度', 'fontsize', 12);
xlabel('进化代数', 'fontsize', 12);
ylabel('适应度', 'fontsize', 12);



其中,适应值函数被封装到fun.m中,如下:



function y = fun(x)
%函数用于计算粒子适应度值
%x           input           输入粒子 
%y           output          粒子适应度值 
y = x(1).^2 + x(2).^2 - 10*cos(2*pi*x(1)) - 10*cos(2*pi*x(2)) + 20;



  运行上述代码,得到的数据和图如下:



ans = 80.7066 4.5230 4.5230



用python实现粒子群算法_粒子群算法_03

  可以看到,图中标注的地方是我们求得的最大值处。其实我们知道,对于这个函数,因为是对称的,所以4个点都是同样的最大值,这就是粒子群算法的缺点了。很容易陷入局部最优解。因为我们的粒子群算法其实并不知道什么是最优解,它只是让粒子不断的找一个相对之前所有的解都是最好的一个解。所以,这样的粒子群算法是有局限性的,用的时候要根据场合来选择。