1. Python实现基于遗传算法的排课优化
排课问题的本质是将课程、教师和学生在合适的时间段内分配到合适的教室中,涉及到的因素较多,是一个多目标的调度问题,在运筹学中被称为时间表问题(Timetable Problem,TTP)。设一个星期有n个时段可排课,有m位教师需要参与排课,平均每位教师一个星期上k节课,在不考虑其他限制的情况下,能够推出的可能组合就有 种,如此高的复杂度是目前计算机所无法承受的。因此众多研究者提出了多种其他排课算法,如模拟退火,列表寻优搜索和约束满意等。
Github : https://github.com/xiaochus/GeneticClassSchele
遗传算法(Genetic Algorithm)是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。遗传算法的流程如下所示:
遗传算法首先针对待解决问题随机生成一组解,我们称之为种群(Population)。种群中的每个个体都是问题的解,在优化的过程中,算法会计算整个种群的成本函数,从而得到一个与种群相关的适应度的序列。如下图所示:
为了得到新的下一代种群,首先根据适应度对种群进行排序,从中挑选出最优的几个个体加入下一代种群,这一个过程也被称为精英选拔。新种群余下的部分通过对选拔出来的精英个体进行修改得到。
对种群进行修改的方法参考了生物DAN进化的方法,一般使用两种方法: 变异 和 交叉 。 变异 的做法是对种群做一个微小的、随机的改变。如果解的编码方式是二进制,那么就随机选取一个位置进行0和1的互相突变;如果解的编码方式是十进制,那么就随机选取一个位置进行随机加减。 交叉 的做法是随机从最优种群中选取两个个体,以某个位置为交叉点合成一个新的个体。
经过突变和交叉后我们得到新的种群(大小与上一代种群一致),对新种群重复重复上述过程,直到达到迭代次数(失败)或者解的适应性达到我们的要求(成功),GA算法就结束了。
算法实现
首先定义一个课程类,这个类包含了课程、班级、教师、教室、星期、时间几个属性,其中前三个是我们自定义的,后面三个是需要算法来优化的。
接下来定义cost函数,这个函数用来计算课表种群的冲突。当被测试课表冲突为0的时候,这个课表就是个符合规定的课表。冲突检测遵循下面几条规则:
使用遗传算法进行优化的过程如下,与上一节的流程图过程相同。
init_population :随机初始化不同的种群。
mutate :变异操作,随机对 Schele 对象中的某个可改变属性在允许范围内进行随机加减。
crossover :交叉操作,随机对两个对象交换不同位置的属性。
evolution :启动GA算法进行优化。
实验结果
下面定义了3个班,6种课程、教师和3个教室来对排课效果进行测试。
优化结果如下,迭代到第68次时,课程安排不存在任何冲突。
选择1203班的课表进行可视化,如下所示,算法合理的安排了对应的课程。
2. 进化算法简介
进化算法,作为一类"算法簇",其灵感源于大自然的生物进化,具有高鲁棒性和广泛适用性,成为了一种成熟的全局优化方法。相比传统的基于微积分的方法和穷举法,进化计算具备自组织、自适应、自学习的特性,能够灵活应对传统优化算法难以解决的复杂问题。
进化算法包括遗传算法、进化程序设计、进化规划和进化策略等,它们共享简单遗传算法的基本框架,但在进化方式上存在显着差异。选择、交叉、变异、种群控制等关键步骤各有变化。进化算法的进化流程如图所示,直观展示了算法的核心步骤。
关于收敛性,进化算法在文献[9]中被证明,在保留最优个体的策略下,通用的进化计算是收敛的。然而,关于收敛性的具体结果大多是从遗传算法中推导而来。
在交叉操作的重视程度上,遗传算法倾向于将其视为核心操作,而视变异操作为辅助手段。然而,进化规划和进化策略则认为,从一般意义上讲,交叉操作并不优于变异操作,甚至可以不依赖交叉操作。
3. 遗传算法理解
遗传算法是一种进化算法,进化是什么哪?就是种群逐渐适应生存环境,种群中个体不断得到改良的过程。
遗传算法是一种对生物遗传的模拟、在算法中,初始化一个种群,种群中的每个染色体个体都是一种解决方案,我们通过适应性fitness来衡量这个解决方案的好坏。并对它们进行选择、变异、交叉的操作,找到最优的解决方案。
总结一下遗传算法的基本的步骤:
1.初始化一个种群,并评估每条染色体所对应个体的适应度。
2.选择、交叉、变异,产生新的种群
3.再评估每个个体的适应值,如果适应值达到要求或者达到最大循环次数,否则重复2,不断产生新种群。
知道了GA的大致流程之后、来具体分析一下细节,怎么实现吧
我们知道遗传算法起源于生物遗传,因此在种群中每个个体就是一个染色体,那如何对染色体进行编码,让它表示我们的解决方案那(就是把现实要优化的参数用编码表示成一个染色体)。这里就遇到了一个编码、解码的问题,我们将需要优化的目标编码成染色体,然后再解码为我们可以用来计算fitness的解;
一般在进行参数优化时,一般有两种方式:实数编码、二进制编码
实数编码:基因直接用实数进行表示,这样的表示方法比较简单,不用特意解码了,但是在交叉和变异时,容易过早收敛,陷入局部最优。
二进制编码:将基因用二进制的形式表示,将参数的值转化为二进制形式,这样交叉、变异时更好操作,多样性好,但是占用的存储空间大,需要解码。
染色体就称为个体。对于一次实验,个体就是需要优化参数的一种解、许多这样的个体就构成了种群。
在面对群体中那么多个体时,如何判断个体的好坏呢,就是通过适应值函数了,将解带入适应值函数,适应值越大、解越好。
在遗传算法中,我们怎么使得里面的个体变得越来越优秀呢?
核心思想就是:选择优秀的、淘汰不好的,并且为了生成更好的解,我们要尝试交叉、变异,带来新的解。
选择就是从当前的种群中选择出比较好的个体、淘汰不好的个体
常见的选择方法有:轮盘赌选择、锦标赛选择、最佳保留选择等等
轮盘赌选择就是根据每个个体fitness和种群所有fitness之和比较,确定每个个体被选中的概率,然后进行n次选择,选择n个个体构成新种群,是一种放回抽样的方式。
锦标赛就是每次从种群中选择m个个体,选择最优的,放入新种群,重复选择,直到新种群中个体数目达到n。
最佳保留选择就是在轮盘赌的基础上,将fitness个体先加进新种群,因为轮盘赌是一种概率模型,可能存在最优个体没有进入新种群的情况。
在选择之后,就要考虑产生新的、更优秀的解,为种群带来新的血液。遗传算法的思路是交叉两个优秀的解,往往get好的解。
交叉通过在经过选择的种群中,随机选择一对父母,将它们的染色体进行交叉,生成新的个体,替代原来的解。
常用的交叉方法有:单点交叉、多点交叉等等。
交叉就像生物里面,染色体交换基因一样的~但是并不是种群中所有个体都进行交叉的,实现时可以,设置一个交叉率和交叉概率,随机选择种群中两个体、随机一个数,小于交叉率就进行交叉操作,并根据交叉概率判断交叉的程度,从而生成新个体,反之就保留这两个体。
变异也是一种产生新个体的方式,通过改变个体上基因,期望产生更好的解。比如在以二进制编码的个体上,将里面的0、1进行等位变化啥的,就是0变1、1变0这样。同样也要考虑变异率、变异产生的新解是不可控的,可能很好,也可能很坏,不能像交叉一样,确保一定的效果,所以往往变异率设置的比较小。
4. 遗传算法原理与应用实例的目录
第1章 绪论
1.1 从生物进化到遗传算法
1.2 遗传算法的描述
1.3 表示方案的实例
1.3.1 工程设计的最优化
1.3.2 人工蚁问题
1.4 遗传算法的特点
1.5 遗传算法的发展简史
1.6 遗传算法的研究内容及前景
1.7 遗传算法的应用
第2章 遗传算法的基本原理
2.1 复杂系统的适应过程
2.1.1 复杂系统的适应性
2.1.2 适应过程的数学模型
2.2 遗传算法的基本描述
2.2.1 整体优化问题
2.2.2 遗传算法的基本流程
2.2.3 遗传编码
2.2.4 适应函数(评价函数)
2.2.5 遗传算子
2.2.6 群体设定
2.2.7 初始化群体
2.2.8 终止循环的条件
2.2.9 标准遗传算法的流程
2.2.10 控制参数和选择
2.2.11 遗传算法的性能评估
2.3 遗传算法的模式理论
2.3.1 模式与模式空间
2.3.2 模式生存模型
2.3.3 双臂赌机分析
2.3.4 基因模块假设
2.3.5 模式处理与隐含并行性
2.3.6 模式处理与遗传算子的性能
2.4 遗传算法与其他搜索技术的比较
2.4.1 启发式随机搜索技术的基本功能
2.4.2 局域搜索技术
2.4.3 模拟退火算法
2.4.4 遗传算法搜索
2.4.5 启发式搜索技术比较
2.5 遗传算法计算实例
2.5.1 单调连续函数
2.5.2 One-Max函数
2.5.3 皇家大道问题
2.6 遗传算法杂交率与变异率关系的研究
2.6.1 研究方法简述
2.6.2 算例
2.6.3 应用
2.6.4 结论
第3章 遗传算法数学机理分析
3.1 遗传算法的基本定理
3.2 隐含并行性
3.3 Walsh模式变换
3.3.1 Walsh函数
3.3.2 用Walsh函数表示模式平均适应度
3.3.3 Walsh系数与异位显性(epistasis)
3.4 非均匀Walsh模式变换
3.5 最小欺骗问题
3.6 遗传算法欺骗问题的分析与设计
……
第4章 解连续优化问题的遗传算法
第5章 分布式遗传算法研究
第6章 遗传算法的实现技术
第7章 遗传算法应用实例
参考文献