Chisao: GPU原生并行多模态黑箱优化器，100%模态恢复

概览

在优化、贝叶斯推断和科学计算领域，寻找多模态黑箱函数的所有模态（即局部最优解）是一个基础性挑战。传统方法如盆地跳跃（basin-hopping）、CMA-ES、多起点梯度下降等通常以顺序方式运行，无法充分利用现代GPU的大规模并行计算能力。为此，研究者提出了一种名为 Chisao（Convergence-Halt-Invert-Stick-And-Oscillate）的GPU原生群体优化器，旨在通过一种巧妙的收敛-反收敛振荡循环来同时探索多个局部最优解，并有效避免陷入局部陷阱。

核心创新

Chisao的核心设计思想是“不对称”：在优化过程中，样本群体中的一部分样本在达到真实峰值时会被“冻结”（即固定下来）并保留，而其余样本则继续通过基于动量的反收敛机制和随机平滑梯度进行探索。这种设计确保了已发现的模态不会被后续迭代破坏，同时保持了对未探索区域的搜索能力。

为了维持群体多样性，Chisao引入了两种互补的自适应重采样策略：Repulse Monkey（斥猴策略）和 Golden Rooster（金鸡策略）。前者通过排斥已收敛样本周围的点来避免重复搜索，后者则随机注入新样本以增加多样性。

性能表现

在Simon Fraser大学优化基准套件的全部42个函数上，覆盖维度 $d \in {2, 4, 8, 16, 32, 64}$，Chisao实现了以下突破：

100%模态恢复率：在最具挑战性的多模态函数上，当维度 $d \geq 8$ 时，所有CPU基线方法均失效，而Chisao依然能100%找到所有模态。
显著加速：在所有方法都能成功的函数上（如Michalewicz函数，$d=64$），Chisao比盆地跳跃方法快 34倍；在单模态函数上（如Rotated Hyper-Ellipsoid，$d=64$），纯GPU带来的加速比高达 39倍。
噪声鲁棒性：在似然噪声标准差高达1.0的情况下，模态检测依然保持100%可靠。

值得注意的是，所有基准测试均仅通过函数值进行评估（梯度通过有限差分计算），因此报告的加速比代表了无导数情况下的最差表现，实际使用中若利用自动梯度，性能可能更高。

行业意义

Chisao的出现为高维、多模态黑箱优化问题提供了一种全新的并行解决方案。传统方法在高维空间中往往遭遇“维度灾难”，而Chisao通过GPU并行和独特的振荡机制，有效缓解了这一问题。该算法已在PyPI上以独立开源Python包的形式发布，有望在机器学习超参数调优、科学计算中的参数反演、贝叶斯推断中的后验采样等领域发挥重要作用。

总结

Chisao通过GPU原生并行和收敛-反收敛振荡设计，在多模态黑箱优化中实现了100%模态恢复和数十倍的加速，为高性能计算与优化算法的结合提供了新思路。

Chisao：一种通过收敛-反收敛振荡实现多模态黑箱函数优化的GPU原生并行优化器

概览

核心创新

性能表现

行业意义

总结

延伸阅读

相关资讯