EI、Scopus 收录
中文核心期刊

基于扩散模型的高阶拓扑绝缘体实时设计

徐志昂, 骆嘉晨, 丁相贵, 杜宗亮, 郭旭

徐志昂, 骆嘉晨, 丁相贵, 杜宗亮, 郭旭. 基于扩散模型的高阶拓扑绝缘体实时设计. 力学学报, 2024, 56(7): 1840-1848. DOI: 10.6052/0459-1879-23-617
引用本文: 徐志昂, 骆嘉晨, 丁相贵, 杜宗亮, 郭旭. 基于扩散模型的高阶拓扑绝缘体实时设计. 力学学报, 2024, 56(7): 1840-1848. DOI: 10.6052/0459-1879-23-617
Xu Zhi'ang, Luo Jiachen, Ding Xianggui, Du Zongliang, Guo Xu. Real-time design of higher-order topological insulators by diffusion model. Chinese Journal of Theoretical and Applied Mechanics, 2024, 56(7): 1840-1848. DOI: 10.6052/0459-1879-23-617
Citation: Xu Zhi'ang, Luo Jiachen, Ding Xianggui, Du Zongliang, Guo Xu. Real-time design of higher-order topological insulators by diffusion model. Chinese Journal of Theoretical and Applied Mechanics, 2024, 56(7): 1840-1848. DOI: 10.6052/0459-1879-23-617
徐志昂, 骆嘉晨, 丁相贵, 杜宗亮, 郭旭. 基于扩散模型的高阶拓扑绝缘体实时设计. 力学学报, 2024, 56(7): 1840-1848. CSTR: 32045.14.0459-1879-23-617
引用本文: 徐志昂, 骆嘉晨, 丁相贵, 杜宗亮, 郭旭. 基于扩散模型的高阶拓扑绝缘体实时设计. 力学学报, 2024, 56(7): 1840-1848. CSTR: 32045.14.0459-1879-23-617
Xu Zhi'ang, Luo Jiachen, Ding Xianggui, Du Zongliang, Guo Xu. Real-time design of higher-order topological insulators by diffusion model. Chinese Journal of Theoretical and Applied Mechanics, 2024, 56(7): 1840-1848. CSTR: 32045.14.0459-1879-23-617
Citation: Xu Zhi'ang, Luo Jiachen, Ding Xianggui, Du Zongliang, Guo Xu. Real-time design of higher-order topological insulators by diffusion model. Chinese Journal of Theoretical and Applied Mechanics, 2024, 56(7): 1840-1848. CSTR: 32045.14.0459-1879-23-617

基于扩散模型的高阶拓扑绝缘体实时设计

基金项目: 国家自然科学基金(12002073, 12372122)和辽宁省应用基础研究计划(2023JH2/101600044)资助项目
详细信息
    通讯作者:

    杜宗亮, 副教授, 主要研究方向为结构优化和先进结构设计. E-mail: zldu@dlut.edu.cn

  • 中图分类号: O369

REAL-TIME DESIGN OF HIGHER-ORDER TOPOLOGICAL INSULATORS BY DIFFUSION MODEL

  • 摘要: 作为一种全新的波控工具, 高阶拓扑绝缘体可以将能量鲁棒高效地局域化在低维空间, 且对缺陷不敏感. 在光子和声子系统中, 高阶拓扑绝缘体的快速设计仍然是一项挑战. 采用移动可变形孔洞法显式描述${C_{4{\text{v}}}}$对称的单胞构型, 并结合能带理论和对称指标刻画其性能(拓扑性质和非平凡带隙宽度). 在此基础上, 构建了包含几何参数、无量纲化带隙宽度与拓扑性质指标的高阶拓扑绝缘体数据集, 并提出了一种基于去噪扩散概率模型(denoising diffusion probabilistic model, DDPM)的实时设计框架. 相比采用其他生成式模型的设计框架, DDPM有效避免了训练不稳定和生成保真度低等问题. 该框架可以精准且快速地按目标需求或最大化带隙宽度逆向设计力学高阶拓扑绝缘体, 在单机上生成所需设计的平均相对误差在3.5%以内, 平均耗时仅需0.01 s, 相比传统逆向设计方法效率提升6 ~ 7个数量级. 通过使用Wasserstein距离度量逆向设计样本的多样性, 该框架相较基于深度学习代理模型的优化设计结果, 表现出更高的生成结果多样性. 此外, 所得设计具有显式描述的几何信息, 可以直接与CAD/CAE软件结合, 避免了隐式描述算法中的后处理步骤. 这种基于DDPM的实时设计框架可扩展应用于多物理场拓扑材料和其他类型超材料的逆向设计, 并为构建声子和光子拓扑材料的数据库提供了基础.
    Abstract: As a novel tool for wave manipulation, higher-order topological insulators can efficiently and robustly localize energy in low-dimensional space, exhibiting insensitivity to defects. Nevertheless, the fast design of higher-order topological insulators in photonic and phononic systems is still a challenge. In the present work, C4v-symmetric continuum unit cells are explicitly described by the moving morphable voids method, and the concerned properties (topological properties and non-trivial bandgap width) are measured by the band theory and symmetry indicators. Based upon these, a dataset of higher-order topological insulators is constructed, incorporating geometric parameters, normalized bandgap width, and topological property indicators. A real-time design paradigm is proposed utilizing a denoising diffusion probabilistic model (DDPM). Compared to design paradigms using other generative models, DDPM effectively avoids issues such as training instability and low fidelity in generation. This paradigm enables accurately and fast inverse design of mechanical higher-order topological insulators based on target requirements or maximizing the non-trivial bandgap width. Applying this developed inverse design paradigm, the average relative error for generating the desired designs on a desktop computer is within 3.5%, with an average generation time of only 0.01 seconds, which significantly improves the design efficiency by 6 to 7 orders of magnitude compared with the traditional inverse design methods. By using the Wasserstein distance to measure the diversity of inverse design results, this paradigm exhibits higher diversity compared to the optimization design results obtained by deep learning based surrogate model. In addition, the generated designs have explicitly described geometric information, so they can be directly integrated with CAD/CAE software, avoiding the post-processing step required in implicit description methods. This real-time design paradigm based on DDPM can be easily extended to inverse design of multi-physical topological materials and other types of metamaterials, laying the foundation for constructing databases for photonic and phononic topological materials.
  • 拓扑绝缘体的边界态因受拓扑不变量保护而具有对缺陷免疫的优势, 这为设计优异性能的器件提供了全新范式[1]. 高阶拓扑绝缘体的体-边对应关系保证了拓扑态出现于更低维度, 例如, 二维材料的角态[2]. 由于宏观连续单胞提供了更大的设计自由度及更易观察的拓扑效应, 光学、声学和力学高阶拓扑绝缘体研究得到了越来越多的关注[3-5]. 因此, 针对连续型高阶拓扑绝缘体发展系统和高效优化设计框架, 兼具科学意义和工程应用前景.

    拓扑优化作为可以系统理性地在给定设计域内寻求最佳材料分布的设计方法, 已成功应用于光学、声学和力学拓扑绝缘体的优化设计[6-9]. 这些工作虽然发展了拓扑绝缘体逆向设计的有效方法并获得了多个创新设计构型, 但优化求解过程中需要对中间设计进行大量分析, 带来了较高的计算成本. 近年来, 随着人工智能的迅速发展, 机器学习在拓扑绝缘体的快速设计方面展现出了突出优势. 对于高阶拓扑绝缘体, Du等[10]采用显式拓扑优化方法描述${C_{4{\text{v}}}}$对称的连续单胞模型, 并训练了多任务学习模型, 由单胞几何参数同时预测无量纲化带隙位置与拓扑不变量标签. 进一步, 结合反向传播与全局优化算法, 仅需约40 s即可完成一次高阶拓扑绝缘体的逆向设计, 实现了优化设计效率提升3 ~ 4个数量级. 还有一些类似的工作应用神经网络建立参数与关心性能之间的代理模型, 通过外层优化实现拓扑绝缘体的高效设计[11-13]. 然而就作者所知, 目前尚没有直接对应于拓扑绝缘体逆向设计的机器学习模型.

    由于逆向设计问题往往存在“一对多”的特点, 传统的全连接神经网络(实际上对应输入到输出间的非线性函数)难以直接应用. 为解决这一问题, 研究人员通常采用生成对抗网络(generative adversarial network, GAN)和变分自编码器(variational autoencoder, VAE)等生成式模型, 并已在超材料设计中取得了成功应用[14-18]. 然而, GAN存在模式崩溃和训练损失难以收敛的问题; VAE由于其编码器需要将高维数据压缩至低维潜空间, 可能导致生成结果模糊且缺乏细节. 这些缺点使得它们在应用于精准性的逆向设计问题时面临一定挑战.

    去噪扩散概率模型(denoising diffusion probabilistic models, DDPM)于2020年首次被引入计算机视觉领域[19], 被认为可能是GAN和VAE的替代方案. 其通过学习逆转对原始样本渐进加噪的过程, 以生成符合规律的新样本和高质量的图像[20-21]. 近来, 已有少量工作展示了DDPM在超材料设计方面的应用: Vlassis等[22]将包含材料性质的特征向量作为嵌入条件, 生成了具有目标力学响应的微观结构图像, 但训练所用的数据集并非真实微观结构; Zhang等[23]利用DDPM根据目标电磁响应生成超表面结构图像. 然而, 所得图像在仿真分析或实际应用中还需要进一步处理, 如光滑化和二值化等. 直接使用DDPM生成单胞的几何参数将极大提升拓扑材料的设计效率和应用便利性, 然而相关研究仍较为欠缺, 这也是本工作的研究动机.

    本文首先使用移动可变形孔洞方法(moving morphable void, MMV)[24]显式描述${C_{4{\text{v}}}}$对称的连续单胞模型, 并构建了包含单胞几何参数、无量纲化带隙宽度与拓扑性质指标的高阶拓扑绝缘体数据集. 通过逐渐向单胞几何参数施加噪声直至其分布演化为标准高斯分布, 接着采用DDPM学习去噪过程. 将目标带隙宽度与拓扑标签编码成特征向量, 并采用无分类器的条件引导策略(classifier-free diffusion guidance)[25], 即可使用DDPM实现精确快速生成高阶拓扑绝缘体. 在台式计算机上, 仅需约0.01 s即可获得目标需求的高阶拓扑绝缘体设计, 且所得设计带隙宽度较精确仿真结果的平均相对误差仅为2.56%. 同等计算资源下, 优化设计效率相比基于多任务学习的快速设计方法提升约4000倍[10]. 本文提出的基于DDPM的高阶拓扑绝缘体逆向设计框架概述如图1所示.

    图  1  基于DDPM的高阶拓扑绝缘体逆向设计框架概述
    Figure  1.  Overview of proposed HOTIs inverse design paradigm utilizing DDPM

    相对于拓扑绝缘体的离散单胞模型[26-29], 连续单胞模型具有更大的设计空间, 有利于充分发掘拓扑绝缘体的性能. 然而, 这随之带来了更大的设计自由度, 增加了逆向设计的复杂性与挑战. 在拓扑优化领域, 为了解决设计变量繁多、设计结果难以直接导入CAD/CAE系统等问题, Zhang等[24]提出了一种基于移动可变形孔洞(moving morphable void, MMV)的显式拓扑优化方法. 该方法的基本思想是通过封闭的三次样条曲线描述孔洞边界, 通过孔洞的移动、变形和交叠来实现拓扑优化. 类似于Du等[8], 本文应用MMV方法实现连续单胞模型的高阶拓扑绝缘体显式几何描述.

    本文考虑边长为$1{\text{ m}}$的正方形单胞 1, 由环氧树脂(基体材料, ${E_0} = 4.35{\text{ GPa}}$, ${\nu _0} = 0.37$, ${\rho _0} = 1180{\text{ kg}}/{{\text{m}}^3}$)和钢(散射体, ${E_1} = 200{\text{ GPa}}$, ${\nu _1} = 0.3$, ${\rho _1} = 7800 {\text{kg}}/{{\text{m}}^3}$)组成. 其中散射体的边界由MMV方法采用三次样条曲线显式描述. 如图2所示, 对于${C_{4{\text{v}}}}$对称的单胞, 将散射体固定在几何中心, 并通过其$1/8$部分边界对应的3个控制点的半径矢量${\boldsymbol{r}} = {({r_1},{r_2},{r_3})^{\mathrm{T}} }$及对应的22个插值点确定整个单胞的几何形状.

    图  2  由3个控制点和22个插值点描述的${C_{4{\text{v}}}}$对称单胞模型(绿色: 环氧树脂, 橙色: 铁)($\theta = 12/{\text{π}} $)
    Figure  2.  The 3 control points and the 22 refined interpolation points in the C4v-symmetric unit cell with $\theta = 12/{\text{π}} $ (green: epoxy resin, orange: iron)

    能带理论作为固体物理中描述周期势下电子行为的经典理论[30], 已被成功应用于宏观周期结构的波动分析, 并成功描述了结构中的各种波动特性, 包括禁带和群速度等[31]. 对于本文关注的面外模式弹性波, 对应的波动控制方程为

    $$ \left.\begin{split} & {\mu \left( {\frac{{{\partial ^2}{u_z}}}{{\partial {x^2}}} + \frac{{{\partial ^2}{u_z}}}{{\partial {y^2}}}} \right) = - {\omega ^2}\rho {u_z}} \\ & {{u_z}\left( {{\boldsymbol{r}} + {\boldsymbol{R}}} \right) = {{\mathrm{e}}^{{\mathrm{i}}{\boldsymbol{k}} \cdot {\boldsymbol{R}}}}{u_z}\left( {\boldsymbol{r}} \right)} \end{split} \right\} $$ (1)

    其中, $\mu $和$\rho $分别是材料的剪切弹性模量和密度, ${u_z}$是面外位移, ${\omega ^2}$是特征值, ${\boldsymbol{r}}$是位置矢量, ${\boldsymbol{R}}$是晶格矢量. 上式中第2个公式反应了周期结构的Bloch理论. 在本论文中, 能带的计算(式(1)的求解)默认采用COMSOL软件进行.

    针对计算所得的能带, 定义无量纲化的第$ n $阶能带带隙上下限为

    $$ \left( {{{\bar \omega }_1},{{\bar \omega }_2}} \right) = \left( {\mathop {\max }\limits_{\boldsymbol{k}} \,{\omega _n},\mathop {\min }\limits_{\boldsymbol{k}} \,{\omega _{n + 1}}} \right) \cdot \frac{A}{{2{\text{π}} \sqrt {{\mu _0}/{\rho _0}} }} $$ (2)

    其中, 晶格常数$A = 1{\text{ m}}$, ${\mu _0}$表示环氧树脂的剪切模量.

    拓扑材料能实现各种缺陷免疫能量传输现象的根本原因在于其拥有非平凡的拓扑不变量[32]. 而经典拓扑不变量的计算涉及整个波矢空间内贝里曲率的积分, 计算复杂且难以推广至不同种类的拓扑绝缘体[33-34]. 对称指标方法的提出可以有效解决这两个问题, 并已实现了所有空间群及磁性空间群的拓扑材料分类[35-36]. 其基本思想是利用高对称点处模态的对称性, 实现能带在整个波矢空间中连接关系的区分与判别[35, 37-38], 从而利用晶格对称性极大简化了拓扑不变量的计算.

    鉴于对称指标方法的优势, 本文应用其对力学高阶拓扑绝缘体的拓扑性质进行辨别.

    由于本文不涉及磁性材料(没有破坏时间反演对称性), 二维单胞的陈数恒为0. 为此, 高阶拓扑绝缘体的拓扑不变量采用体极化量${\boldsymbol{P}}$描述[39-40], 即

    $$ \qquad\qquad\qquad {\boldsymbol{P}} = \frac{1}{{2{\text{π}} }}\int_\varOmega \mathcal{A}{\left( {\boldsymbol{k}} \right){\mathrm{d}}{\boldsymbol{k}}} $$ (3)
    $$ \qquad\qquad\qquad {\boldsymbol{P}} = {P_1}{{\boldsymbol{a}}_1} + {P_2}{{\boldsymbol{a}}_2} $$ (4)

    这里贝里联络$ {\mathcal{A}_{j = 1,2}}\left( {\boldsymbol{k}} \right) = - {\mathrm{i}}\;\left\langle {{u_z}({\boldsymbol{k}})} \right|{\nabla _j}\left| {{u_z}({\boldsymbol{k}})} \right\rangle $, 狄拉克符号$\left\langle a \right|\hat {\text{C}}\left| b \right\rangle = {a^\dagger } \cdot \hat {\text{C}}{\mkern 1 mu} {\mkern 1 mu} b$是希尔伯特空间中关于算符$\hat {\text{C}}$的一种内积符号记法; ${P_{j = 1,2}}$表示体极化量在各个晶格矢量${{\boldsymbol{a}}_{j = 1,2}}$上的分量.

    对于本文关注的${C_{4{\text{v}}}}$对称单胞, 其体极化可以简化为[39]

    $$ {{\mathrm{e}}^{{\mathrm{i}}2{\text{π}} {P_1}}} = {{\mathrm{e}}^{{\mathrm{i}}2{\text{π}} {P_2}}} = \prod\nolimits_n^{} {\frac{{\xi _{{X}}^n}}{{\xi _\varGamma ^n}}} $$ (5)

    其中, 累乘运算遍及目标带隙以下的所有能带, 而论文只计算前2阶带隙, 有取值$n = 1,\;2$. 而特征值$\xi _\varPi ^n$表示高对称点$\varPi $处的第$n$阶模态对于${\hat {\text{C}}_2}$旋转对称算符的特征值[39], 即

    $$\qquad\qquad\quad {\hat {\text{C}}_2}\left| {{u_z}\left( {{{\boldsymbol{k}}_\varPi }} \right)} \right\rangle = \xi _\varPi ^n\left| {{u_z}\left( {{{\boldsymbol{k}}_\varPi }} \right)} \right\rangle $$ (6)
    $$\qquad\qquad\quad {{\boldsymbol{k}}_\varPi } = {{\boldsymbol{k}}_\varGamma },{{\boldsymbol{k}}_{{X}}} $$ (7)

    根据式(5), 体极化量的计算仅需遍历高对称点(这里只有$\varGamma $和${{X}}$点), 相比于经典的基于贝里联络的方法显著提升了计算效率. 对于这种仅通过高对称点特征值计算拓扑不变量的方法, 我们笼统称之为对称指标方法, 其高对称点特征值的向量也被称为对称指标[38].

    体极化量可以直观理解为单胞中“等效电荷”(瓦尼尔函数心)的不均匀分布. 某个体极化量分量非零, 意味着该方向上存在极化“电荷”现象; 当两个体极化量分量都非0时, “等效电荷”将分布在单胞角点附近, 也就形成了特殊的拓扑角态现象[40]. 因此, 根据${C_{4{\text{v}}}}$对称单胞的体极化量取值情况, 可以有2种拓扑分类: (1)当两个分量都非零时, ${P_1} = {P_2} \ne 0$, 该单胞将拥有拓扑角态, 是高阶拓扑绝缘体; (2)若两个体极化量均为0时, 该单胞是平凡的拓扑绝缘体. 赋予前者拓扑标签$l = 1$, 后者拓扑标签$l = 0$, 用于后续数据集的准备.

    去噪扩散概率模型是一类生成式模型, 主要分为正向扩散过程与反向去噪过程[19]. 正向扩散过程被定义为马尔可夫过程, 即

    $$ q\left( {{{\boldsymbol{r}}_{1:T}}|{{\boldsymbol{r}}_0}} \right): = \prod\limits_{t = 1}^T {q\left( {{{\boldsymbol{r}}_t}|{{\boldsymbol{r}}_{t - 1}}} \right)} $$ (8)
    $$ q\left( {{{\boldsymbol{r}}_t}|{{\boldsymbol{r}}_{t - 1}}} \right): = \mathcal{N}\left( {{{\boldsymbol{r}}_t};\sqrt {1 - {\beta _t}} {{\boldsymbol{r}}_{t - 1}},{\beta _t}{\boldsymbol{I}}} \right) $$ (9)

    其中$t \in 1,2, \cdots ,T$, ${\beta _t} \in \left( {0,1} \right)_{t = 1}^T$控制每步施加噪声的水平. 通过在数据集中原始的几何参数样本${{\boldsymbol{r}}_0}$上施加$T$步高斯噪声${\boldsymbol{\varepsilon }}$, 以破坏原本服从真实物理规律分布的几何参数${{\boldsymbol{r}}_0} \sim q\left( {{{\boldsymbol{r}}_0}} \right)$. 最终当$T \to \infty $时, ${{\boldsymbol{r}}_T} \sim \mathcal{N}( {{\boldsymbol{r}}_T};$0, I).

    反向去噪过程通过逆转正向扩散过程, 从噪声样本${{\boldsymbol{r}}_T} \sim \mathcal{N}\left( {{{\boldsymbol{r}}_T};0,{\boldsymbol{I}}} \right)$逐步恢复原始样本${{\boldsymbol{r}}_0} \sim q\left( {{{\boldsymbol{r}}_0}} \right)$. 由于条件概率$q\left( {{{\boldsymbol{r}}_{t - 1}}|{{\boldsymbol{r}}_t}} \right)$无法直接处理, 可以通过含可学习参数$\theta $的${p_\theta }\left( {{{\boldsymbol{r}}_{t - 1}}|{{\boldsymbol{r}}_t}} \right)$近似这个条件概率. 故而反向去噪过程${p_\theta }\left( {{{\boldsymbol{r}}_{0:T}}} \right)$可表示为

    $$ {p_\theta }\left( {{{\boldsymbol{r}}_{0:T}}} \right) = p\left( {{{\boldsymbol{r}}_T}} \right)\prod\limits_{t = 1}^T {{p_\theta }\left( {{{\boldsymbol{r}}_{t - 1}}|{{\boldsymbol{r}}_t}} \right)} $$ (10)
    $$ {p_\theta }\left( {{{\boldsymbol{r}}_{t - 1}}|{{\boldsymbol{r}}_t}} \right) = \mathcal{N}\left( {{{\boldsymbol{r}}_{t - 1}};{{\boldsymbol{\mu }}_\theta }\left( {{{\boldsymbol{r}}_t},t} \right),{{\boldsymbol{\varSigma }}_\theta }\left( {{{\boldsymbol{r}}_t},t} \right)} \right) $$ (11)

    其中${{\boldsymbol{\mu }}_\theta }\left( {{{\boldsymbol{r}}_t},t} \right)$为含参的均值矢量, ${{\boldsymbol{\varSigma }}_\theta }\left( {{{\boldsymbol{r}}_t},t} \right)$为含参的协方差矩阵.

    扩散模型的训练目标是最小化数据集中真实样本分布$q\left( {{{\boldsymbol{r}}_0}} \right)$与模型去噪生成的样本分布${p_\theta }\left( {{{\boldsymbol{r}}_0}} \right)$之间的差异${D_{{\text{KL}}}}(q({{\boldsymbol{r}}_0})||{p_\theta }({{\boldsymbol{r}}_0}))$. Ho等[19]利用证据下界$ {\mathbb{E}_{q({{\boldsymbol{r}}_0})}}\left[ - \lg \,{p_\theta }({{\boldsymbol{r}}_0})\right] \leqslant {\mathbb{E}_{q({{\boldsymbol{r}}_0})}}\left[ - \lg \,\dfrac{{{p_\theta }({{\boldsymbol{r}}_{0:T}})}}{{q({{\boldsymbol{r}}_{1:T}}|{{\boldsymbol{r}}_0})}}\right] = :L $, 将目标简化为训练一个可以预测正向扩散时施加噪声${\boldsymbol{\varepsilon }}$的模型${{\boldsymbol{\varepsilon }}_\theta }$, 即

    $$ {\theta ^*} = \mathop {{\text{arg}}\,\min }\limits_\theta L(\theta ) = \mathop {{\text{arg}}\,\min }\limits_\theta {\mathbb{E}_{t,{{\boldsymbol{r}}_0},{\boldsymbol{\varepsilon }}}}[||{\boldsymbol{\varepsilon }} - {{\boldsymbol{\varepsilon }}_\theta }({{\boldsymbol{r}}_t},t)|{|_2}] $$ (12)

    其中, $t \sim \mathcal{U}(1,T)$, ${{\boldsymbol{r}}_t} = \sqrt {{{\bar \alpha }_t}} {{\boldsymbol{r}}_0} + \sqrt {1 - {{\bar \alpha }_t}} {\boldsymbol{\varepsilon }}$, ${\bar \alpha _t} = \displaystyle\prod\limits_{i = 1}^t {{\alpha _i}} $, ${\alpha _t} = 1 - $βt.

    为了使扩散模型能够生成符合所需拓扑标签$ l $和无量纲化带隙宽度$\Delta \bar \omega = {\bar \omega _2} - {\bar \omega _1}$的样本, 采用无分类器的条件引导策略(classifier-free diffusion guidance)[25]. 基于该策略, 将性能指标${\boldsymbol{c}} = {\left( {l,\Delta \bar \omega } \right)^{\mathrm{T}} }$、当前样本${{\boldsymbol{r}}_t}$和当前时间步$t$作为模型${{\boldsymbol{\varepsilon }}_\theta }$的输入, 即${{\boldsymbol{\varepsilon }}_\theta }({{\boldsymbol{r}}_t},t,{\boldsymbol{c}})$. 在完成模型的训练后, 按照下式从${{\boldsymbol{r}}_T}$中逐步去噪获得原始样本, 即可逆向设计符合真实物理规律及所需性能指标的单胞几何参数

    $$ {{\boldsymbol{r}}_{t - 1}} = \frac{1}{{\sqrt {{\alpha _t}} }}\left[{{\boldsymbol{r}}_t} - \frac{{{\beta _t}}}{{\sqrt {1 - {{\bar \alpha }_t}} }}{{\boldsymbol{\varepsilon }}_{{\theta ^*}}}({{\boldsymbol{r}}_t},t,{\boldsymbol{c}})\right] + \sqrt {{{\tilde \beta }_t}} {\boldsymbol{z}} $$ (13)

    其中, ${\boldsymbol{z}} \sim \mathcal{N}(0,{\boldsymbol{I}})$, ${\tilde \beta _t} = \dfrac{{1 - {{\bar \alpha }_{t - 1}}}}{{1 - {{\bar \alpha }_t}}}{\beta _t}$.

    图3所示, 本文采用了基于一维U-Net的DDPM架构预测正向扩散施加的噪声. 该架构的输入和输出具有相同的维度, 与扩散模型潜空间和数据同维度的特性契合. 输入的${{\boldsymbol{r}}_t}$首先通过由残差卷积块组成的编码器进行下采样, 逐渐减小数据分辨率同时增加通道数. 数据到达瓶颈层时, 其长度为64, 特征通道数为64. 随后, 数据通过解码器进行上采样, 恢复到与输入相同的维度. 在编码器与解码器之间设置了跳跃连接, 促使高低分辨率特征交流融合. 同时, 引入了多头自注意力机制[41], 以捕捉数据不同位置特征之间的相关性. 为了引导模型的去噪过程, 我们采用了三角函数式位置编码[41]对${\boldsymbol{c}}$与$t$进行编码, 并将其嵌入到模型中. 最终模型输出与输入维度相同的噪声${{\boldsymbol{\varepsilon }}_\theta }$.

    图  3  基于一维U-Net的DDPM架构
    Figure  3.  The one-dimensional U-Net based DDPM architecture

    在数据集中, 将几何参数${\boldsymbol{r}} = {({r_1},{r_2},{r_3})^{\mathrm{T}} }$及其性能指标(拓扑标签和无量纲化带隙宽度${\boldsymbol{c}} = {\left( {l,\Delta \bar \omega } \right)^{\mathrm{T}} }$)作为一组样本. 其中几何参数样本通过随机采样${r_i} \sim \mathcal{U}(0,1)$生成, 并使用COMSOL仿真结合第2章内容获得相应的性能指标. 由于几何参数随机生成, 存在对高阶拓扑绝缘体的逆向设计没有帮助的部分拓扑性质平凡的样本. 为了进行对比, 分别准备了一个包含拓扑标签为0的样本数据集(FDset)和一个剔除0拓扑标签样本的数据集(RDset). 这两个数据集的样本数量均为20000个.

    模型训练过程中, 每隔100轮即使用当前模型去噪生成1000个具有不同无量纲化带隙宽度(0.1, 0.2, 0.3, 0.4)的高阶拓扑绝缘体样本. 为了快速实现对当前扩散模型生成样本的性能评判, 使用Du等[10]提出的多任务学习模型作为有限元仿真的代理模型(拓扑标签分类正确率98.6%, 无量纲化带隙宽度预测相对误差0.95%).

    在超参数的设定方面, 针对扩散模型的加噪去噪任务, 将最大时间步数$T$设定为2000, 线性增加序列${\beta _t}$从0.0001逐渐变化到0.02[19]. 这代表在正向扩散过程中, 随着样本几何参数噪声水平的提升, 加噪力度逐渐增强. 在去噪生成过程中, 采用了动态阈值策略[42]以确保几何参数${r_i}$在其定义域$(0,1)$内, 从而提高生成样本的保真度. 整体训练轮数设置为10000, 采用AdamW优化器, 并将初始学习率设定为0.0001. 同时引入了学习率的预热(warm-up)与余弦退火变化策略(cosine annealing schedule), 以提高训练的稳定性和效果. 图4展示了本模型在数据集FDset上训练的损失函数历史曲线, 以及通过代理模型预测新生成样本的拓扑标签正确率和无量纲化带隙相对误差的历史曲线.

    图  4  训练损失、拓扑标签正确率和无量纲化带隙宽度相对误差的迭代历史
    Figure  4.  The iterative history of the training loss, the accuracy of topological label and the relative errors of normalized bandgap width

    利用本文提出的基于DDPM的高阶拓扑绝缘体逆向设计模型, 生成了无量纲化带隙宽度为0.1, 0.2, 0.3和0.4的高阶拓扑绝缘体的几何参数各500组(如表1所示). 通过COMSOL仿真分析所得的2000组设计, 发现其均为非平凡高阶拓扑绝缘体, 无量纲化带隙宽度值与实际值的相对误差分别为5.11%, 2.80%, 1.75%和0.78%. 此外, 还对比了扩散模型和Du等[10]基于多任务学习的逆向设计方法在不同数据集的表现, 利用数据集FDset和数据集RDset, 本模型逆向设计结果带隙宽度平均相对误差分别为3.24%和2.56%, 而Du等[10]算法的相对误差为3.32%和2.57%, 二者精度相当.

    表  1  不同带隙宽度的代表性HOTIs单胞
    Table  1.  Representative unit cells of HOTIs with specialized normalized bandgap widths
    Normalized width
    0.1 0.2 0.3 0.4
    下载: 导出CSV 
    | 显示表格

    值得指出的是, 本文所发展的基于DDPM的高阶拓扑绝缘体逆向设计框架优势主要体现于设计效率和样本的多样性. 具体来说, 基于DDPM的生成过程在GPU上并行完成, 平均每个新样本仅需0.009795 s. 相较于Du等[10]的结果(需要约42 s), 效率提升了4000倍 2; 与采用遗传算法求解优化列式的传统算法[8]相比(通常需要数十个小时), 本文方法更是将效率提升了6 ~ 7个数量级. 进一步, 通过评估逆向设计结果对数据集中样本分布的覆盖程度表示其多样性(这里认为原始数据集中的样本分布最为多样). 采用Wasserstein距离度量数据集中的样本分布$P({\boldsymbol{x}})$与逆向设计的样本分布$Q({\boldsymbol{y}})$之间的差异, 即

    $$ W(P,Q) = \mathop {{\text{inf}}}\limits_{\textit{π}} \frac{1}{n}\sum\limits_{i = 1}^n {||{{\boldsymbol{x}}_i} - {\boldsymbol{y}}_i^{\left( {\textit{π}} \right)}|{|_2}} $$ (14)

    其中, $n$为样本数量, ${\textit{π}} $为${\boldsymbol{y}}$中$n$个样本的所有排序方式. 表2分别对比了本文设计结果与Du等[10]设计结果的Wasserstein距离. 可以看出, 基于DDPM方法的逆向设计结果在多样性上较以往工作有了较大提升.

    表  2  逆向设计结果分布与基准间的Wasserstein距离
    Table  2.  Wasserstein distance between inverse design results distribution and reference
    Normalized width 0.1 0.2 0.3 0.4
    dataset RDset 0 0 0 0
    present results 0.069 0.061 0.046 0.031
    previous results 0.175 0.139 0.066 0.043
    下载: 导出CSV 
    | 显示表格

    通过将目标无量纲化宽度设定为0.5, 利用上述模型逆向设计获得了500组不同的单胞几何参数. 经过COMSOL仿真验证, 这些设计均具有非平凡的拓扑标签, 平均无量纲化带隙宽度为0.4705, 最大无量纲化带隙宽度为0.4758. 值得注意的是, 数据集中最大无量纲化带隙宽度为0.4742, 且无量纲化带隙宽度大于0.46的样本仅有54组, 这表明了本文DDPM模型具有一定程度的泛化能力.

    对于具有最大带隙宽度的生成设计, 其几何参数为${{\boldsymbol{r}}^*} = {(0.602,0.607,0.529)^{\mathrm{T}} }$, 无量纲化带隙上下限分别为$\bar \omega _2^* = 1.598\;7$, $\bar \omega _1^* = 1.122\;9$. 通过在COMSOL中建模仿真, 得到其无量纲化能带结构及高对称点处的特征模态如图5所示. 可以发现, 其能带结构在${{X}}$点处特征模态的对称性发生了变化, 对应了非平凡的拓扑性质.

    图  5  最大化带隙宽度HOTI样本的无量纲化能带结构与高对称点处特征模态
    Figure  5.  Normalized band structure and the states of the eigenmodes at high symmetry points of the HOTI with a maximized bandgap width

    为了进一步验证最大化带隙宽度的高阶拓扑绝缘体具有高度集中和拓扑保护的角态, 将图5中的设计组成$8 \times 8$的超胞进行仿真. 如图6所示, 不论是完美的超胞还是带有缺陷的超胞, 都呈现出高度集中的角态.

    图  6  最大化带隙宽度HOTI样本组成的完美超胞与带有缺陷超胞的拓扑角态
    Figure  6.  The topological corner states of the perfect supercells and the supercells with defects composed of the HOTIs with a maximized bandgap width

    本文提出了一种基于去噪扩散概率模型的高阶拓扑绝缘体实时设计新框架. 首先, 使用移动可变形孔洞方法以较少的设计变量显式描述了连续单胞的几何模型. 进一步结合能带理论与对称指标理论, 构建了包含几何参数、无量纲化带隙宽度与拓扑性质指标的高阶拓扑绝缘体数据集. 使用经过训练的去噪扩散概率模型(DDPM), 无需额外优化求解, 即可准确而高效地按需生成力学高阶拓扑绝缘体. 与传统基于有限元仿真和遗传算法的逆向设计方法相比, 本文方法可提高6 ~ 7个数量级的效率, 且保证了设计结果的多样性. 与近期在生成式设计中广泛使用的生成对抗网络与变分自编码器等方法相比, DDPM有效避免了训练不稳定和生成结果边界不清晰等问题, 显著提升了模型的训练效果与生成结果的准确性. 与基于图像的DDPM超材料逆向设计研究相比, 本工作通过显式设计变量描述单胞, 可以避免图像二值化等后处理操作, 设计结果可以直接导入CAD/CAE软件.

    基于去噪扩散概率模型的实时设计算法可以推广应用于不同物理系统和不同对称群的拓扑绝缘体逆向设计. 此外, 针对不同类型的拓扑绝缘体, 可以构建一个声子和光子拓扑材料的数据库, 结合人工智能高效按需设计单胞模型, 这对于推动拓扑材料的应用具有重要意义.

    2*本文对带隙位置进行了无量纲化处理, 所取晶格常数的单位或单胞尺寸并不会影响相关结果(无量纲化的带隙宽度及拓扑性质)
    1*与Du等[10]的计算环境相同,均为配备了Intel(R) Xeon(R) Gold 6226R CPU @2.90GHz, 512GB RAM, NVIDIA GeForce RTX 3090 GPU的Windows Server 2022系统
  • 图  1   基于DDPM的高阶拓扑绝缘体逆向设计框架概述

    Figure  1.   Overview of proposed HOTIs inverse design paradigm utilizing DDPM

    图  2   由3个控制点和22个插值点描述的${C_{4{\text{v}}}}$对称单胞模型(绿色: 环氧树脂, 橙色: 铁)($\theta = 12/{\text{π}} $)

    Figure  2.   The 3 control points and the 22 refined interpolation points in the C4v-symmetric unit cell with $\theta = 12/{\text{π}} $ (green: epoxy resin, orange: iron)

    图  3   基于一维U-Net的DDPM架构

    Figure  3.   The one-dimensional U-Net based DDPM architecture

    图  4   训练损失、拓扑标签正确率和无量纲化带隙宽度相对误差的迭代历史

    Figure  4.   The iterative history of the training loss, the accuracy of topological label and the relative errors of normalized bandgap width

    图  5   最大化带隙宽度HOTI样本的无量纲化能带结构与高对称点处特征模态

    Figure  5.   Normalized band structure and the states of the eigenmodes at high symmetry points of the HOTI with a maximized bandgap width

    图  6   最大化带隙宽度HOTI样本组成的完美超胞与带有缺陷超胞的拓扑角态

    Figure  6.   The topological corner states of the perfect supercells and the supercells with defects composed of the HOTIs with a maximized bandgap width

    表  1   不同带隙宽度的代表性HOTIs单胞

    Table  1   Representative unit cells of HOTIs with specialized normalized bandgap widths

    Normalized width
    0.1 0.2 0.3 0.4
    下载: 导出CSV

    表  2   逆向设计结果分布与基准间的Wasserstein距离

    Table  2   Wasserstein distance between inverse design results distribution and reference

    Normalized width 0.1 0.2 0.3 0.4
    dataset RDset 0 0 0 0
    present results 0.069 0.061 0.046 0.031
    previous results 0.175 0.139 0.066 0.043
    下载: 导出CSV
  • [1]

    Hasan MZ, Kane CL. Colloquium: Topological insulators. Reviews of Modern Physics, 2010, 82: 3045 doi: 10.1103/RevModPhys.82.3045

    [2]

    Benalcazar WA, Bernevig BA, Hughes TL. Quantized electric multipole insulators. Science, 2017, 357: 61-66 doi: 10.1126/science.aah6442

    [3]

    Noh J, Benalcazar WA, Huang S, et al. Topological protection of photonic mid-gap defect modes. Nature Photonics, 2018, 12: 408-415 doi: 10.1038/s41566-018-0179-3

    [4]

    Zhang Z, Long H, Liu C, et al. Deep-subwavelength holey acoustic second-order topological insulators. Advanced Materials, 2019, 31: 1904682 doi: 10.1002/adma.201904682

    [5] 陈毅, 张泉, 张亚飞等. 弹性拓扑材料研究进展. 力学进展, 2021, 51(2): 189-256 (Chen Yi, Zhang Quan, Zhang Yafei, et al. Research progress of elastic topological materials. Advances in Mechanics, 2021, 51(2): 189-256 (in Chinese) doi: 10.6052/1000-0992-21-015

    Chen Yi, Zhang Quan, Zhang Yafei, et al. Research progress of elastic topological materials. Advances in Mechanics, 2021, 51(2): 189-256 (in Chinese) doi: 10.6052/1000-0992-21-015

    [6]

    Chen Y, Meng F, Jia B, et al. Inverse design of photonic topological insulators with extra-wide bandgaps. Physica Status Solidi (RRL)–Rapid Research Letters, 2019, 13: 1900175

    [7]

    Nanthakumar S, Zhuang X, Park HS, et al. Inverse design of quantum spin hall-based phononic topological insulators. Journal of the Mechanics and Physics of Solids, 2019, 125: 550-571 doi: 10.1016/j.jmps.2019.01.009

    [8]

    Du Z, Chen H, Huang G. Optimal quantum valley Hall insulators by rationally engineering Berry curvature and band structure. Journal of the Mechanics and Physics of Solids, 2020, 135: 103784 doi: 10.1016/j.jmps.2019.103784

    [9]

    Zhang J, Wang F, Sigmund O, et al. Ultra-broadband edge-state pair for zigzag-interfaced valley hall insulators. Science China Physics, Mechanics & Astronomy, 2022, 65: 257011

    [10]

    Du Z, Luo J, Xu Z, et al. Higher-order topological insulators by ML-enhanced topology optimization. International Journal of Mechanical Sciences, 2023, 255: 108441 doi: 10.1016/j.ijmecsci.2023.108441

    [11]

    Long Y, Ren J, Li Y, et al. Inverse design of photonic topological state via machine learning. Applied Physics Letters, 2019, 114(18): 181105

    [12]

    Du Z, Ding X, Chen H, et al. Optimal design of topological waveguides by machine learning. Frontiers in Materials, 2022, 9: 1075073 doi: 10.3389/fmats.2022.1075073

    [13]

    Jin Y, He L, Wen Z, et al. Intelligent on-demand design of phononic metamaterials. Nanophotonics, 2022, 11: 439-460 doi: 10.1515/nanoph-2021-0639

    [14]

    Wang HP, Li YB, Li H, et al. Deep learning designs of anisotropic metasurfaces in ultrawideband based on generative adversarial networks. Advanced Intelligent Systems, 2020, 2: 2000068 doi: 10.1002/aisy.202000068

    [15]

    Yeung C, Tsai R, Pham B, et al. Global inverse design across multiple photonic structure classes using generative deep learning. Advanced Optical Materials, 2021, 9: 2100548 doi: 10.1002/adom.202100548

    [16]

    Tran T, Amirkulova FA, Khatami E. Broadband acoustic metamaterial design via machine learning. Journal of Theoretical and Computational Acoustics, 2022, 30: 2240005 doi: 10.1142/S2591728522400059

    [17] 尹剑飞, 蔡力, 方鑫等. 力学超材料研究进展与减振降噪应用. 力学进展, 2022, 52(3): 508-586 (Yin Jianli, Cai Li, Fang Xin, et al. Review on research progress of mechanical metamaterials and their applications in vibration and noise control. Advances in Mechanics, 2022, 52(3): 508-586 (in Chinese) doi: 10.6052/1000-0992-22-005

    Yin Jianli, Cai Li, Fang Xin, et al. Review on research progress of mechanical metamaterials and their applications in vibration and noise control. Advances in Mechanics, 2022, 52(3): 508-586 (in Chinese) doi: 10.6052/1000-0992-22-005

    [18]

    Zandehshahvar M, Kiarashinejad Y, Zhu M, et al. Manifold learning for knowledge discovery and intelligent inverse design of photonic nanostructures: breaking the geometric complexity. ACS Photonics, 2022, 9: 714-721

    [19]

    Ho J, Jain A, Abbeel P. Denoising diffusion probabilistic models. Advances in Neural Information Processing Systems, 2020, 33: 6840-6851

    [20]

    Ramesh A, Dhariwal P, Nichol A, et al. Hierarchical text-conditional image generation with clip latents. arXiv Preprint, arXiv: 2204. 06125, 2022

    [21]

    Rombach R, Blattmann A, Lorenz D, et al. High-resolution image synthesis with latent diffusion models//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022: 10684-10695

    [22]

    Vlassis NN, Sun W. Denoising diffusion algorithm for inverse design of microstructures with fine-tuned nonlinear material properties. Computer Methods in Applied Mechanics and Engineering, 2023, 413: 116126 doi: 10.1016/j.cma.2023.116126

    [23]

    Zhang Z, Yang C, Qin Y, et al. Diffusion probabilistic model based accurate and high-degree-of-freedom metasurface inverse design. arXiv Preprint, arXiv: 2304.13038, 2023

    [24]

    Zhang W, Chen J, Zhu X, et al. Explicit three dimensional topology optimization via moving morphable void (MMV) approach. Computer Methods in Applied Mechanics and Engineering, 2017, 322: 590-614 doi: 10.1016/j.cma.2017.05.002

    [25]

    Ho J, Salimans T. Classifier-free diffusion guidance. arXiv Preprint, arXiv: 2207.12598, 2022

    [26]

    Chen H, Nassar H, Norris AN, et al. Elastic quantum spin hall effect in kagome lattices. Physical Review B, 2018, 98: 094302 doi: 10.1103/PhysRevB.98.094302

    [27]

    Chen Y, Liu X, Hu G. Topological phase transition in mechanical honeycomb lattice. Journal of the Mechanics and Physics of Solids, 2019, 122: 54-68

    [28]

    Zhou W, Wu B, Chen Z, et al. Actively controllable topological phase transition in homogeneous piezoelectric rod system. Journal of the Mechanics and Physics of Solids, 2020, 137: 103824 doi: 10.1016/j.jmps.2019.103824

    [29]

    Ma TX, Fan QS, Zhang C, et al. Flexural wave energy harvesting by the topological interface state of a phononic crystal beam. Extreme Mechanics Letters, 2022, 50: 101578 doi: 10.1016/j.eml.2021.101578

    [30]

    Kittel C. Introduction to Solid State Physics. John Wiley & Sons, Inc, 2005

    [31] 温熙森, 温激鸿, 郁殿龙. 声子晶体. 北京: 国防工业出版社, 2009 (Wen Xisen, Wen Jihong, Yu Dianlong. Phononic Crystals. Beijing: National Defence Industry Press, 2009 (in Chinese)

    Wen Xisen, Wen Jihong, Yu Dianlong. Phononic Crystals. Beijing: National Defence Industry Press, 2009 (in Chinese)

    [32]

    Felser C, Qi XL. Topological insulators. MRS Bulletin, 2014, 39: 843-846 doi: 10.1557/mrs.2014.217

    [33]

    Fu L. Topological crystalline insulators. Physical Review Letters, 2011, 106: 106802 doi: 10.1103/PhysRevLett.106.106802

    [34]

    Wu LH, Hu X. Scheme for achieving a topological photonic crystal by using dielectric material. Physical Review Letters, 2015, 114: 223901 doi: 10.1103/PhysRevLett.114.223901

    [35]

    Bradlyn B, Elcoro L, Cano J, et al. Topological quantum chemistry. Nature, 2017, 547: 298-305 doi: 10.1038/nature23268

    [36]

    Watanabe H, Po HC, Vishwanath A. Structure and topology of band structures in the 1651 magnetic space groups. Science Advances, 2018, 4: eaat8685 doi: 10.1126/sciadv.aat8685

    [37]

    Fu L, Kane CL. Topological insulators with inversion symmetry. Physical Review B, 2007, 76: 045302 doi: 10.1103/PhysRevB.76.045302

    [38] 唐峰, 万贤纲. 基于对称性指标预测拓扑材料. 物理, 2019, 48(6): 341-356 (Tang Feng, Wan Xiangang. Efficient topological materials discovery using symmetry indicators. Physics, 2019, 48(6): 341-356 (in Chinese)

    Tang Feng, Wan Xiangang. Efficient topological materials discovery using symmetry indicators. Physics, 2019, 48(6): 341-356 (in Chinese)

    [39]

    Fang C, Gilbert MJ, Bernevig BA. Bulk topological invariants in noninteracting point group symmetric insulators. Physical Review B, 2012, 86: 115112 doi: 10.1103/PhysRevB.86.115112

    [40]

    Benalcazar WA, Li T, Hughes TL. Quantization of fractional corner charge in Cn-symmetric higher-order topological crystalline insulators. Physical Review B, 2019, 99: 245151 doi: 10.1103/PhysRevB.99.245151

    [41]

    Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need//Advances in Neural Information Processing Systems, 2017: 30

    [42]

    Saharia C, Chan W, Saxena S, et al. Photorealistic text-to-image diffusion models with deep language understanding. Advances in Neural Information Processing Systems, 2022, 35: 36479-36494

  • 期刊类型引用(0)

    其他类型引用(1)

图(6)  /  表(2)
计量
  • 文章访问数:  230
  • HTML全文浏览量:  122
  • PDF下载量:  109
  • 被引次数: 1
出版历程
  • 收稿日期:  2023-12-20
  • 录用日期:  2024-01-28
  • 网络出版日期:  2024-01-28
  • 发布日期:  2024-01-29
  • 刊出日期:  2024-07-17

目录

/

返回文章
返回