SheepNav
新上线今天0 投票

突破 fMRI 数据瓶颈:双谱流匹配模型生成高保真脑功能时序数据

功能性磁共振成像(fMRI)是研究大脑动态活动的重要工具,但其数据采集成本高昂,限制了高质量样本的获取。近期,来自马来西亚和新加坡的研究团队提出了一种名为 双谱流匹配(Dual-Spectral Flow Matching, DSFM) 的新型生成框架,通过小波变换与离散余弦变换的双重谱域转换,结合流匹配模型,成功生成高保真的 fMRI 时间序列。该工作已被 ICLR 2026 接收,为脑疾病识别等下游任务提供了数据增强新思路。

核心挑战:fMRI 数据稀缺与非平稳特性

fMRI 通过测量血氧水平依赖(BOLD)信号来反映神经活动,但其采集耗时、成本高,导致公开数据集规模有限。传统生成模型(如 GAN、扩散模型)虽能合成图像或视频,但在处理 fMRI 时间序列时面临三大难点:

  • 非平稳性:BOLD 信号随时间呈现统计特性变化,难以用固定分布建模。
  • 复杂时空动态:脑区间的功能连接在时间上不断演化。
  • 生理变异性:信号受心率、呼吸等生理噪声干扰,需保留真实波动特征。

方法创新:双谱流匹配框架

DSFM 提出一种级联双频表示策略,将原始 BOLD 信号依次转换到两个互补的谱域:

  1. 小波域(DWT):通过离散小波变换捕捉信号的全局瞬态与多尺度变化,获得时频分解图。
  2. 离散余弦域(DCT):在脑区和时间维度上投影到 DCT 空间,利用低频主导的 BOLD 系数实现局部能量压缩。

随后,一个类条件流匹配模型被训练用于生成余弦频率表示。模型通过逆 DCT 和逆 DWT 重建出时域 BOLD 信号。这种双重变换方法为生成过程施加了结构化频率先验,有效保留了关键的生理脑动力学。

实验验证与下游应用

研究团队在公开 fMRI 数据集上进行了评估,结果显示 DSFM 生成的样本在统计分布、功率谱密度和功能连接模式上与真实数据高度一致。更重要的是,将生成数据用于训练下游脑网络分类模型(如用于阿尔茨海默病或精神分裂症识别),分类准确率相比仅用真实数据提升了 10-15%,证明了其数据增强的有效性。

行业意义与未来展望

DSFM 为医学影像生成领域提供了新范式:通过显式引入频率先验,解决了生成非平稳时序数据的难题。该方法可扩展至其他神经成像模态(如 EEG、MEG),并有望降低脑疾病诊断对大规模真实数据的依赖。未来工作可能聚焦于条件生成(如生成特定疾病亚型的样本)和跨模态联合生成

代码已开源(见论文链接),研究者可复现并应用于自己的数据集。

延伸阅读

  1. NumLeak:公开数值基准竟成基础模型“潜标签”,前沿大模型记忆能力惊人
  2. MADQI:面向AIS船舶异常检测的无监督学习新评估指标
  3. 告别深度神经网络?新架构让LLM训练一步到位,全局最优解无需迭代
查看原文