今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-02-27 02-27 15:44

今日q-bio领域研究呈现两大核心趋势:一是深度表征几何化,即利用几何与拓扑工具解析基础模型内部知识结构;二是模型框架创新,通过引入新数学机制(如状态空间、博弈论、非对角噪声)提升生物过程建模的精度与效率。

  1. 基础模型的内部几何结构被系统性解码:研究通过大规模假设筛选,发现scGPT等单细胞基础模型将基因组织成结构化的“生物坐标系”,其光谱轴编码亚细胞定位,正交轴编码蛋白互作网络,且该几何结构在不同模型间高度共享。
  2. 预测框架转向状态空间与序列动态建模:CrossLLM-Mamba框架将RNA相互作用预测重新定义为状态空间对齐问题,利用双向Mamba编码器实现模态间动态序列转换,保持了线性计算复杂度并提升了对困难样本的鲁棒性。
  3. 物理与生态模型挑战经典噪声假设:在冷冻电镜精修中,一步扩散模型结合密度感知损失实现了快速、统一的结构优化;在生态学中,研究揭示了捕食者-猎物模型中非对角交叉协方差的结构必要性,推动了更符合微观基础的随机模型构建。
  4. 计算神经科学探索非经典神经机制与高效模拟:研究提出违反戴尔原则的“双语”神经元模型,揭示了其调控神经回路同步的新机制;同时,利用大脑网络拓扑优化任务映射,能显著缓解大规模脉冲神经网络模拟中的通信瓶颈。
  5. 主动学习与博弈论优化生物数据利用与策略:HATTER框架证明,结合主动学习与专家标注能高效微调酶功能预测模型,大幅降低计算成本;平均场博弈模型则为SEIR网络流行病中个体接触策略的优化提供了定量分析框架。
  6. 专用几何深度学习库推动方法标准化:SPD Learn库提供了对称正定矩阵深度学习的统一实现,通过数值稳定的算子和基于平凡化的参数化,促进了该领域方法的可重复性与现代工作流集成。

2026-02-27 速览 · 定量生物学

2026-02-27 共 23 条抓取,按综合热度排序

← 返回日历
q-bio 02-27 00:00

基于偏差与方差校正噪声建模的扩散加权图像无监督去噪方法

本研究针对扩散磁共振成像(dMRI)在低信噪比条件下非高斯噪声(Rician分布)导致的图像质量下降问题,提出了一种无监督去噪框架。该方法通过设计两种噪声校正训练目标函数:一种基于一阶矩以消除均值偏差,另一种基于二阶矩以校正平方信号偏差,并引入自适应权重处理方差异质性。这些目标函数在无需改变网络架构的情况下,被实例化于图像特定的深度图像先验(DIP)框架中。在仿真和活体dMRI数据上的实验表明,该方法能有效减少Rician偏差、抑制噪声波动,相比现有先进方法,能获得更高的图像质量和更可靠的扩散指标。

扩散磁共振成像无监督去噪噪声建模rician分布深度图像先验低信噪比
q-bio 02-27 00:00

CrossLLM-Mamba:基于状态空间对齐的多模态RNA相互作用预测新框架

本研究提出CrossLLM-Mamba框架,将RNA相关相互作用预测重新定义为状态空间对齐问题。该框架利用双向Mamba编码器,通过隐藏状态传播实现模态特定嵌入间的深度“对话”,将相互作用建模为动态序列转换而非静态特征重叠。该方法保持了线性计算复杂度,并引入高斯噪声注入和Focal Loss以增强对困难负样本的鲁棒性。在RNA-蛋白质、RNA-小分子和RNA-RNA三类相互作用预测任务上的实验表明,该模型在RPI1460基准上取得了0.892的MCC,较先前最佳性能提升5.2%,并在核糖开关等结合亲和力预测任务中皮尔逊相关系数超过0.95。

rna相互作用预测多模态融合状态空间模型mamba架构生物大语言模型计算生物学
q-bio 02-27 00:00

单细胞Transformer模型scGPT内部表征揭示生物知识的多维几何结构

本研究通过63轮自动化假设筛选,系统解码了单细胞基础模型scGPT的内部表征几何结构。研究发现,模型并非将基因编码为不透明的特征空间,而是将其组织成一个结构化的生物坐标系。主要的光谱轴按亚细胞定位分离基因,中间层则瞬时编码线粒体和内质网区室,其序列反映了细胞分泌途径。正交轴编码了蛋白质-蛋白质相互作用网络,其保真度与实验测量的相互作用强度高度相关(Spearman $\rho = 1.000$)。在一个紧凑的六维光谱子空间中,模型能有效区分转录因子与其靶基因(AUROC = 0.744)。这些结果表明,生物Transformer模型学习了一个可解释的细胞组织内部模型,对调控网络推断、药物靶点优先排序和模型审计具有重要意义。

单细胞测序transformer模型表征几何生物知识图谱可解释ai基因调控
q-bio 02-27 00:00

CryoNet.Refine:基于一步扩散模型实现冷冻电镜结构模型的快速精修

本研究提出CryoNet.Refine,一种用于冷冻电镜结构模型精修的端到端深度学习框架。该方法采用一步扩散模型,结合密度感知损失函数与立体化学约束,能够快速优化结构以匹配实验密度图数据。相比传统计算昂贵的精修流程(如Phenix.real_space_refine),CryoNet.Refine在模型-密度图相关性及几何质量指标上均取得显著提升,为蛋白质及DNA/RNA-蛋白质复合物的结构精修提供了统一、自动化的高效解决方案。

冷冻电镜结构精修扩散模型深度学习计算生物学
q-bio 02-27 00:00

生物基础模型学到了什么几何与拓扑结构?141项假设揭示scGPT与Geneformer的内部表征

本研究通过自主大规模假设筛选,对scGPT和Geneformer等单细胞基因表达基础模型的内部表征进行了系统性几何与拓扑分析。研究发现:1)模型学到了真实的几何结构,基因嵌入邻域展现出非平凡拓扑(12个Transformer层中有11层在p<0.05水平上具有显著的持续同调性),且流形感知度量在识别调控基因对时优于欧氏距离;2)该结构在不同独立训练的模型间共享,scGPT与Geneformer的典型相关分析对齐度达0.80,但基因级对应关系难以精确恢复;3)在严格的零假设控制下,稳健信号主要集中在免疫组织中。

生物基础模型几何结构拓扑分析单细胞基因表达持续同调模型对齐
q-bio 02-27 00:00

超越对角噪声:基于交叉协方差的捕食者-猎物模型新框架

本文挑战了生态模型中常用的对角扩散项,指出其缺乏微观基础且错误描述了种群波动的几何结构。通过从整数马尔可夫链直接推导随机 Rosenzweig-MacArthur 模型,作者揭示了由事件化学计量决定的精确扩散协方差结构,并证明捕食-转化耦合事件必然产生结构性的负交叉协方差。此外,研究明确区分了开放域(生存条件)与吸收域(允许灭绝)的公式分岔,并开发了一个两阶段 Lyapunov 适定性架构来支持这一区分。这项工作为协方差一致且边界感知的生态建模提供了精确的数学模板。

生态建模随机过程协方差结构种群动力学边界问题模型推导
q-bio 02-27 00:00

SPD Learn:用于神经解码的几何深度学习Python库

本文介绍了SPD Learn,一个用于对称正定(SPD)矩阵几何深度学习的统一Python库。该库解决了现有实现分散、约束处理随意且训练设置不统一的问题,从而阻碍了可重复性和与现代深度学习工作流的集成。SPD Learn提供了核心SPD算子和神经网络层,包括数值稳定的谱算子,并通过基于平凡化的参数化方法强制Stiefel/SPD约束。这种设计使得在无约束的欧几里得空间中进行标准反向传播和优化成为可能,同时通过构造产生流形约束的参数。该库还提供了基于SPDNet的代表性模型的参考实现,并与广泛使用的脑机接口/神经影像工具包(如MOABB、Braindecode、Nilearn、SKADA)集成,促进了可重复的基准测试和实际部署。

几何深度学习对称正定矩阵神经解码脑机接口python库可重复性
q-bio 02-27 00:00

超越戴尔原则:双语神经元模型揭示神经回路同步新机制

传统神经科学模型遵循戴尔原则,将神经元严格区分为兴奋性或抑制性。本研究引入一个违反该原则的“双语”神经元最小模型,其单个神经元可同时释放兴奋性和抑制性神经递质。分析发现,该架构在同步与异步动力学之间表现出独特的相变行为,其定量特征与传统的“单语”控制架构不同。在相变附近,神经元层面及高阶相互作用层面均显示出独特的信息处理特征,表明违反戴尔原则的神经元群体可能为调控神经回路大规模振荡活动提供了一种替代机制。

双语神经元戴尔原则脉冲神经网络同步动力学神经编码计算模型
q-bio 02-27 00:00

VAE-MS:用于突变特征提取的非对称变分自编码器

本研究提出了一种名为VAE-MS的新型模型,用于从癌症基因组数据中提取突变特征。该模型结合了非对称架构与概率方法,旨在克服传统非负矩阵分解(NMF)方法在可靠性和临床适用性上的不足。通过与SigProfilerExtractor、MUSE-XAE和SigneR等前沿模型的对比,研究发现,具备概率成分的模型(VAE-MS, SigneR)在数据重建和泛化能力上显著优于非概率模型。在真实癌症数据上,VAE-MS展现出更优的重建精度。

突变特征变分自编码器癌症基因组学概率模型非对称架构特征提取
q-bio 02-27 00:00

STOEP:融合先验知识的时空流行病预测新框架

本研究提出了一种名为STOEP的新型混合预测框架,旨在解决现有时空流行病预测方法对弱信号不敏感、空间关系建模简单及参数估计不稳定等问题。STOEP通过三个核心组件整合隐式时空先验与显式专家先验:1)基于历史感染模式动态调整区域依赖性的案例感知邻接学习;2)利用可学习空间先验放大弱信号的参数估计;3)采用专家引导的自适应阈值策略进行参数正则化的机制预测。在COVID-19和流感真实数据集上的实验表明,STOEP的RMSE指标优于最佳基线模型11.1%,并已在中国某省级疾控中心部署应用。

流行病预测时空模型先验知识参数估计深度学习公共卫生
q-bio 02-27 00:00

基于几何感知的深度学习模型实现高效高精度心电正问题计算

本研究提出了一种形状感知的替代模型,用于高效计算心电正问题中的导联场算子。该框架包含一个将解剖形状映射到低维潜在空间的几何编码模块,以及一个根据空间坐标、电极位置和潜在编码预测导联场梯度的几何条件神经替代模型。该方法在躯干内部(平均角度误差5°)和心脏内部均能高精度逼近导联场,实现了高精度的心电模拟(相对均方误差<2.5%),且计算成本极低。其紧凑的潜在表示无需完整的躯干分割,适用于数据有限的临床场景。

心电正问题深度学习几何建模计算效率医学图像
q-bio 02-27 00:00

人类抽象推理行为研究:CogARC揭示规则学习与问题解决策略

研究团队通过认知抽象与推理语料库(CogARC),对260名参与者在75个抽象视觉推理任务中的行为进行了高分辨率记录。参与者需从少量示例中推断输入-输出规则,平均准确率在80%-90%之间。研究发现:较难问题引发更长的思考时间和更多样的解决策略;任务过程中,反应速度加快但准确率略有下降,表明是对任务结构而非规则学习能力的适应;即使是错误答案也常高度趋同,但解决路径在长度和流畅度上差异显著,有的直接高效,有的则需反复探索。

抽象推理认知策略规则学习行为分析问题解决视觉推理
q-bio 02-27 00:00

认知模型与AI算法为语言智能体设计提供蓝图

本文提出,当前单一大型语言模型(LLM)难以解决的复杂问题,可通过借鉴认知科学模型和经典AI算法的设计思想,构建模块化语言智能体来解决。作者将这种设计思想形式化为“智能体模板”,该模板定义了单个LLM的角色及其功能组合方式。通过梳理现有文献,文章展示了多种语言智能体的底层模板可直接源自认知模型(如工作记忆、双过程理论)或AI算法(如规划、搜索),旨在强调这些跨学科的设计蓝图是开发高效、可解释语言智能体的有力工具。

语言智能体认知模型ai算法模块化设计大型语言模型可解释ai
q-bio 02-27 00:00

基于WHO GLASS数据的机器学习模型预测抗生素耐药性趋势

本研究提出一个结合趋势预测与政策决策支持的两阶段框架,以应对全球抗生素耐药性(AMR)危机。研究团队在WHO GLASS系统涵盖44个国家、5909个观测值(2021-2023年)的数据集上,评估了六种机器学习模型。XGBoost模型表现最佳,测试集平均绝对误差(MAE)为7.07%,$R^2$为0.854,较朴素基线提升83.1%。特征重要性分析显示,前一年的耐药率是最重要的预测因子(贡献度50.5%)。此外,研究构建了一个检索增强生成(RAG)管道,结合WHO政策文档向量库与本地部署的Phi-3 Mini语言模型,为政策制定提供可溯源、低幻觉的决策支持。

抗生素耐药性机器学习预测who glass数据检索增强生成公共卫生政策xgboost模型
q-bio 02-27 00:00

分支随机游走中的衰老效应:繁殖能力随时间衰减如何影响种群命运

本研究探讨了衰老现象对分支随机游走过程的影响。与经典模型中个体繁殖能力保持恒定不同,现实世界中个体的繁殖能力通常在达到峰值后随时间衰减。论文通过引入衰老机制,分析了繁殖率等参数的变化如何共同决定种群是走向灭绝、持续生存还是爆炸性增长,为理解具有年龄结构的种群动力学提供了新的理论框架。

分支过程种群动力学衰老效应随机模型繁殖率
q-bio 02-27 00:00

非线性粘弹塑性顶点模型:揭示组织流变学的细胞机制

本研究通过构建顶点模型的平均场流变关系,将细胞尺度和组织尺度的力学行为联系起来。与以往工作不同,模型引入了显式的粘性摩擦,并包含了两种产生主动各向异性应力的细胞机制。该平均场模型能够描述细胞形状以及非线性弹性和粘塑性响应。通过预测大振幅振荡剪切下的响应验证了模型的有效性。研究表明,不同顶点模型变体的流变特性高度依赖于模型细节。该方法具有普适性,可用于为任何基于细胞的生物组织模型构建非线性平均场本构关系。

组织流变学顶点模型平均场理论粘弹塑性形态发生细胞力学
q-bio 02-27 00:00

单方程解释肿瘤细胞在循环缺氧下的迁移-增殖动态

本研究提出了一个描述肿瘤细胞“迁移或增殖”动态的最小数学模型。模型包含两个表型不同的细胞群:一个进行线性扩散(迁移),另一个以氧依赖的方式增殖。局部氧浓度调控两种表型间的转换。研究核心在于,在循环缺氧条件下,这两个耦合的表型特异性方程能否简化为一个单一混合表型方程。作者建立了这个最小模型与一个简化模型之间的联系,后者在表型快速切换机制下,用单一细胞群方程描述了氧依赖的扩散和增殖。数值模拟验证了这一理论简化。

肿瘤动力学数学建模循环缺氧表型转换偏微分方程
q-bio 02-27 00:00

蛋白质语言模型如何识别序列重复:机制解析与生物学意义

本研究揭示了蛋白质语言模型(PLMs)识别序列重复的内部机制。模型通过两个主要阶段完成任务:首先,利用通用的位置注意力头和专门编码氨基酸相似性的生物特异性神经元构建特征表示;随后,通过“归纳头”关注重复片段间的对齐标记,从而准确预测。研究发现,模型处理近似重复的机制在功能上包含了处理精确重复的机制,表明PLMs结合了基于语言的模式匹配与专门的生物学知识来解决这一关键生物信息学任务。

蛋白质语言模型序列重复检测注意力机制可解释ai生物信息学进化过程
q-bio 02-27 00:00

利用大脑网络拓扑优化大规模脉冲神经网络模拟性能

本研究通过分析大规模脉冲神经网络模拟中的通信瓶颈,发现传统分布式模拟的主要耗时并非来自网络硬件或通信库本身,而是源于计算节点间计算时间的巨大差异导致的同步等待。作者提出了一种基于大脑区域拓扑结构的优化策略:大脑内部区域连接延迟短,而跨区域连接延迟长。利用这一特性,可将模拟任务映射到计算节点,实现“局部高频通信”与“全局低频通信”的混合架构。实验证明该策略能显著提升模拟性能,并为高效节能的神经模拟提供了新思路。

脉冲神经网络大规模模拟通信优化脑网络拓扑高性能计算神经形态计算
q-bio 02-27 00:00

模拟皮层神经元培养中的时空爆发模式研究

本研究通过模拟培养在微电极阵列上的神经元网络,深入分析了其发育过程中出现的爆发性活动时空特征。研究发现,网络爆发通常起源于少数特定位置,并以波的形式传播至整个网络。这种活动模式不需要神经元或网络参数的精细调节,具有鲁棒性。研究还探讨了爆发活动在发育过程中的变化规律,以及其触发机制对局部和全局网络特性的依赖关系。

神经元网络爆发活动时空模式计算神经科学网络发育
q-bio 02-27 00:00

核糖体:细胞中的“自私”主宰者

本文提出了一种颠覆性的进化假说:核糖体可能起源于RNA依赖性RNA聚合酶核酶的互利共生体,通过提供增强复制的肽段而建立关系。随着生命从RNA世界过渡到RNA-蛋白质世界,自主复制体对核糖体产生不可逆的依赖,以生产复制所需的蛋白质。随后的进化被解释为一场“核糖体接管”,它演化成消耗细胞大部分资源的中心,而其他细胞组件则确保了核糖体的增殖。从这个角度看,核糖体是终极的生物学自私元件。

核糖体起源自私元件rna世界共生进化细胞能量
q-bio 02-27 00:00

HATTER框架:人机协同主动学习加速酶功能预测

针对蛋白质序列数据爆炸式增长与实验验证功能数据积累缓慢的矛盾,本研究提出了HATTER框架。该框架将多种主动学习策略与人类专家实验标注相结合,用于高效微调酶功能预测模型。结果表明,主动学习训练在多个蛋白质序列评估数据集上取得了与标准监督训练相当的性能,同时所需模型更新更少、处理数据量更小,并大幅降低了计算成本。有趣的是,基于点的不确定性采样方法(如熵采样或边缘采样)与更复杂的贝叶斯采样或BALD等方法表现相当甚至更好,突显了训练数据序列多样性和模型架构设计的重要性。

主动学习酶功能预测人机协同计算生物学蛋白质序列
q-bio 02-27 00:00

基于平均场博弈的SEIR网络流行病接触策略研究

本文针对异质接触网络上的SEIR流行病,建立了一个平均场博弈模型。个体通过选择与自身状态相关的接触努力,以平衡感染损失与隔离带来的社会经济成本。纳什均衡由跨节点度类别的耦合Hamilton-Jacobi-Bellman/Kolmogorov方程组刻画。SEIR模型的关键在于存在潜伏期(E),它将感染与传染性分开,并在感染发生后改变了行为动机。在基准模型中,潜伏期个体最优选择是维持完全接触,而易感个体则根据感染压力和价值差,遵循一个显式的最佳反应规则来减少接触。研究还讨论了通过引入责任或合规激励,使潜伏期个体采取非平凡预防措施的扩展模型。通过不动点论证证明了均衡的存在性,并在合适的单调性条件下证明了唯一性。分析发现,较长的潜伏期会导致预防行为延迟启动,这可能削弱行为响应并导致更大规模的疫情爆发。数值实验展示了网络节点度和成本指数如何共同塑造均衡策略与疫情结果。

平均场博弈seir模型网络流行病学行为响应接触策略纳什均衡
AI速览助手