今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-02-24 02-24 15:24

今日q-bio领域研究聚焦于从分子设计到生态系统动力学的多尺度建模与机制解析,强调数据驱动方法与物理/几何原理的融合,以提升预测能力、可解释性及生物相关性。

  1. 分子设计与相互作用评分:生成式AI(如AAVGen、CoSiNE)与深度学习评分函数(BioLM-Score)正推动蛋白质/病毒衣壳的从头设计及药物结合亲和力预测,实现多目标优化与高效采样。
  2. 细胞与亚细胞过程的物理建模:研究通过力学理论(细胞分裂的几何极限)、化学反应网络分析(凸性框架捕捉平台行为)及精确随机模拟(大规模梯度优化),揭示微观过程的普适约束与动力学机制。
  3. 神经计算与脑功能解码:模块化被视为自然与人工智能的高效架构基石;新框架(如CRCC、认知动力学的场论)提升EEG跨站点泛化能力,并为皮层临界现象提供理论解释;运动系统研究则整合神经解剖与计算原理。
  4. 生态系统与生命起源的统计规律:理论工作挑战传统稳定性观点,提出物种丰度在波动相互作用下呈现普适幂律分布;而氨基酸分子轨道能隙(LUMOS框架)为生命检测提供了不依赖特定组成的通用生物特征。
  5. 健康与疾病的应用转化:研究利用真实世界数据揭示KRAS突变的时间依赖性治疗优势;开发模型无关的验证层(Project Hermes)显著降低可穿戴健康预测的误报率;数学模型则深入探究动脉粥样硬化斑块形成的细胞迁出机制。

2026-02-24 速览 · 定量生物学

2026-02-24 共 24 条抓取,按综合热度排序

← 返回日历
q-bio 02-24 00:00

BioLM-Score:结合语言先验与几何建模的蛋白质-配体评分新方法

本文提出BioLM-Score,一种用于蛋白质-配体结合亲和力评分的通用深度学习模型。它通过特定模态和结构感知的编码器分别处理蛋白质和配体,并利用生物分子语言模型增强其结构和化学表征。模型的核心是使用混合密度网络预测原子间距离的多模态分布,并据此推导基于统计似然的评分函数。在CASF-2016基准测试中,BioLM-Score在对接、评分、排序和筛选任务上均取得显著提升,同时兼具计算效率、良好的跨靶标泛化能力和可解释性,为基于结构的药物设计提供了新的实用工具。

蛋白质-配体评分深度学习结构感知编码语言模型先验混合密度网络药物发现
q-bio 02-24 00:00

神经场作为世界模型:大脑如何通过几何传播预测物理结果

本文提出了一种同构世界模型,该模型通过神经场与运动门控通道来保留感觉皮层的空间拓扑结构,使物理预测变为几何传播而非抽象状态转换。实验表明:1)局部连接足以学习弹道物理,预测能穿越中间位置而非“瞬移”;2)完全在想象中训练的策略迁移到真实物理的速度是潜在空间替代方案的两倍;3)仅通过视觉运动预测,运动门控通道就能自发发展出身体选择性编码。这暗示了直觉物理和身体图式可能源于空间结构化的神经动力学。

神经场世界模型直觉物理运动门控几何传播身体图式
q-bio 02-24 00:00

数据驱动方法揭示人脑白质功能组织及其与认知老化的关联

本研究开发了一个整合扩散磁共振成像(dMRI)与功能磁共振成像(fMRI)的数据驱动框架,通过“轨迹动态功能连接”(Track-DFC)来建模白质纤维束支持的动态功能耦合。利用独立成分分析与k-medoids聚类,研究者从人脑连接组计划(HCP)年轻成人数据中识别出功能一致的白质纤维束簇。在HCP老年队列中,这些簇的功能耦合强度和时间变异性均表现出广泛的年龄相关性下降。尤为重要的是,涉及控制、默认模式、注意和视觉系统的特定纤维束簇,显著介导了年龄与认知表现之间的关系。该研究描绘了白质的功能组织,为研究脑老化和认知衰退提供了有力工具。

脑白质功能连接数据驱动脑老化认知表现磁共振成像
q-bio 02-24 00:00

AAVGen:基于生成式AI设计靶向肾脏的腺相关病毒衣壳

本研究提出了AAVGen,一个用于从头设计腺相关病毒(AAV)衣壳的生成式人工智能框架。该框架整合了蛋白质语言模型、监督微调和一种名为组序列策略优化的强化学习技术,通过一个由三个ESM-2回归预测器(分别预测生产适应性、肾脏趋向性和热稳定性)构成的复合奖励信号进行引导。结果表明,AAVGen能生成多样化的新型VP1蛋白序列库,其中大部分变体在所有三个评估指标上均表现出优越性能,实现了多目标优化。AlphaFold3结构分析进一步证实,生成的序列在多样化的同时保留了典型的衣壳折叠结构。

基因治疗ai药物设计病毒载体工程蛋白质设计强化学习肾脏靶向
q-bio 02-24 00:00

化学反应网络松弛动力学的凸分析与广义梯度流框架

本研究针对具有平衡态的质量作用化学反应网络,获得了其向平衡态演化的Kullback-Leibler散度的上界。衰减速率由化学计量矩阵的奇异值、凸性参数以及通过变形指数函数定义的时间积分活性共同表征。研究进一步将这一分析框架扩展至广义梯度流体系,并强调了其在生物学中的相关性:所得界限适用于准稳态区域,该区域常见且功能重要的长时瞬态和平台行为。通过一个展示平台行为的催化反应网络案例,验证了该框架的有效性,表明界限能够捕捉由局部凸性诱导的缓慢松弛,并提供了一种基于界限的方法来量化反应网络中的松弛过程。

化学反应网络松弛动力学凸分析广义梯度流kullback-leibler散度准稳态
q-bio 02-24 00:00

生态系统稳定性新解:物种相互作用波动导致丰度呈现普适幂律分布

传统理论生态学将生态系统持久性等同于固定平衡点的稳定性。本研究提出,对生态系统持久性的主要威胁可能并非稳定性丧失,而是稳定平衡点“逃逸”至负象限(物种丰度为负)。在现实环境中,物种相互作用的波动不仅会扰动丰度,更会直接位移平衡点本身。理论分析发现,无论相互作用波动多小,只要其分布是轻尾的,物种的平衡丰度 $y$ 就会呈现重尾的幂律分布 $P(y) \propto 1/y^{\alpha}$,且指数 $\alpha=2$ 是一个普适值,与网络结构、群落大小和物种无关。对34个物种的实证分析显示,大多数物种丰度符合幂律,中位指数 $\alpha \sim 2.56$。研究还推导出导致群落“几乎必然”丧失可行性的临界噪声 $\sigma_c$,并发现 $\sigma_c(N) \sim N^{-1}$,表明更大群落对噪声诱导的可行性丧失显著更脆弱。最后,研究定义了全局和物种特异性可行性逃逸率的生物可测指标,并在98个真实互惠和食物网网络的动态模拟中成功预测了其脆弱性。

理论生态学生态系统稳定性幂律分布可行性理论群落脆弱性网络动力学
q-bio 02-24 00:00

CRCC:基于对比学习的跨被试跨站点EEG鲁棒表征学习框架

针对脑电图(EEG)神经解码模型在跨不同采集站点时泛化能力差的问题,本研究将其重新定义为偏倚因子分解的泛化问题。作者识别了三个基本偏倚因子,并提出一个通用训练框架,通过数据标准化和表征级约束来减轻其影响。研究构建了一个标准化的多站点重度抑郁症(MDD)EEG基准数据集,并引入CRCC——一个结合编码器-解码器预训练与联合微调的两阶段训练范式。该范式通过跨被试/站点的对比学习和站点对抗优化,在严格的零样本站点迁移下,平衡准确率提升了10.7个百分点,实现了对未见环境的鲁棒泛化。

脑电图跨站点泛化对比学习表征学习重度抑郁症对抗学习
q-bio 02-24 00:00

数据驱动模型揭示鹰类飞行动力学:可解释的模态结构

本研究首次利用动态模态分解(DMD)这一数据驱动方法,对鹰的运动捕捉数据进行分析,构建了可解释的飞行动力学生成模型。研究发现,复杂的飞行行为(如振翅、转向、着陆、滑翔)可由少数简单、可解释的模态结构(即基础的翼尾形态)线性组合来精确再现。模型仅需3个参数即可表征振翅,第4个参数整合转向动作,实现了对真实飞行数据的高精度重构。分析进一步揭示了飞行机制中存在类似简单步行模型的参数耦合,暗示了运动效率的普适原理。与传统基于物理原理的模型不同,该DMD模型直接拟合真实数据,为理解敏捷飞行的底层机制提供了新途径。

动态模态分解飞行动力学数据驱动模型生物力学运动捕捉可解释ai
q-bio 02-24 00:00

KRAS G12D突变在NSCLC中早期治疗优势显著,总生存期优于G12C

本研究利用真实世界数据,通过分段Cox模型揭示了KRAS G12D与G12C突变在非小细胞肺癌(NSCLC)患者中的时间依赖性风险模式。结果显示,在治疗早期(中位TTNT 23个月内),G12D患者的至下次治疗时间(TTNT)风险显著低于G12C(HR=0.41,p=0.043),且总生存期(OS)更优(HR=0.63,p=0.048)。晚期风险差异不显著。G12C肿瘤则具有更高的肿瘤突变负荷(TMB)和STK11/KEAP1共突变富集。研究支持针对G12D等位基因特异性疗法的开发。

非小细胞肺癌kras突变真实世界研究分段cox模型生存分析等位基因特异性疗法
q-bio 02-24 00:00

深度学习规模梯度优化的精确离散随机模拟

本研究提出了一种新方法,解决了连续时间马尔可夫链(CTMC)精确随机模拟中梯度学习受阻的难题。通过将前向模拟与反向微分解耦,利用硬分类采样生成精确轨迹,并通过连续的、大规模并行的Gumbel-Softmax直通替代模型传播梯度,该方法实现了远超现有模拟器的参数规模优化(超过四个数量级)。在可逆二聚化模型(误差0.09%)、遗传振荡器(误差1.2%)、一个包含203,796个参数并达到98.4% MNIST准确率的基因调控网络,以及离子通道门控的单通道实验记录($R^2 = 0.987$)上验证了其准确性、可扩展性和可靠性。GPU实现每秒可执行19亿步,与非可微分模拟器规模相当。

随机模拟梯度优化系统生物学深度学习马尔可夫链参数推断
q-bio 02-24 00:00

生理信息深度学习:下一代PBPK建模的多尺度框架

本研究提出一个统一的科学机器学习框架,旨在克服传统生理药代动力学模型在大规模模拟、参数识别和跨物种外推方面的挑战。该框架包含三大核心贡献:将药代动力学预测视为序列建模任务的PBPK Transformers;利用物理信息损失生成符合生物学规律的虚拟患者群体的生理约束扩散模型;以及结合图神经网络与神经常微分方程以学习连续跨物种缩放规律的神经异速生长模型。实验表明,该框架在约束条件下将生理违规率从2.00%降至0.50%,并为加速模拟提供了新路径。

pbpk建模科学机器学习深度学习药代动力学跨物种外推虚拟患者
q-bio 02-24 00:00

LUMOS框架:通过氨基酸分子轨道能隙区分生命与非生命

本研究提出LUMOS统计框架,通过分析样品中氨基酸的丰度加权HOMO-LUMO能隙(HLG)分布来区分生命与非生命起源。研究发现,非生物样品中氨基酸的HLG分布高度均匀,而生物样品则呈现更大方差且偏好较低HLG的氨基酸,这可能反映了生命对化学反应时空控制的普遍需求。该框架在多种环境和地外条件下区分准确率超过95%,为不依赖特定氨基酸组成的通用生物特征检测提供了新方法。

天体生物学生物特征分子轨道氨基酸分析统计框架
q-bio 02-24 00:00

Fine-Pruning:受大脑启发的算法,实现机器学习模型高效个性化

本研究提出了一种名为“精细剪枝”的生物启发式算法,旨在解决传统反向传播训练方法对计算资源和标注数据的高度依赖问题。该方法模仿大脑通过突触修剪进行学习的过程,能够在无需标签数据的情况下,以极低的计算成本对预训练模型进行个性化。实验表明,该方法成功应用于语音识别和图像分类模型(包括ResNet50),在将模型稀疏度提升约70%的同时,将准确率提高至约90%。这为在资源受限环境中开发高效、个性化的机器学习模型提供了新路径。

生物启发学习模型剪枝个性化模型无监督学习高效计算
q-bio 02-24 00:00

早期地球陨石坑中脂质体聚集的实验与数值模拟研究

本研究通过实验与数值模拟,为早期地球陨石坑底部可能发生脂质体聚集提供了证据。研究建立在先前发现之上,即脂质体在浅层太古代池塘中可免受有害紫外线辐射,从而存活足够长时间以进行两亲分子的自催化复制,以及发生突变和选择以最大化膜稳定性。为了融合、生长、交换内容物和膜以及分裂,脂质体需要形成一个密集的聚集体以实现紧密物理接触。研究表明,这种聚集在早期地球的碗状陨石坑中是可行的,尤其是在周期性地震扰动下。

生命起源脂质体陨石坑数值模拟早期地球环境
q-bio 02-24 00:00

基于循环神经网络的非侵入式脑电解码:实时预测大鼠自主运动速度

本研究开发了一种异步脑机接口,利用32通道头皮脑电信号,通过循环神经网络连续解码大鼠在非电动跑轮上的自主运动速度。模型在超过133小时的记录数据上训练,解码速度与真实速度的相关系数达0.88(R²=0.78)。研究发现解码主要依赖于视觉皮层电极和低频(<8 Hz)振荡,且神经特征在同一动物不同会话间具有一致性,但无法跨动物迁移。此外,皮层状态不仅编码当前速度,还包含未来及过去长达1000毫秒的运动动态信息。

脑机接口神经解码循环神经网络自主运动脑电图运动速度
q-bio 02-24 00:00

基于贝叶斯与空间统计的MINFLUX单分子成像无参考分析方法

针对MINFLUX单分子成像技术中因标记密度不均、检测误差及伪信号等挑战导致的结构推断难题,本研究提出了一种基于贝叶斯与空间统计的无参考端到端分析框架。该框架实现了:1)优于现有金标准的、具有不确定性评估的发射点聚类;2)分子结构超群的快速识别;3)无需先验模板即可重建数据集中的重复结构。在模拟与真实MINFLUX数据集上的验证表明,其发射点聚类与中心检测在所有条件下均保持高性能(分配准确率>0.75),在高标记效率下结构推断的F1分数可达约0.9,并成功实现了对Nup96和DNA折纸3x3网格的无模板重建。

单分子成像minflux贝叶斯统计空间统计无参考分析结构重建
q-bio 02-24 00:00

细胞分裂压力存在几何极限:三维限制下的力学边界

本研究提出了一个细胞在机械限制下分裂的最小力学理论。将细胞建模为具有有效各向同性张力的不可压缩体积,研究发现,限制条件约束了力学上允许的分裂沟形状。随着分裂沟半径减小,它会达到一个由限制诱导的最小值。超过此点,进一步的内陷不会改变界面形状,压力和轴向力均达到饱和。通过分析刚性、软性和强三维限制下的力与压力,研究揭示了一个单一的几何机制是这些不同情况的基础。在通过适当的几何尺度重新标度力和长度后,不同大小和表面张力的细胞都遵循一条普适曲线。研究结果表明,细胞分裂过程中的有丝分裂力传递和压力受到限制几何形状的约束,而材料特性和主动力则在这些几何强加的极限内选择工作点。

细胞分裂力学几何限制有丝分裂压力生物物理模型力饱和
q-bio 02-24 00:00

模块化:自然与人工智能的共同基石

本文通过整合人工智能与神经科学的研究线索,论证了模块化是支撑高效学习和强大泛化能力的核心组织原则。与依赖海量数据与算力的主流AI路径不同,模块化架构通过构建解决特定子问题的专门化组件,提供了符合“天下没有免费午餐定理”的问题特定归纳偏置。这不仅解释了人类智能的高效性,也为弥合自然与人工智能的差距、构建更通用且节能的AI系统指明了方向。

模块化人工智能神经科学归纳偏置通用智能高效学习
q-bio 02-24 00:00

CoSiNE模型:结合深度神经网络与进化动力学预测抗体亲和力

本研究提出CoSiNE模型,将深度神经网络与连续时间马尔可夫链结合,以建模抗体在亲和力成熟过程中的进化动力学。该模型在数学上证明了对复杂上位性相互作用的一阶近似能力,误差界与分支长度呈二次关系。在零样本变异效应预测任务中,CoSiNE超越了现有语言模型,并引入引导采样方案,实现了针对特定抗原的抗体亲和力高效优化。

抗体工程进化模型深度学习亲和力成熟变异预测
q-bio 02-24 00:00

认知动力学的金兹堡-朗道理论:临界标度与代谢调控

本研究构建了一个现象学有效场论,将生物智能描述为由持续代谢通量维持的宏观序参量。通过将认知建模为由变分自由能支配的粗粒度神经活动场,并采用高斯最大熵近似,推导出信息容量和结构敏感性的解析表达式。理论预测,当结构刚度K接近失稳阈值时,敏感性呈现普适的代数发散:$\chi \sim K^{-3/2}$,其指数$\gamma = 3/2$与平均场分支过程的普适性类别一致,从而为皮层动力学中观测到的雪崩尺寸指数$\tau \approx 3/2$提供了理论依据。该框架将成年认知识别为一种由代谢调控维持在临界状态附近的非平衡稳态,而病理衰退则对应于结构稳定性条件被破坏引发的离域转变。

认知动力学有效场论临界现象代谢调控非平衡稳态神经雪崩
q-bio 02-24 00:00

Project Hermes:为可穿戴健康预测系统添加模型无关的验证层

本文提出了Project Hermes,一个模型无关的验证层,旨在解决可穿戴健康预测系统因不确定性高而产生大量误报的问题。它将信号确认视为一个序列决策问题,利用大语言模型生成情境化查询来获取用户针对性反馈,并通过贝叶斯置信度更新来区分真阳性与误报。在一项为期60天的偏头痛预测纵向案例研究中,该系统将误报率从61.7%降低至12.5%,同时保持了89%的灵敏度,平均在症状发作前4.2小时发出预警。该工作将验证确立为一个独立于预测的核心计算问题。

可穿戴设备健康预测模型验证大语言模型贝叶斯更新误报减少
q-bio 02-24 00:00

运动系统的模块化架构:从神经组织到运动控制的计算原理

本文综述了模块化作为运动系统核心组织原则的证据与理论。作者首先从经典损伤研究到现代图论分析,总结了大脑模块化的证据,并探讨了模块化架构涌现与进化的计算优势。文章回顾了构成当前运动系统描述的主要神经解剖模块,并比较了三种主流的运动控制计算框架——最优反馈控制理论、肌肉协同理论和动力系统方法,指出它们都或明或暗地依赖于专门的计算模块。最后,文章对比了现有框架的优势与局限,并提出了构建更全面理论的研究方向。

运动控制模块化计算神经科学最优控制肌肉协同动力系统
q-bio 02-24 00:00

单细胞组学推动基因调控网络建模:动态性、细胞特异性与扰动分析

基因调控网络(GRN)定义了转录因子、染色质重塑因子与靶基因间的调控关系,对理解发育、疾病和进化至关重要。本综述总结了利用单细胞组学数据推断GRN的最新进展,重点聚焦于如何解析网络的动态变化、细胞类型特异性机制以及扰动响应。单细胞技术为计算模型提供了前所未有的高分辨率数据,从而能更深入地揭示因果调控过程。文章同时指出了该领域在整合多组学数据、验证因果性及跨细胞状态建模等方面仍面临的关键挑战。

基因调控网络单细胞组学计算模型动态分析细胞特异性扰动响应
q-bio 02-24 00:00

巨噬细胞趋化性迁出如何影响早期动脉粥样硬化斑块?一项数学模型研究

本研究构建了一个新颖的空间数学模型,以探究巨噬细胞趋化性迁出在早期动脉粥样硬化斑块形成中的作用。模型通过数学分析和数值模拟发现,巨噬细胞的迁移时间可作为预测斑块长期脂质负荷的可靠指标,并揭示了内弹性膜(IEL)对细胞迁出的潜在限速效应。当迁出受IEL限制时,模型预测斑块深处会出现非单调的细胞与脂质分布,导致巨噬细胞积聚。此外,研究意外发现,当趋化信号仅能短距离渗透时,迁出巨噬细胞的比例可能反而高于长程信号的情况。这些理论发现为在真实斑块数据中识别巨噬细胞迁出证据提供了新视角。

动脉粥样硬化数学模型巨噬细胞迁出趋化性斑块形成内弹性膜
AI速览助手