今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-02-17 02-17 15:39

今日q-bio领域研究呈现多学科交叉融合趋势,核心聚焦于开发新计算框架以解决传统生物模型在复杂性、可解释性和数据效率上的局限,并深入探索生物系统从分子到生态层面的涌现性机制。

  1. 新计算范式赋能生物分子研究:研究重点从单纯追求预测精度转向构建可解释、可控制且物理信息丰富的模型。例如,通过“规范化扩散”新框架处理分子图生成的对称性问题,以及用神经符号框架Protect*实现可控逆合成,都强调将领域知识(如化学规则)与深度学习结合。
  2. 预训练模型的潜力与局限评估:多项研究系统评估了预训练模型(如Boltz、ProtBERT/ESM2)在跨任务(小分子表征、蛋白质设计)中的迁移能力。核心发现是,捕获可迁移的物理化学信息是可能的,但最优性能严重依赖任务特定的微调,揭示了当前通用表征的边界。
  3. 复杂生物系统的物理与计算建模:研究者运用统计物理、动力系统理论和生态学模型,定量解析高层次生物复杂性。例如,用巨正则系综框架解释蛋白质超大复合物组装,或用扩展的Lotka-Volterra模型结合时空噪声解决多样性-稳定性悖论,将宏观现象与微观机制联系起来。
  4. 数据高效与自动化方法加速发现:面对湿实验成本高、数据稀疏的挑战,研究强调通过算法设计减少对大量标注数据的依赖。例如,利用多目标贝叶斯优化高效发现冷冻保护剂配方,以及CellMaster利用大语言模型实现零样本单细胞注释,都致力于提升生物发现的效率与可及性。

2026-02-17 速览 · 定量生物学

2026-02-17 共 24 条抓取,按综合热度排序

← 返回日历
q-bio 02-17 00:00

Boltz模型在小分子原子级表征学习中的表现评估

本研究探讨了前沿蛋白质共折叠模型Boltz在小分子任务中的原子级表征能力。通过将其应用于ADMET性质预测、分子生成与优化等多个基准测试,发现Boltz的表现与专门的小分子模型基线相当。结果表明,Boltz模型可能捕获了可迁移的化学物理信息,而不仅仅是蛋白质进化信号,这为将其确立为小分子原子级表征学习的强基线提供了依据。

分子表征学习admet预测蛋白质模型小分子模型原子级表征模型迁移
q-bio 02-17 00:00

图神经网络揭示模拟神经集群的结构与功能

本研究提出了一种基于图神经网络(GNN)的新框架,用于分析由数千个神经元组成的复杂异质系统的动态活动。该框架不仅能可靠地预测神经活动,还能将系统的复杂时间动态分解为简单、可解释的表示。具体而言,该方法能够联合揭示神经网络的连接矩阵、神经元类型、信号传递功能,并在某些情况下识别出隐藏的外部刺激。与循环神经网络(RNN)和Transformer等强调预测精度但可解释性有限的现有机器学习方法相比,此方法在保持预测能力的同时,提供了对大规模神经集群调控机制的可解释性分解。

图神经网络神经集群可解释性ai系统分解连接矩阵
q-bio 02-17 00:00

CellMaster:基于大语言模型的零样本单细胞类型注释新方法

本研究提出CellMaster,一种模仿专家实践的AI智能体,用于解决单细胞RNA测序分析中细胞类型注释的瓶颈问题。该方法创新性地利用大语言模型(如GPT-4o)编码的生物学知识,无需预训练或固定标记基因数据库,即可进行零样本注释并提供可解释的依据。在涵盖8种组织的9个数据集上,CellMaster在自动模式下的准确率比最佳基线方法(如CellTypist和scTab)平均提升7.1%;在引入人机协同精修后,优势扩大至18.6%,在亚群细胞上的增益高达22.1%,尤其在基線方法常失效的罕见及新型细胞状态识别上表现突出。

单细胞分析细胞注释大语言模型零样本学习人机协同
q-bio 02-17 00:00

Protect*:通过神经符号状态编码实现可控逆合成

本研究提出Protect*,一个神经符号框架,旨在解决大语言模型在逆合成规划中缺乏精细控制的问题。该框架将基于规则的符号推理(使用55+个SMARTS模式和40+个保护基数据库)与神经模型的生成能力相结合。通过“主动状态跟踪”,系统将硬符号约束(如保护特定化学敏感位点)注入神经推理过程。案例研究表明,该方法能够为红霉素B等复杂天然产物发现新颖且可靠的合成路线,实现了专家级的自主规划能力。

逆合成规划神经符号ai大语言模型化学信息学可控生成保护基策略
q-bio 02-17 00:00

时空噪声如何稳定高度竞争生态系统的无限多样性

经典生态模型认为大型、多样的群落不稳定,这与自然界观察到的稳定生物多样性相矛盾。本研究通过扩展广义Lotka-Volterra模型,纳入空间结构和时空环境波动,发现单独的空间结构或环境噪声均无法解决多样性-稳定性悖论,但二者的结合效应允许任意多物种在强无序竞争下稳定共存。分析表明,时空噪声驱动了丰度波动的异常标度(即泰勒定律),在群落层面表现为有效的亚线性自抑制作用,使高多样性极限下的群落趋于稳定和渐近中性。这为复杂群落的持久性提供了一种普适机制。

生态稳定性生物多样性时空噪声lotka-volterra模型泰勒定律群落共存
q-bio 02-17 00:00

量子电动力学启发的流行病模型:用规范场理论解释非局部传播与超级传播

本研究提出了一种受量子电动力学(QED)启发的规范场流行病模型,突破了经典SIR模型依赖“直接接触”的范式。模型将环境视为病原体场φ,通过规范相互作用介导传播,从而自然地解释了疫情的非局部特征和超级扩散现象。利用Doi-Peliti形式体系,研究者推导了系统的有效作用量和费曼规则,并运用标准QED技术,将重整化的病原体质量、德拜屏蔽等概念与流行病学参数(如有效再生数R_eff)联系起来,揭示了疫情暴发条件与病原体质量相变之间的对应关系。

规范场理论非局部传播量子流行病学超级传播者有效再生数相变
q-bio 02-17 00:00

分子动力学模拟助力冷冻电镜断层扫描解析生物分子构象变化

冷冻电镜断层扫描(cryo-ET)能在原位揭示细胞内的分子组织,但其数据常受噪声、缺失锥效应及分子连续构象变化干扰,且原位环境拥挤导致可提取粒子数有限,难以进行精细分类。这促使研究重点从高分辨率结构解析转向低分辨率密度图的验证、解释及构象灵活性分析。分子动力学(MD)模拟为此提供了物理基础,能探索与实验数据及分子能量学一致的连续构象转变。本文综述了MD模拟在cryo-ET中的应用,重点介绍了其在构象景观确定新方法中的作用及其对获得新生物学见解的贡献。

冷冻电镜断层扫描分子动力学模拟构象景观原位结构生物学连续构象变化生物分子
q-bio 02-17 00:00

预训练嵌入在蛋白质设计中的极限:以AAV载体活性预测为例

本研究以腺相关病毒衣壳蛋白为案例,系统评估了ProtBERT和ESM2等多种预训练嵌入模型在机器学习引导的蛋白质设计中的表现。研究发现,在微调前,氨基酸级嵌入在监督预测任务中优于序列级表示;而在无监督场景下则相反。然而,最优性能仅在嵌入模型使用任务特定标签进行微调后才能实现,此时序列级表示表现最佳。研究还表明,要使序列表示产生显著变化所需的序列变异程度,通常超出了生物工程研究中探索的范围,这凸显了在稀疏或高度局部化突变的数据集中进行微调的必要性。

蛋白质设计预训练模型序列嵌入生物工程机器学习aav病毒
q-bio 02-17 00:00

多目标贝叶斯优化加速冷冻保护剂配方发现

本研究提出了一种结合高通量筛选与多目标贝叶斯优化的数据高效框架,用于加速冷冻保护剂(CPA)鸡尾酒配方的设计。该框架通过训练概率代理模型来预测配方的浓度和细胞存活率,并量化不确定性,然后迭代地选择能改善帕累托前沿的实验配方。湿实验验证表明,该方法能以更少的实验次数,同时发现高CPA浓度和高细胞存活率的配方,相比基线方法将主导超体积分别提升了9.5%和4.5%。在合成研究中,仅需最先进多目标方法30%的评估次数即可获得同等质量的帕累托最优解集,相当于节省约10周实验时间。

冷冻保护剂贝叶斯优化多目标优化高通量筛选细胞保存
q-bio 02-17 00:00

泊松变分自编码器中的信息处理代谢成本研究

本研究提出泊松变分自编码器(P-VAE)作为能量约束计算的理论框架。研究发现,在泊松假设下,变分自由能最小化中的KL散度项与神经元先验发放率成正比,从而产生一个惩罚高基线活动的代谢成本项。这种结构将抽象的信息论量——编码率——与具体的生物物理变量——发放率——耦合起来,实现了编码保真度与能量消耗之间的权衡。通过系统比较P-VAE与高斯VAE,研究证实这种代谢成本结构是泊松统计特有的,为资源受限的计算理论提供了新基础。

计算神经科学变分自编码器能量约束稀疏编码泊松统计信息处理
q-bio 02-17 00:00

个性化饮食系统:通过最小食物替换实现更营养、更经济的餐食

本研究提出一个端到端框架,旨在将饮食标准转化为完整的餐食,同时最小化改变。基于美国“我们吃什么”数据库中135,491份餐食数据,研究识别出34种可解释的餐食原型,并以此为基础,利用生成模型和分量预测器来满足美国农业部营养目标。在原型内比较中,生成的餐食在遵循推荐每日摄入量目标方面提升了47.0%,同时成分上接近真实餐食。结果表明,通过允许1-3种食物替换,平均可创造出营养提升10%、成本降低19-32%的餐食。该框架可将饮食指南转化为现实、预算友好的餐食和简单替换方案,为临床决策支持、公共卫生项目和消费应用提供基础,推动日常营养的规模化、公平性改善。

个性化营养饮食生成模型餐食原型成本效益食物替换公共卫生
q-bio 02-17 00:00

虚拟现实中人机色彩恒常性机制对比研究

本研究将基于ResNet U-Net的像素级深度神经网络色彩恒常性模型与人类视觉表现进行对比评估。模型通过迁移学习在虚拟现实渲染图像上微调,采用与人类实验相同的无色物体选择任务进行评估。结果显示,模型与人类在基线条件下均表现出高色彩恒常性,当移除局部环绕或空间平均颜色线索时,两者均出现相似的条件依赖性性能下降,验证了模型对人类色彩恒常机制的模拟能力。

色彩恒常性深度神经网络虚拟现实人机对比迁移学习视觉机制
q-bio 02-17 00:00

动态随机图上的SIR感染模型:双向反馈如何产生多重疫情峰值

本研究在稠密动态随机图上构建了易感-感染-恢复(SIR)模型,其中顶点(个体)与边(接触关系)的动力学是共同演化的,即相互影响。边根据相连顶点的状态、感染时长以及易感/感染个体的总密度而出现或消失。主要结果在graphon空间中建立了易感、感染、恢复顶点密度以及底层演化随机图的泛函大数定律。通过模拟发现,该模型能产生多重疫情峰值——这一现象在实际流行病中被观察到,并揭示了疫情峰值如何依赖于底层图的演化速率。证明的关键在于构建一个模仿过程,通过用均值场类型的单向反馈来近似双向反馈,并引入方法学扩展来处理边动力学受群体比例影响的一般情形。

流行病模型动态随机图共同演化sir模型graphon理论多重峰值
q-bio 02-17 00:00

高阶Hit-&-Run采样器:高效处理线性约束密度采样难题

本文提出一种新颖的约束采样算法,用于解决贝叶斯逆问题中常见的线性约束密度采样难题。该方法巧妙地将目标对数密度的梯度、曲率等高阶信息,与能确保生成可行提案的Hit-&-Run机制相结合。相比现有方法,该算法在复杂约束密度上的采样效率显著提升,为受约束的马尔可夫链蒙特卡洛(MCMC)采样提供了更优解。

约束采样mcmc算法贝叶斯逆问题线性约束hit-&-run高阶信息
q-bio 02-17 00:00

漂移-扩散匹配:在非对称神经网络中嵌入随机动力学

本研究提出了“漂移-扩散匹配”框架,用于训练连续时间循环神经网络(RNN)在低维潜在子空间中表示任意随机动力系统。该框架突破了传统对称连接的限制,允许网络具有非对称性,从而能够精确嵌入给定随机微分方程的漂移和扩散项,包括非线性、非平衡乃至混沌吸引子等复杂动力学。作为应用,研究者构建了能够通过输入驱动或非平衡流自主在不同吸引子间切换的RNN模型,为联想记忆和序列(情景)记忆提供了统一的计算模型。通过分析网络连接的非对称性和时间不可逆性,研究揭示了这些动力学在网络中的编码机制,将吸引子神经网络理论扩展到了非平衡领域。

循环神经网络随机动力学非对称连接吸引子网络非平衡统计力学神经计算
q-bio 02-17 00:00

分子图生成新范式:通过规范化视角重构扩散模型

本文提出了一种名为“规范化扩散”的新框架,用于处理具有群对称性(如置换、旋转)的生成任务。传统方法依赖等变架构约束,而本方法首先将样本映射到规范化的轨道代表(如特定姿态或顺序),然后在规范切片上训练无约束的扩散模型,最后通过采样随机对称变换来恢复不变分布。理论证明该方法具有正确性、普适性和更强的表达能力,并能通过消除群混合带来的扩散分数复杂性来加速训练。在 $S_n \times SE(3)$ 对称性下的分子图生成任务中,该方法显著优于等变基线模型,并在 GEOM-DRUG 数据集上取得了最先进的性能。

扩散模型分子生成群对称性规范化几何深度学习生成模型
q-bio 02-17 00:00

男性面部宽度比例与主观美感的关系研究

本研究基于Pallett等人(2010)的方法,探究了男性面部中眼间距与整体面部宽度的比例(宽度比)与主观美感的关系。研究使用芝加哥面部数据库中的图像,通过创建低、中、高三种宽度比的平均面部,并系统性地调整其比例,生成了21个可比较的面部图像。通过二选一迫选任务收集数据,并采用贝叶斯模型进行分析。结果支持了面部比例的平均性与更高感知吸引力相关的假设,强调了控制图像处理效应及考虑种族作为潜在调节变量的重要性。这些发现为理解面部美学及人类感知的认知过程提供了数据基础,在广告、人工面部生成及整形外科等领域具有应用价值。

面部美学宽度比例贝叶斯模型平均性假说认知感知图像处理
q-bio 02-17 00:00

Hermes:基于大规模DEL数据训练的可泛化蛋白质-配体结合预测模型

本研究提出Hermes,一个仅使用DNA编码化合物库(DEL)数据训练的轻量级Transformer模型。DEL数据通过统一实验协议生成,覆盖数百种蛋白质靶点和海量化合物的结合信息,有效避免了传统公共亲和力数据集因来源混杂导致的偏差问题。结果表明,Hermes虽未接触传统亲和力测量数据,却能有效泛化至未见靶点、新化学骨架及外部基准测试,其简洁架构也适用于大规模虚拟筛选。这证明了DEL数据本身足以捕获可迁移的蛋白质-配体相互作用表征。

蛋白质-配体结合dna编码化合物库transformer模型虚拟筛选可泛化预测计算生物学
q-bio 02-17 00:00

生长反馈与扩散耦合驱动癌症表型多样性:从双稳态到四稳态的转变

本研究探讨了在癌症等多稳态疾病中,基因调控网络与环境因素(如资源竞争和空间扩散)的相互作用如何决定细胞行为和表型异质性。通过反应-扩散模型,研究发现高资源竞争下的双稳态基因回路可产生多种新兴表型。空间扩散与内在非线性耦合进一步驱动了独特的时空动态,其可塑性受稳态点稳定性、扩散率和扩散不对称性影响。该工作为理解癌症转移和进展提供了新视角。

癌症异质性多稳态反应扩散模型资源竞争表型可塑性基因回路
q-bio 02-17 00:00

统计物理框架揭示拥挤细胞内蛋白质超大复合物的组装机制

本研究提出了一个基于巨正则系综的统计物理框架,用于解析蛋白质超大复合物(如染色质重塑复合物INO80)在拥挤细胞环境中的涌现性组装机制。该框架整合了质谱数据集中的蛋白质相对丰度和交联连接信息,发现了一类“发散性”蛋白质亚基。这些亚基在排除体积效应的驱动下,能够超越最近邻相互作用,协调选择性组分形成构型各异的簇状结构,从而重塑复合物的整体架构。该工作将大分子拥挤度视为代表细胞状态的关键物理化学变量,为理解具有松散模块的蛋白质超大复合物的动态构型提供了机制性见解。

统计物理蛋白质组装大分子拥挤染色质重塑巨正则系综质谱分析
q-bio 02-17 00:00

抗生素循环治疗中细菌选择与灭绝的条件:生长-杀灭权衡模型

本研究提出了一个最小化种群动力学模型,用于分析在周期性使用抗生素或消毒剂的治疗过程中,细菌种群的选择动态。模型将细菌对抗菌药物敏感性降低(如产生耐药性或耐受性)的进化,建模为生存优势(杀灭率降低)与潜在适应度代价(生长速率降低)之间的权衡。通过该模型,研究者推导出了基于细菌生长率和杀灭率的关键表达式,可用于预测周期性抗菌治疗的成败。这些结果可直接应用于优化现实中的抗菌方案,以预防耐药或耐受菌株的选择与传播。

抗生素耐药性种群动力学进化权衡周期性治疗细菌选择数学模型
q-bio 02-17 00:00

社会实体的演化起源:从集体意向性到非人类动物的社会建构

本文探讨了社会实体存在的哲学与演化基础,认为社会实体(如制度、规范)的存在依赖于两个或以上个体在联合活动中的集体接受或承认。作者提出,联合活动依赖于行动计划的协调,而行动计划的协调又依赖于集体意向性能力。通过论证社会实体所依赖的集体意向性在形而上学上可还原为相关的个体意向,本文为“社会实体具有演化上的原始性”这一观点提供了新的论据,并以此为基础,探究了非人类动物创造社会实体的能力究竟有多原始。

社会实体集体意向性演化起源非人类动物哲学基础社会建构
q-bio 02-17 00:00

准物种理论新突破:用生态多样性指标预测病毒进化定位

本研究在艾根模型框架下,建立了一个简洁的通用关系式,将准物种的希尔数(生态学多样性指标)与有效适应度方差和平均突变率平方的比值联系起来。该比值被称为定位因子,源于对分解的惊奇度或随机熵变化率的均值近似。这一关系式不仅为理解任意适应度景观和突变率下的准物种定位程度提供了新方法,其定义的希尔数组合还可作为实际病毒准物种的复杂性或多样性度量补充,具有明确的生物学解释基础。

准物种理论希尔数突变选择动力学病毒进化适应度景观生态多样性
q-bio 02-17 00:00

Rawsamble:首个无需碱基识别的纳米孔原始信号重叠组装方法

本研究提出Rawsamble,首次实现了无需参考基因组和碱基识别(basecalling)的纳米孔原始信号直接分析与从头组装。该方法采用基于哈希的种子搜索机制,直接在原始信号层面进行全对全重叠检测,并将检测到的重叠区域输入现有组装器miniasm构建组装图。评估显示,与使用Dorado(最快模式)进行碱基识别、minimap2进行重叠检测的传统流程相比,Rawsamble平均提速5.01倍(最高23.10倍),平均降低峰值内存使用5.74倍(最高22.00倍)。使用Rawsamble的重叠结果可构建出与minimap2结果精度相当、长度可达半个染色体(如大肠杆菌230万碱基)的unitig。

纳米孔测序原始信号分析从头组装哈希搜索计算基因组学生物信息学
AI速览助手