今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2025-12-25 12-25 15:27

今日q-bio领域研究呈现多学科交叉融合趋势,聚焦于从分子调控到宏观健康衰老的系统性理解与精准干预。核心议题包括:生化网络与基因调控的基本约束与设计原理数据驱动模型在药物发现与临床预测中的可靠性反思与公平性优化、以及利用计算建模与神经解码探究大脑功能与学习机制。

  1. 生化控制的基本约束:研究从信息论角度,为生化反馈控制中的“波动守恒定律”提供了精确证明,揭示了细胞为抑制特定组分波动,必须牺牲其他组分稳定性的基本设计权衡,将波动重新定义为控制必需的信息载体。
  2. 数据偏倚挑战药物发现AI:研究警示,基于文献数据训练的活性预测模型可能并未真正学习结构-活性关系,而是捕捉了化学家的研究偏好与风格信号,这对AI在药物发现中的可靠应用提出了关键质疑。
  3. 神经解码揭示预测性理解机制:通过分析聋人手语者的脑电信号,研究构建了预测性神经动态的时空表征,发现左半球与额叶的低频相干性是区分可理解语言的关键特征,且与经验相关,为理解大脑的感知生成模型提供了新证据。
  4. 主动推理提升模型学习效率:提出一种基于主动推理的结构学习方法,通过最优实验设计选择能最大化信息增益(即模型不确定性)的行动,以显著提高学习世界模型的样本效率,为高效的人工推理提供了新思路。
  5. 健康衰老的动态转折点:整合大规模队列数据建模发现,个体的损伤抵抗与恢复能力随年龄平稳下降,导致健康状态在约75岁左右出现从稳定良好向不良健康快速漂移的关键动态转变
  6. 临床预测模型的公平性优化:针对代谢相关脂肪性肝病(MASLD)开发的预测模型,在利用LASSO逻辑回归保证性能与可解释性的同时,通过机会均等后处理有效减少了不同种族/民族亚组间的预测差异,为平衡临床AI的效能与公平性提供了实践范例。

2025-12-25 速览 · 定量生物学

2025-12-25 共 14 条抓取,按综合热度排序

← 返回日历
q-bio 12-25 00:00

生化控制系统的动力学不确定性关系:利用稳态信息流证明波动守恒定律

本研究针对低拷贝数分子丰度波动问题,提出了一个基于概率流分解和互信息率的精确通用证明,证实了生化反馈控制中的一个基本约束:要抑制某一组分的丰度波动,网络中至少需要另一个“牺牲”组分承受更大的变异性。该工作表明,细胞组分的波动并非单纯的“噪声”,而可能是实现有效控制所必需的信息载体,为理解细胞控制系统的设计原理提供了新视角。

生化控制波动抑制信息流不确定性关系低拷贝数系统反馈控制
q-bio 12-25 00:00

机器学习预测药物活性可能依赖化学家偏好而非分子结构

研究发现,基于公开文献数据训练的机器学习模型,在预测分子生物活性时,可能并非真正学习结构-活性关系,而是通过识别“化学家风格信号”来推断实验意图。作者训练了一个包含1,815位化学家的分类器,仅凭分子指纹预测其作者,在基于骨架的划分下达到60%的top-5准确率。更关键的是,一个仅接收蛋白质标识和由结构推导出的“作者概率向量”的模型,其预测能力与能直接访问分子描述符的基线模型相当。这表明模型可能通过推断化学家的研究目标和偏好靶点来预测活性,而非建立独立于实验背景的化学理解。研究分析了数据泄露来源,提出了作者不相交的数据划分方法,并建议改进数据集实践以分离化学家意图与生物学结果。

机器学习药物发现数据偏差可解释性化学信息学基准测试
q-bio 12-25 00:00

解码视觉语言处理中的预测推理:时空神经一致性研究

本研究提出一种机器学习框架,通过分析聋人手语者观看动态视觉语言刺激时的脑电图(EEG)响应,解码大脑的预测推理机制。研究利用神经信号与光流运动特征之间的相干性,构建了预测性神经动态的时空表征。通过基于熵的特征选择,识别出能区分可理解语言输入与语言干扰(时间反转)刺激的特定频率神经特征。结果显示,分布式的左半球和额叶低频相干性是语言理解的关键特征,且这些神经特征与年龄相关,体现了经验依赖性。该工作为探究大脑中经验驱动的感知生成模型提供了一种新颖的多模态方法。

神经解码预测推理视觉语言脑电图时空相干性机器学习
q-bio 12-25 00:00

主动推理与人工推理:通过最优实验设计提升世界模型学习效率

本文提出了一种基于主动推理的结构学习方法,旨在通过选择能最大化信息增益的行动来高效学习底层世界模型的结构。该方法的核心是计算行动的期望自由能,其中信息增益部分通过贝叶斯模型归约快速评估不同模型的后验信念差异(即KL散度)来衡量。这使得智能体能够以最优实验设计的精神,选择最能消除模型间不确定性的行动。研究以部分可观测的离散“三球”范式为例,展示了通过主动寻求能解决最大模型不确定性的结果,可以显著提高样本效率,从而促进对生成结果的世界模型的理解。

主动推理结构学习贝叶斯模型归约期望自由能最优实验设计样本效率
q-bio 12-25 00:00

H1/H2:基于等位基因中心的新型泛基因组矩阵表示方法,实现高效可扩展分析

本研究提出了一种名为H1的等位基因中心泛基因组矩阵表示法,通过自适应等位基因压缩编码精确的单倍型成员关系,将等位基因作为首要对象处理。该方法根据携带者分布选择最优编码,在常见和罕见变异上均实现了接近最优的存储效率。同时,研究者还引入了H2,一种从相同等位基因-单倍型关联信息衍生的路径中心对偶表示,在保持信息内容完全等价的同时恢复了明确的单倍型顺序。利用真实人类基因组数据的实验表明,该表示法在保持与泛基因组图信息等价的前提下,显著提升了压缩效率,尤其对于结构变异。H1为可扩展的泛基因组分析及下游应用(如罕见变异解读和药物发现)提供了统一且具有群体感知能力的基础。

泛基因组等位基因中心数据压缩单倍型结构变异生物信息学
q-bio 12-25 00:00

基于转录组与元启发式算法的AML个性化药物生成框架

本研究针对急性髓系白血病(AML)的分子异质性,提出了一种端到端的计算框架,将患者特异性转录组学与从头药物发现相结合。通过分析TCGA-LAML队列的RNA测序数据,利用WGCNA筛选出20个高价值生物标志物(如HK3、SIGLEC9),并使用AlphaFold3建模其结构。研究开发了一种新颖的“反应优先”进化元启发式算法,结合多目标优化,根据识别的药物结合热点从片段库中组装新型配体。生成的化合物具有类药性(QED评分0.5-0.7),并通过ADMET分析和分子对接验证了其结合潜力(如配体L1与A08A96的结合自由能为$-6.571 \text{ kcal/mol}$)。该框架为AML及其他疾病的精准肿瘤学提供了可扩展的蓝图。

精准医疗药物发现元启发式算法转录组学分子对接急性髓系白血病
q-bio 12-25 00:00

研究发现:75岁是健康衰老的关键转折点

本研究结合健康与退休研究(HRS)和英国老龄化纵向研究(ELSA)中 N=47592 名个体的数据,提出了一个整合衰老微观机制(持续衰退)与重大健康赤字事件(如发病、失能)的建模框架。研究发现,个体的损伤抵抗能力(稳健性)和损伤恢复能力(恢复力)均随年龄和衰弱指数(FI)的增加而平稳下降。这导致了两种截然不同的健康动态状态:一个稳定在良好健康(低FI)的年轻状态,和一个向不良健康(高FI)漂移的老年状态。这两种状态在约75岁时存在一个急剧的转变点。由于跨越此临界点后FI积累风险急剧加速,70-80岁是理解和干预晚年健康衰退的关键窗口。

衰老动力学健康转折点衰弱指数纵向研究损伤与修复
q-bio 12-25 00:00

EEG基础模型:当前进展与未来方向的关键性综述

本文对十种早期脑电图(EEG)基础模型(EEG-FMs)进行了系统性综述。研究发现,当前EEG-FMs普遍采用基于序列的建模方案,依赖Transformer架构,并通过重建掩码后的EEG时间序列进行自监督学习。然而,模型的评估方法仍存在异质性且范围有限,难以评估其实际开箱即用效果。未来研究需采用标准化且贴近现实的评估体系,展示更显著的规模效应,并在整个EEG表征学习流程中做出有原则且可信赖的选择。

脑电图基础模型自监督学习transformer表征学习神经科学
q-bio 12-25 00:00

MASER模型:基于LASSO逻辑回归的代谢相关脂肪性肝病预测新方法

本研究开发了名为MASER的预测模型,用于早期识别代谢相关脂肪性肝病(MASLD)。该模型采用LASSO逻辑回归方法,基于电子健康记录中的临床特征(如前10个SHAP重要性特征)进行预测。在包含超过10万患者的数据集上,模型在公平性调整前AUROC达0.84,准确率78%。通过应用机会均等后处理方法,模型在减少种族/民族亚组间差异的同时保持了可解释性,为临床决策提供了平衡性能与公平性的工具。

机器学习脂肪肝预测临床决策公平性算法逻辑回归电子健康记录
q-bio 12-25 00:00

高传播率下SIR传染病模型的多时间尺度渐近解

本研究针对高基本再生数(R0)的SIR传染病模型,提出了一类多时间尺度渐近解。通过将R0的倒数作为展开参数,该解结合了快、慢两种时间尺度,能够准确刻画传染病爆发初期急剧上升与后续漫长平台期相衔接的典型模式。基于渐近分析,研究推导出了感染、易感和康复人群数量的显式解,并据此评估了疫情峰值的时间和规模。该渐近结果与基于SIR模型的数值模拟结果完全吻合。

传染病模型sir模型渐近分析多时间尺度基本再生数疫情动力学
q-bio 12-25 00:00

基于数学模型的细胞悬液慢速冷冻优化方法

本研究提出了一种从基本原理出发的数学方法,用于优化细胞悬液慢速冷冻过程中的冷却动力学,旨在降低细胞损伤风险。该方法通过计算预测生成改进的冷却曲线,并利用文献数据和新的实验结果对预测进行了验证。研究为细胞冷冻保存提供了一种通用的计算优化途径,有望减少目前对经验性优化的依赖。

细胞冷冻保存慢速冷冻数学模型优化算法细胞损伤
q-bio 12-25 00:00

基因调控级联的计时精度极限:噪声与级联长度的权衡

本研究通过建立爆发-稀释混合随机模型,系统分析了基因调控级联的计时精度极限。研究首先在单基因系统中复现了最小化首次通过时间变异性的最优激活阈值。对于双基因级联,研究发现了由内在噪声水平与蛋白质稀释率之比决定的三种优化机制,明确了级联耦合何时能改善或恶化计时精度。推广至任意长度级联后,研究得出了一个简单的数学条件,用于判断级联中新增基因能否基于其内在噪声和稀释率降低计时噪声。在相同基因级联的特例中,理论预测表明随着级联长度增加,首次通过时间噪声会被抑制,且存在一个能降低相对计时波动的平均时间。这些结果为探索生物系统中的计时控制提供了最小分析框架。

基因调控计时精度随机模型系统生物学噪声优化
q-bio 12-25 00:00

梯度扩散:灵敏度矩阵共模拟实现神经模拟器中的活动适应与可学习可塑性

本研究提出了一种名为“梯度扩散”的新方法,通过将生物逼真神经模型的灵敏度方程与模型本身进行共模拟,实现了对细胞参数的在线调谐。该方法的核心在于利用灵敏度方程与通用神经元模型在形式上的相似性,使其能够在现有脑模拟器中运行。这突破了传统大规模神经动力学模型参数固定、难以适应新环境或组合成更大网络的局限,为模拟生物体内通过稳态可塑性实现的连续自适应机制提供了计算框架。该方法不仅支持离线和在线活动调谐,还为通过元学习研究可塑性机制或将在线调谐视为黑盒可塑性机制开辟了道路,其通用性有望惠及更多计算科学领域。

计算神经科学脑模拟参数调谐稳态可塑性灵敏度方程共模拟
q-bio 12-25 00:00

Hillclimb-Causal Inference:数据驱动方法揭示父母行为与儿童外化行为的因果路径

本研究提出了一种名为Hillclimb-Causal Inference的因果发现方法,该方法结合了爬山搜索算法与定制的线性高斯贝叶斯信息准则(BIC)。基于美国青少年脑认知发展(ABCD)研究的数据,该方法识别了父母行为与儿童外化行为(如攻击性、多动)之间的因果路径。分析发现,父母酒精滥用等行为问题对儿童外化行为的直接效应(0.33)远高于儿童的多基因风险评分(0.07)。通过结构方程模型(SEM)量化后,父母物质滥用(酒精、药物、烟草)的总效应超过1.1。研究强调了环境因素在儿童行为发展中的关键作用。

因果推断儿童行为父母行为多基因风险评分结构方程模型数据驱动
AI速览助手