今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2026-02-20 02-20 15:24

今日q-bio领域整体聚焦于开发新型计算框架与分析方法,以解决生物医学数据整合、疾病诊断、演化机制解析及微观过程监测中的关键挑战,并探索感知与行为的基本原理。

  1. 感染监测的快速替代方案:研究验证了结合MALDI-TOF质谱与耐药谱的机器学习框架,可作为全基因组测序的快速、经济替代方案,用于医院感染暴发检测,有望提升疫情监测的普及性与时效性。
  2. 分布式环境下的轻量级AI:针对资源受限场景(如农业),提出了超轻量联邦学习框架U-FedTomAtt,通过极简网络结构与新型聚合算法,在分布式数据下实现高精度番茄病害识别,平衡了性能与计算开销。
  3. 生物制造的数据标准化基石:为应对精密发酵领域的数据孤岛问题,开发了开源本体论PREFER,旨在建立统一数据标准,为整合多源数据、训练可靠的预测性机器学习模型奠定基础,推动可互操作生物过程系统的发展。
  4. 基础模型机制的可解释性评估:通过系统评估框架发现,当前单细胞基础模型(如scGPT)的注意力机制虽能捕获基因共表达等层级信息,但对扰动预测的增量价值有限,提示其尚未充分解析独特的基因调控信号。
  5. 个性化脑网络分析新方法:针对阿尔茨海默病等痴呆症的鉴别诊断难题,提出了基于概率不变随机游走的脑回折叠网络分析方法,克服了传统图谱节点不对齐的局限,为利用个体化皮层形态特征进行诊断提供了新思路。
  6. 基因组模型的新预训练范式:提出的JEPA-DNA框架通过联合嵌入预测架构,使基因组基础模型在预训练时关注高级功能信息,而非仅局部序列模式,为构建真正理解序列功能逻辑的模型提供了更优路径。

2026-02-20 速览 · 定量生物学

2026-02-20 共 16 条抓取,按综合热度排序

← 返回日历
q-bio 02-20 00:00

利用MALDI-TOF质谱与耐药谱进行医院感染暴发快速检测的机器学习框架

本研究探索了两种快速、经济的全基因组测序替代方案——基质辅助激光解吸电离飞行时间质谱与抗菌药物耐药谱——在医院感染暴发检测中的应用。研究者开发了一个机器学习框架,从MALDI-TOF质谱数据和耐药模式中提取信息表征,并探索了二者的融合。多物种分析表明,在某些情况下,这两种方法有潜力减少对昂贵且耗时的全基因组测序的依赖,从而实现更易普及、更快速的疫情监测。

医院感染监测maldi-tof质谱抗菌药物耐药性机器学习暴发检测快速诊断
q-bio 02-20 00:00

U-FedTomAtt:面向番茄病害识别的超轻量联邦学习框架

本文提出U-FedTomAtt,一种用于资源受限分布式环境的超轻量联邦学习框架,旨在实现番茄病害的精准识别。该框架核心是一个仅含245.34K参数和71.41 MFLOPS的超轻量神经网络,融合了扩张瓶颈模块、线性变换器以及新颖的局部-全局残差注意力模块,以平衡模型性能与计算开销。同时,作者提出了联邦双自适应权重聚合算法以提升全局模型精度。在模拟联邦设置下对三个番茄病害基准数据集的实验表明,该方法在SLIF-Tomato和PlantVillage数据集上分别取得了0.9910%和0.9915%的Top-1准确率。

联邦学习番茄病害识别轻量化模型注意力机制智慧农业边缘计算
q-bio 02-20 00:00

PREFER:为精密发酵领域建立统一数据标准的本体论

精密发酵利用微生物细胞工厂生产可持续食品、药品和化学品,但高通量生物反应器平台产生的海量数据因缺乏统一标准而难以整合。本研究提出了开源本体论PREFER,旨在为生物过程数据建立统一标准。PREFER与广泛采用的基础形式本体论(BFO)保持一致,并连接多个社区本体,覆盖整个精密发酵流程,确保数据的一致性和跨域兼容性。其标准化有助于打破数据孤岛,生成可用于训练预测性机器学习模型的数据集,为可扩展、可互操作的生物过程系统奠定基础。

精密发酵数据标准本体论生物信息学合成生物学数据互操作性
q-bio 02-20 00:00

基于CT扫描的个性化3D肺模型揭示气流时空分布规律

本研究提出了一种多尺度肺模型,用于探究通气变量的时空分布。模型通过CT扫描获取肺轮廓及大气道几何结构,并采用生理一致性算法生成小气道。组织力学采用小变形下的非线性弹性模型,并与支气管树内流体动力学产生的局部气压相耦合。气流模拟考虑了惯性和静态气道顺应性,采用有限元方法进行仿真。利用该模型,研究人员探索了时空气流分布和剪切应力模式。

肺模型计算流体力学多尺度建模个性化医疗呼吸力学有限元仿真
q-bio 02-20 00:00

单细胞基础模型注意力机制捕获共表达而非独特调控信号

本研究提出了一个系统评估框架(37项分析、153项统计检验),用于评估单细胞基础模型(如scGPT和Geneformer)的机制可解释性。研究发现,注意力模式确实编码了具有层级组织的结构化生物学信息(早期层为蛋白质-蛋白质相互作用,晚期层为转录调控),但这种结构对扰动预测并无增量价值:简单的基因水平基线模型(AUROC 0.81-0.88)在预测性能上显著优于基于注意力或相关性的边(AUROC 0.70)。成对边评分对预测无贡献,对调控头进行因果消融也不会导致性能下降。研究还提出了细胞状态分层可解释性(CSSI)方法,将基因调控网络恢复能力提升高达1.85倍。该框架为该领域建立了可重复使用的质量控制标准。

单细胞分析基础模型可解释性注意力机制基因调控网络系统评估
q-bio 02-20 00:00

基于概率不变随机游走的脑回折叠网络分析用于阿尔茨海默病与路易体痴呆诊断

本研究针对阿尔茨海默病(AD)与路易体痴呆(LBD)临床特征重叠、诊断困难的问题,提出了一种基于脑回折叠的皮层相似性网络分析方法。传统图谱方法可能掩盖个体解剖差异,而基于三铰脑回的折叠网络虽具生物学基础,却因个体皮层折叠差异导致网络节点不对齐、规模不规则,难以应用现有图学习方法。为此,作者开发了一种概率不变随机游走框架,通过局部形态特征构建皮层相似性网络,并将其表示为匿名随机游走的分布,利用解剖感知编码保持置换不变性,从而实现对个体化、非对齐网络的直接分类。在大型临床队列上的实验表明,该方法优于现有的脑回折叠和图谱模型,展现出对痴呆诊断的鲁棒性与潜力。

痴呆诊断脑网络分析随机游走图学习脑回折叠医学影像
q-bio 02-20 00:00

巴西中老年痴呆症风险预测模型:随机森林算法识别关键社会与健康因素

本研究基于巴西老龄化纵向研究(ELSI-Brazil)的9412名参与者数据,构建了一个针对50岁及以上巴西成年人的痴呆症分类预测模型。研究结合变量选择与多变量分析,采用随机森林(RF)与逻辑回归方法。结果显示,痴呆症患病率为9.6%。最高风险因素包括文盲(OR=7.42)、90岁以上高龄(OR=11.00)、低体重、握力弱等。保护性因素则包括高等教育(OR=0.44)、高生活满意度等。随机森林模型表现优于逻辑回归,其ROC曲线下面积(AUC)达0.776。研究强调了痴呆症的多维性,为巴西初级保健资源分配与预防策略提供了数据支持。

痴呆症预测随机森林老龄化研究风险因素公共卫生机器学习
q-bio 02-20 00:00

JEPA-DNA:通过联合嵌入预测架构为基因组基础模型提供生物学基础

本研究提出JEPA-DNA,一种创新的基因组基础模型预训练框架。它通过整合联合嵌入预测架构与传统的生成式目标,克服了现有模型(如掩码语言建模)仅关注局部序列模式、缺乏全局功能视角的局限。JEPA-DNA的核心在于引入潜在空间预测目标,迫使模型预测被掩码基因组片段的高级功能嵌入,而非仅仅恢复单个核苷酸。评估表明,该方法在多种基因组基准测试的监督和零样本任务中,性能均优于纯生成式基线,为构建真正理解序列功能逻辑的基因组模型提供了可扩展路径。

基因组基础模型联合嵌入预测预训练框架功能表征零样本学习
q-bio 02-20 00:00

婴儿母乳喂养中口腔密封形成的几何与拓扑约束研究

本研究提出了一种基于收缩几何学的新方法,用于量化评估婴儿母乳喂养时口腔密封的完整性。该方法将超声图像建模为二维可变形区域,通过寻找环绕乳头的最短闭合曲线来定义“收缩指数”,以此表征密封环的紧密程度。研究发现,即使整体几何运动平滑,有效的环绕曲线也可能暂时消失,这揭示了局部指标无法捕捉的全局密封连续性。该方法结合超声与压力数据,为客观评估密封完整性和监测衔乳稳定性提供了定量框架。

母乳喂养口腔密封收缩几何超声成像拓扑分析婴儿健康
q-bio 02-20 00:00

生物网络的结构收缩性:基于非标准范数的鲁棒性分析

本文针对生物相互作用网络(BINs)的鲁棒性,提出了“结构收缩性”这一新的数学概念。研究基于作者先前关于“速率依赖李雅普诺夫函数”的工作,通过证明网络在非标准多面体 $\ell_\infty$ 范数下具有结构收缩性,建立了比以往更强的收敛性结论。结果表明,此类网络是非扩张的;在满足额外可验证条件下,它们能在任意正紧集上严格收缩。此外,研究还证明了此类网络能够“跟随”周期性输入。理论通过细胞内信号通路等建模实例进行了验证。

生物网络结构收缩性鲁棒性李雅普诺夫函数动力学系统信号通路
q-bio 02-20 00:00

拉曼光谱数据增强方案:解决高相关性标注的深度学习挑战

本研究提出一种针对拉曼光谱数据的数据增强方案,旨在解决卷积神经网络(CNN)在训练时因过程变量间存在非线性依赖关系而导致的模型预测高相关性问题。该方法利用光谱的加性特性,从现有数据集中生成具有统计独立标签的新数据点,从而训练出预测相关性更低的稳健模型。实验以Ralstonia eutropha批次培养的合成光谱数据为例,成功监测了底物、生物量和聚羟基脂肪酸酯(PHA)的浓度。该技术使得历史光谱数据能够被重新用于具有不同变量相关性的新应用场景,提升了模型性能与泛化能力。

拉曼光谱数据增强卷积神经网络过程分析技术生物过程监测稳健建模
q-bio 02-20 00:00

基于非平衡最大熵原理推断多体系统熵产生

本文提出了一种推断高维随机系统(如多体系统、长记忆非马尔可夫系统)中熵产生(EP)的新方法。传统方法因计算和统计限制在此类系统中难以应用。该方法利用非平衡最大熵原理和对偶性,仅需轨迹可观测量(如时空关联)的样本,即可推断轨迹级EP和平均EP的下界。它无需重构高维概率分布或速率矩阵,也不依赖离散状态或多部分动力学等特殊假设。此外,该方法可计算EP的层次分解,反映不同相互作用阶次的贡献,并具有“热力学不确定性关系”的物理解释。数值实验在包含1000个自旋的无序非平衡自旋模型和大型神经尖峰序列数据集上验证了其性能。

熵产生最大熵原理多体系统非平衡统计物理热力学推断高维系统
q-bio 02-20 00:00

蛋白质演化与折叠的时空图谱:分子年表揭示生命创新历程

本文综述了利用现代系统发育学方法构建的分子年表与演化网络,以追溯蛋白质与蛋白质组的历史。研究发现,结构域家族的演化年表揭示了代谢系统的爆发式出现、翻译机制的晚期兴起、核糖体蛋白与rRNA的协同演化,以及核糖体出口通道的后期发展。这些事件与蛋白质折叠时间的缩短趋势相吻合。演化网络分析则描述了结构域的早期出现和结构域组合的晚期“大爆炸”。专家观点认为,折叠(增加蛋白质持久性)与招募(促进多样性)是演化进程的核心。蛋白质的演化在时间上复现了折叠过程:将超二级结构组合成结构域,发展翻译机制以提高折叠速度与稳定性,并通过在新颖的结构与架构设计中建立长程相互作用来增强结构复杂性。

蛋白质演化分子年表系统发育学结构域折叠动力学系统生物学
q-bio 02-20 00:00

FUNGAR:直接从宏基因组短读长数据检测抗真菌耐药性突变的新工具

本研究开发了FUNGAR开源分析流程,用于直接从宏基因组短读长测序数据中快速鉴定抗真菌耐药基因及其突变。该工具采用DIAMOND进行翻译比对,并整合FungAMR数据库的注释信息,可检测所有六个开放阅读框中的氨基酸替换。相较于依赖基因组组装的传统方法,FUNGAR能有效避免因基因组碎片化、低丰度物种或耐药位点恢复不全导致的信息丢失,为临床和环境样本中的真菌耐药性监测提供了更高效、可定制的解决方案。

抗真菌耐药性宏基因组学生物信息学工具突变检测真菌病原体短读长测序
q-bio 02-20 00:00

自适应群体运输算法:根据个体反应切换引导与驱赶模式

本文提出了一种新型自适应算法,用于解决自主运输生物群体(如羊群、鱼群)的难题。传统方法要么依赖“引导”(要求个体跟随),要么依赖“驱赶”(要求个体躲避),但现实中个体的行为反应往往是异质且动态变化的。该算法能实时监测个体反应,在“引导”与“驱赶”模式间智能切换,从而有效运输由任意比例“跟随者”和“躲避者”构成的混合群体。仿真表明,即使个体行为随时间随机切换,只要任务时间足够,该算法仍能稳健完成任务。这一进展克服了单一模式算法的局限性,并为减缓生物对机器人运输器的习惯化问题提供了新思路。

群体智能自适应控制生物运输机器人学混合策略
q-bio 02-20 00:00

新立体视觉错觉挑战深度感知理论:大脑更依赖视网膜差异而非三维几何

研究者提出了一种名为‘林顿立体错觉’的新视觉现象,挑战了我们对立体视觉的传统理解。实验中,一个较大的圆位于50厘米处,一个较小的圆位于其前方40厘米处,两者视角大小恒定。当将大圆向前移动10厘米至40厘米再移回时,观察者为了维持两个圆之间恒定的感知深度分离,会选择让小圆移动约6.7厘米(保持视网膜视差恒定),而非移动10厘米(保持物理距离恒定)。这一结果表明,感知到的立体深度可能更多地反映了视网膜上的视差,而非真实的三维几何关系。

立体视觉深度感知视觉错觉视网膜视差认知神经科学
AI速览助手