q-bio
02-02 00:00
本研究构建了一个空间显式的反应扩散模型,探讨在气候波动、污染扩散、资源异质性和种内合作等多重压力下,竞争物种的共存机制。模型揭示了物种会自发形成持久空间格局,如优势区隔离和稳定竞争边界,并通过占据不同生态位(面积 vs. 密度)实现共存。合作行为能增强物种韧性,但在污染区会崩溃,形成异质性“社会缓冲”效应。研究进一步引入基于Swin Transformer的混合逆建模框架,仅需两个时间快照即可从合成数据中准确推断高维生态参数,为全球变化下的生物多样性预测提供了新工具。
反应扩散模型物种共存空间格局深度学习环境压力生态预测
q-bio
02-02 00:00
本研究提出Gengram,一种为基因组基础模型设计的条件记忆模块。它通过基因组特异性哈希方案,实现了对多碱基基序的高效显式查找,从而建立了基因组“语法”。将Gengram集成到最先进的基因组基础模型骨干网络中,在多个功能基因组学任务上实现了显著性能提升(最高达14%)。该模块展现出稳健的架构泛化能力,其潜在空间分析揭示了与基础生物学知识紧密对齐的有意义表征。Gengram通过建立结构化的基序记忆作为建模原语,同时提升了模型的经验性能和机制可解释性。
基因组基础模型条件记忆模块基序查找可解释ai功能基因组学哈希方案
q-bio
02-02 00:00
本研究提出了一种名为MadSBM的生成框架,用于设计肽序列。该方法将序列生成建模为氨基酸编辑图上的受控连续时间马尔可夫过程。其核心创新在于:1) 利用预训练蛋白质语言模型的输出定义了一个生物学信息参考过程;2) 学习一个时间相关的控制场,以产生从掩码先验分布到数据分布的低作用量传输路径。这确保了生成轨迹始终位于高似然序列邻域内,避免了传统离散扩散方法可能穿越低似然区域的问题。研究还首次将离散分类器引导应用于基于薛定谔桥的生成模型,实现了面向特定功能目标的肽设计。
肽序列设计生成模型薛定谔桥连续时间马尔可夫过程蛋白质语言模型生物信息学
q-bio
02-02 00:00
本研究通过引入相互作用的随机逻辑模型(ISLM),将宏观生态规律、随机相互作用网络集合与梅氏稳定性理论联系起来。利用动力学平均场理论,绘制了模型的相图(稳定、混沌和无界增长区域),并推导出一个有效稳定性参数的估计器,该参数可通过经验物种丰度数据中成对协方差的分布宽度来推断。分析表明,微生物群落倾向于在不稳定边缘附近运行,而健康个体的肠道群落更接近此边缘,并表现出更广泛、更多样化的关联;与生态失调相关的状态则向更稳定的状态转移。
微生物组稳定性理论相变随机模型宏观生态学肠道菌群
q-bio
02-02 00:00
本研究通过构建一个包含生长与死亡动力学的简约消费者-资源模型,揭示了单微生物种群围绕稳态产生衰减振荡的物理机制。研究发现,振荡发生的充要条件是微生物适应食物供给变化的时间尺度超过其死亡时间尺度。模型分析表明,微生物残骸回收或互补利用多种食物源会缩小振荡的参数范围并加快振荡衰减,而要求同时利用多种食物源则产生相反效果。本质上,促进生长的因素会降低系统在固定点附近发生振荡的可能性。研究还表明,这种阻尼振荡行为与噪声环境中的持续振荡行为相关。
消费者-资源模型种群振荡时间尺度微生物动力学食物适应生态建模
q-bio
02-02 00:00
本研究提出一个计算框架,以解决多特异性抗体理性设计的瓶颈。首先,开发了一种生成大规模、逼真合成功能图谱的方法,捕捉了决定生物活性的非线性结构相互作用。其次,构建了一个图神经网络架构,能明确编码抗体结构的拓扑约束,区分仅凭序列模型无法识别的不同构型。模型在合成数据上训练后,能复现复杂功能特性,并通过迁移学习,有望在有限的真实生物数据集上实现高预测精度。该框架为解析多特异性抗体的组合复杂性提供了强大的基准环境。
多特异性抗体图神经网络药物设计合成数据迁移学习拓扑结构
q-bio
02-02 00:00
本研究通过训练300个模型并进行超万次实验,系统性地探究了分子语言模型在预训练和下游任务中的规模扩展行为。研究在固定计算预算下,独立改变模型大小、训练数据量和分子表示形式,揭示了分子模型在预训练和迁移学习中都遵循清晰的扩展规律,并阐明了分子表示形式对性能的重大影响。该工作解释了先前分子生成研究中观察到的扩展行为不一致性,并公开发布了迄今为止最大的分子语言模型库。
分子语言模型规模扩展定律计算预算分子表示预训练迁移学习
q-bio
02-02 00:00
本研究提出利用动态数学模型(指数增长模型和逻辑增长模型)替代传统的两点统计检验,来分析急性白血病临床前试验中产生的时序数据。该方法能够整合整个实验时间范围内的所有测量点,并将细胞增殖的生物学知识融入模型。通过模拟数据和患者来源异种移植(PDX)模型的实际应用,研究表明指数增长模型能更可靠地识别基因敲除对白血病细胞生长的抑制效应,从而更有效地评估潜在治疗靶点的功效。
动态建模白血病研究临床前试验生长模型pdx模型时序数据分析
q-bio
02-02 00:00
本研究提出Omni-fMRI,一种无需依赖预定义脑图谱的通用fMRI基础模型。它直接在体素级信号上进行操作,避免了图谱依赖偏差并保留了细粒度信息。通过创新的动态分块机制,模型在跨越9个数据集、共49,497个fMRI会话的大规模预训练中显著降低了计算成本。在一个涵盖11个数据集、包含静息态和任务态fMRI的全面基准测试中,Omni-fMRI的表现持续优于现有基础模型,为可扩展、可复现的脑表征学习提供了新框架。
功能磁共振成像基础模型自监督学习脑图谱表征学习计算神经科学
q-bio
02-02 00:00
本研究提出InstructPLM-mu微调框架,探索仅使用序列信息的预训练蛋白语言模型(如ESM2)能否通过引入结构信息微调,达到多模态端到端训练模型(如ESM3)的性能。实验表明,对ESM2进行1小时的结构感知微调,即可在突变效应预测任务上取得与ESM3相当的结果。研究系统比较了三种特征融合设计与微调方案,发现融合方法与调优策略对最终精度有显著影响,为将结构信息高效注入预训练模型提供了实用指南。
蛋白语言模型突变预测模型微调特征融合计算生物学
q-bio
02-02 00:00
本文证明了嵌入几何空间的稀疏、无序连接网络上的跳跃马尔可夫过程满足大偏差原理。研究发现,尽管网络连接具有空间依赖性和无序性,其速率函数(描述状态转移的渐近似然性)与全连接网络相同。研究结果应用于无序网络上的随机SIS流行病模型,并推导出决定网络不同状态间最可能转移路径的欧拉-拉格朗日方程。
大偏差原理跳跃马尔可夫过程稀疏无序网络平均场理论sis流行病模型网络动力学
q-bio
02-02 00:00
本研究提出一种结合可解释多示例学习(MIL)与稀疏自编码器(SAE)的AI方法,用于从胶质母细胞瘤(IDH野生型)的苏木精-伊红染色全切片图像中提取与生存期相关的组织形态学特征。方法在包含720例真实世界病例的数据集上训练评估,结果显示仅基于组织形态学即可在一定程度上区分生存期短于180天与长于360天的患者(AUC: 0.67)。Cox回归证实预测组间生存期存在显著差异(风险比: 1.47)。模型识别出多个可解释的视觉模式,其中坏死、出血与较短生存期相关,而高细胞密度肿瘤区域与较长生存期相关。
胶质母细胞瘤生存预测可解释ai组织形态学多示例学习医学影像分析
q-bio
02-02 00:00
本文研究了宿主-共生体共演化分析中的距离约束问题。系统发育比对通过将寄生树映射到宿主树来解释协同进化事件(如共分化、复制、宿主转换和丢失)。当宿主转换被限制在最大距离 $d$ 内时,寻找时间可行的最优比对的计算复杂度在 $d>2$ 时尚未解决。本文聚焦于 $d=3$ 和 $d=4$ 的情况,证明尽管可能出现任意大的循环,但只要比对满足更强的无环性(时间可行性)条件,仅需检查有限大小的循环即可。研究提供了完整的循环列表,揭示了距离约束比对的关键结构性质,推进了该问题的理解。
系统发育比对共演化计算复杂度距离约束宿主转换时间可行性
q-bio
02-02 00:00
本研究通过分段数学建模,分析了细胞周期不同阶段(S期和G2期)的特定控制机制如何影响成纤维细胞群体动力学。模型结合了非线性生长动力学和细胞死亡,并采用基于主体的随机模拟。研究发现,稳态细胞尺寸分布主要由分裂核和阶段特异性控制策略决定,且对细胞死亡模式表现出显著鲁棒性。研究揭示了外在与内在生长反馈之间的基本权衡:群体密度依赖的调控严格限制总细胞数,而细胞尺寸依赖的调控则作为比例稳态机制,抑制相对尺寸变异。此外,保留具有增殖能力的大细胞可加速群体恢复。
细胞尺寸调控分段数学模型成纤维细胞动力学细胞周期控制生长反馈组织稳态
q-bio
02-02 00:00
本研究开发了一个随机代理模型,将宏观群体动力学与细胞周期中微观表观遗传状态继承相结合,模拟实体瘤的进化。模型准确再现了实验观察到的肿瘤复发时间进程,捕捉了从敏感细胞到药物耐受细胞,再到稳定耐药表型的动态转变。通过模拟个体细胞的表观遗传可塑性,该模型弥合了细胞异质性与群体水平肿瘤进化之间的鸿沟。此外,通过虚拟患者队列进行的计算机临床试验表明,优化的自适应治疗策略相比标准给药能显著延迟肿瘤复发。
肿瘤耐药性药物耐受细胞表观遗传随机代理模型自适应治疗
q-bio
02-02 00:00
本研究开发了BioModelsRAG,一个利用检索增强生成技术构建的生物模型智能助手。该系统旨在解决系统生物学领域BioModels数据库中大量SBML格式模型分析耗时的问题。通过将模型数据转换为文本并嵌入向量数据库,结合大语言模型进行自然语言交互,用户可快速提取模型关键信息。该方法有效减少了模型幻觉,提升了分析效率与准确性。
检索增强生成系统生物学生物模型大语言模型智能助手sbml
q-bio
02-02 00:00
本研究利用GISAID数据库中超过1295万条SARS-CoV-2全基因组序列,通过直接耦合分析(DCA)生成1984幅展示遗传互作关系的Circos图。研究者构建了一个卷积神经网络(CNN)框架,成功从这些Circos图中提取复杂的上位性特征,实现了对Alpha、Beta、Gamma、Delta和Omicron等主要关切变异株的自动分类,准确率达到99.26%。该方法为探索病毒高阶遗传依赖关系和进化动态提供了新工具。
sars-cov-2卷积神经网络病毒进化基因组学生物信息学
q-bio
02-02 00:00
本文系统回顾了触觉定位领域的理论与方法。触觉定位指判断触摸发生位置的能力,但研究发现,实验任务的设计(至少可归纳为8种类型)及其背后的理论假设会显著影响研究结论。作者通过比较部分研究结果,指出不同方法存在特定偏差,并揭示当前领域缺乏对各种实验任务所诱发具体过程的清晰概念。因此,文章呼吁学界需澄清和统一目前分散且部分不一致的触觉空间处理理论基础,并加强数据共享以支持跨研究分析。
触觉定位空间感知实验方法认知神经科学感觉处理综述
q-bio
02-02 00:00
本研究探讨了树子网络(一种用于表示物种进化关系的网络模型)中“排名”的计数问题。排名是指对网络中的祖先物种形成和杂交事件进行时间排序。研究给出了任意给定二元(或半二元)树子网络排名数量的计算方法,并识别出恰好只有一个排名的网络类别。此外,文章还分析了排名树子网络与“正规”网络类之间的关系,并提供了随机均匀选取的树子网络排名数量的渐近期望表达式。
系统发育网络树子网络进化排名计数组合学生物信息学
q-bio
02-02 00:00
本研究探讨了在持续噪声影响下,布尔网络中吸引子之间的跃迁动力学。通过计算吸引子间的跃迁概率,作者在吸引子层面提出了评估其主导性、稳定性和多样性的方法,并系统比较了局部噪声与全局噪声的不同影响。研究发现,全局噪声下的系统行为主要由吸引盆大小决定,而局部噪声则会产生结构化的跃迁模式,其特征包括增强的稳定性、非平凡的主导性模式以及对吸引子空间更广泛的探索。这项工作揭示了噪声诱导的跃迁模式在理解生物系统鲁棒性与适应性中的重要性。
布尔网络吸引子跃迁噪声动力学系统稳定性计算系统生物学