q-bio
02-25 00:00
本研究提出了一种创新的方法,通过向E(3)等变(极性)向量特征中注入轴向特征,成功实现了从同手性(L-L)训练数据到异手性(D-L)设计任务的跨手性泛化。该方法集成于潜在扩散模型中,用于设计靶向L型蛋白质的D型多肽结合剂。计算基准测试表明其性能优于现有工具,并首次在湿实验中得到验证,为处理蛋白质设计中的手性问题提供了新视角。
d型多肽设计跨手性泛化轴向向量潜在扩散模型蛋白质设计ai药物发现
q-bio
02-25 00:00
本研究提出KEMP-PIP,一种用于预测促炎肽(PIPs)的混合机器学习框架。该方法创新性地融合了预训练蛋白质语言模型ESM的上下文嵌入、多尺度k-mer频率、理化描述符及modlAMP序列特征。通过特征剪枝、类别加权逻辑回归及集成平均优化,有效处理了高维特征与类别不平衡问题。在标准基准数据集上,KEMP-PIP的MCC、准确率和AUC分别达到0.505、0.752和0.762,性能优于现有方法。
促炎肽预测特征融合蛋白质语言模型机器学习生物信息学
q-bio
02-25 00:00
本文提出DiffuNovo,一种用于从头肽段测序(DNPS)的新型回归器引导扩散模型。现有方法常将肽段质量与实验前体质量必须匹配这一关键物理约束作为简单输入或后处理,导致大量不合理预测。DiffuNovo在训练阶段引入新颖的肽段级质量损失函数指导模型优化,在推理阶段则通过潜在空间中的梯度更新进行回归器引导,强制生成的肽段满足质量约束。在标准基准测试中,DiffuNovo在DNPS准确率上超越了现有最优方法,并显著降低了质量误差,生成了物理上更合理的肽段序列。
从头肽段测序扩散模型质量约束蛋白质组学深度学习生物信息学
q-bio
02-25 00:00
本文以生态系统为范例,系统回顾了过去15年复杂非线性开放系统中临界点(Tipping Points)的研究进展。临界点被定义为系统参数微小变化导致其性质发生显著改变的状态,通常伴随突变性与不可逆性。研究指出,除经典的分岔诱导临界点外,不同模型前提、细节层次及环境强迫可导致多种临界机制。在空间扩展或多尺度系统中,不同部分对环境变化的响应存在差异或存在时滞,相互作用可能引发临界级联。文章总结了主要发现,指出了当前知识空白,并为未来研究绘制了路线图。
临界点生态系统复杂系统非线性动力学分岔理论级联效应
q-bio
02-25 00:00
本研究提出了一种名为SampEuler的新型拓扑形状描述符,旨在克服传统欧拉特征变换对噪声敏感的局限性。通过理论分析和基准数据集验证,SampEuler在稳定性上表现优异。研究将其应用于小鼠胸腺的二维成像数据集,成功捕捉到与衰老相关的细微、局部形态学差异,其性能超越了基于持续同调的方法和深度学习模型。此外,研究还开发了相应的向量化和可视化框架,以增强结果的可解释性,为理解胸腺随年龄增长的结构变化提供了新的见解。
拓扑数据分析形状描述符胸腺结构欧拉特征变换生物医学成像形态学分析
q-bio
02-25 00:00
本研究提出一种靶向T2-FLAIR缺失训练方法,通过在训练中随机将T2-FLAIR通道置零(缺失概率r=0.35或0.50),提升了nnU-Net模型在T2-FLAIR序列缺失时的胶质母细胞瘤MRI分割鲁棒性。实验表明,当T2-FLAIR可用时,该方法保持了原有的分割性能(中位DSC 94.8% vs 95.0%);当T2-FLAIR缺失时,整体分割DSC从81.0%显著提升至93.4%,水肿区域DSC从14.0%提升至87.0%,全肿瘤体积偏差从-45.6 mL改善至0.83 mL。该方法在保持性能的同时,有效解决了临床中常见序列缺失的问题。
医学影像分割胶质母细胞瘤nnu-net数据缺失鲁棒性深度学习mri多模态
q-bio
02-25 00:00
本研究针对磁共振波谱(MRS)中低信噪比、谱峰重叠的代谢物(如GABA)定量难题,开发并系统验证了两种深度学习模型:卷积神经网络(CNN)和Y型自编码器(YAE)。模型在10万条模拟谱线上训练,并通过包含已知真实浓度的144条实验体模谱线进行验证。研究发现,通过在训练数据中建模可变的谱线宽度进行数据增强,能显著缩小模拟与真实数据间的性能差距。优化后的深度学习模型在GABA定量上的平均绝对误差(MAE)为0.151-0.160(最大归一化相对浓度),优于传统LCModel工具(0.220)。研究表明,物理信息驱动的数据增强是提升模型在真实数据上可靠性的关键。
磁共振波谱深度学习代谢物定量gaba模拟到现实数据增强
q-bio
02-25 00:00
本研究提出Graph Semantic Predictive Network (GraSPNet),一种用于分子图分析的层次自监督学习框架。该方法无需预定义词汇表,将分子图分解为具有化学意义的片段,并通过原子和片段两个层次的消息传递与掩码语义预测,学习多分辨率的分子结构表示。实验表明,GraSPNet能学习到具有化学意义的表征,并在多个分子性质预测基准的迁移学习任务中,持续优于现有的图自监督学习方法。
图自监督学习分子表示学习层次语义建模化学片段迁移学习性质预测
q-bio
02-25 00:00
本研究揭示了基于Transformer的蛋白质语言模型(PLMs)与自然语言模型在信息分布上的关键差异。针对蛋白质序列仅有20种氨基酸“词汇”却蕴含丰富功能空间的特点,作者将自然语言处理中的“早期退出”技术进行适应性改进,使其能根据具体任务和蛋白质自动选择PLMs中间层的表征。该方法在多种非结构性质预测任务中,不仅将准确率提升了0.4至7.01个百分点,还实现了超过10%的效率增益,为生物领域的语言建模研究开辟了新方向。
蛋白质语言模型transformer架构生物信息学模型效率非结构性质预测早期退出
q-bio
02-25 00:00
本文提出了一种基于中心流形理论的改进框架,使经典的线性噪声近似(LNA)模型能够准确捕捉基因调控、流行病学等领域的非线性随机群体动力学(如振荡、双稳态)。该方法通过针对特定非线性系统类进行定制化修正,在保持LNA计算效率与解析可处理性的同时,实现了长期预测的准确性。研究以分子群体动力学中的振荡和双稳态系统为例,验证了改进后LNA在长期模拟中的准确性与显著的计算效率提升。
群体动力学线性噪声近似非线性系统计算模拟中心流形理论随机过程
q-bio
02-25 00:00
本研究提出PepMorph,一种端到端的肽发现流程,旨在解决从巨大序列空间中筛选具有特定自组装形态(如纤维状或球状)肽序列的难题。该方法通过整合现有数据集并提取几何与物理化学描述符作为形态代理,训练了一个基于Transformer的条件变分自编码器,并引入掩码机制以在任意条件下生成新颖肽序列。经粗粒度分子动力学模拟验证,生成序列在目标形态类别上的成功率高达83%,为生物医学和能源应用中的肽材料设计提供了高效框架。
肽自组装条件生成模型分子设计计算生物学粗粒度模拟
q-bio
02-25 00:00
本研究提出了一种利用机器学习原子间势能模型为分子补充三维几何结构的新方法。研究者首先构建了一个包含350万个分子、3亿个构象快照的大规模分子弛豫数据集,并训练模型预测能量和力。训练后的模型可通过几何优化获得近似的低能三维结构,这些结构虽未达到密度泛函理论级别的精度,但相比未弛豫结构仍能提升下游性质预测性能。此外,模型也可在有真实三维结构时直接微调用于性质预测。结果表明,基于弛豫数据预训练的模型能学习可迁移的分子表示,并提供对性质预测有益的近似分子几何结构。
分子几何结构机器学习势能分子弛豫性质预测预训练模型
q-bio
02-25 00:00
本研究提出MCTD-ME方法,将掩码扩散模型与蒙特卡洛树搜索结合,以解决蛋白质设计中长程依赖和搜索空间过大的难题。该方法利用生物物理保真度增强的扩散去噪作为推演引擎,可联合修订多个氨基酸位点,并通过基于pLDDT的掩码调度策略,在保留可靠残基的同时聚焦低置信度区域进行优化。提出的多专家选择规则PH-UCT-ME将基于香农熵的UCT扩展至专家集合,并引入互信息指导。在CAMEO和PDB基准测试中,MCTD-ME在逆折叠、折叠及基序支架等任务上表现优异,为蛋白质从头设计提供了可扩展的通用框架。
蛋白质设计蒙特卡洛树搜索扩散模型多专家系统生物信息学人工智能
q-bio
02-25 00:00
本研究提出了一个计算框架,通过渐近分析揭示了数据驱动生物力学模型中参数可识别性的基本标度律。该框架综合了费舍尔信息与扰动海森矩阵,建立了一种分层方法来量化坐标可识别性,并在不同阶次的不可识别子空间内进行不确定性量化。研究通过严格的数学分析,并在合成数据与真实数据(如HIV-宿主动力学、淀粉样蛋白β时空传播模型)上得到验证。结果表明,该框架能有效阐明HIV诊断和阿尔茨海默病进展的关键机制,为大规模机制性数字孪生时代的数据驱动建模提供了关于参数可识别性与不确定性的标度律,确保数据驱动的推断植根于可验证的生物学现实。
参数可识别性不确定性量化数据驱动建模生物力学模型标度律渐近分析
q-bio
02-25 00:00
本文提出“累积选择”作为适应性进化的统一理论框架,挑战了传统进化论依赖种群和繁殖的前提。作者指出,长寿克隆生物、全息生物体和进化支等系统能在没有种群或繁殖的情况下适应环境,而卢旺廷的自然选择“配方”只是累积选择的一个特例。该研究提供了一个通用的“配方”来描述适应性如何通过信息或结构的迭代筛选与积累而产生,并讨论了克隆生物、神经网络等多个案例,为理解生命与非生命系统的适应性开辟了新视角。
累积选择进化理论适应性克隆生物理论框架超越达尔文
q-bio
02-25 00:00
本研究针对登革热这一全球重大公共卫生问题,建立了一个包含年龄结构和疫苗接种后时间的媒介-宿主传播动力学模型。模型将人群按年龄分层,并追踪个体自接种以来的时间,同时将蚊媒种群动态与宿主耦合,并在准稳态假设下简化。通过积分疫苗接种年龄,研究者得到了非线性稳态方程,并将地方性流行平衡点表达为感染蚊媒种群的定点问题。利用Lipschitz估计和压缩映射原理,在弱传播条件下证明了平衡点的存在性与唯一性。分析揭示了年龄依赖性疫苗接种对登革热长期传播动态的关键影响。
传染病模型年龄结构疫苗接种媒介传播登革热平衡点分析
q-bio
02-25 00:00
本研究揭示了一种纤维化疾病中肌成纤维细胞持续存在的新机制:成纤维细胞与肌成纤维细胞之间的直接物理接触,足以驱动前者转化为后者。该转化过程无需已知的生物化学信号(如生长因子)或来自僵硬基质的机械信号。研究进一步发现,Gαq/11/14抑制剂FR900359可阻断这种接触依赖的激活。这一发现为理解纤维化难以治愈的原因提供了新视角,并提示了靶向细胞间接触可能成为治疗纤维化疾病的新策略。
纤维化细胞转化细胞接触信号通路疾病机制治疗靶点
q-bio
02-25 00:00
本研究通过构建一个按毛利人、太平洋岛民、亚裔和欧洲/其他族群划分的数学模型,分析了新西兰2022年至2023年奥密克戎疫情期间不同族群的病例、住院和死亡数据。模型整合了族群特定的疫苗接种率、临床严重程度参数和接触模式。研究发现,疫苗接种率的差异只能部分解释观察到的健康结果不平等。结果表明,不同族群间每例感染导致临床重症的风险差异是一个关键因素。这项工作为未来建立能更好预测和缓解疫情不平等影响的模型迈出了重要一步。
疫情建模健康不平等族群差异奥密克戎新西兰数学模型
q-bio
02-25 00:00
本研究针对具有复杂几何形状和细胞排列异质性的多细胞组织(如上皮),建立了一个基于离散外微积分的分析框架。该框架定义了适用于无序细胞单层的霍奇星算子、楔积和音乐同构,从而能在细胞顶点、中心和边上描述标量与矢量场。应用此框架,作者分析了平面单层消融后产生的谐波矢量场,发现其振幅上界近似按 $1/r$ 标度衰减($r$ 为距消融点的距离)。进一步,结合渗透压效应的顶点模型模拟表明,处于阻塞态的单层在消融后的扰动位移具有长程相干性、单极和四极特征,且其振幅上界同样近似遵循 $1/r$ 标度,而扰动应力的振幅上界则近似按 $1/r^2$ 标度衰减。这一发现对理解组织内的长程力学信号传导具有重要意义。
细胞力学离散外微积分顶点模型组织消融长程信号谐波场
q-bio
02-25 00:00
本研究提出了一种从临床3D超声图像中无创量化心脏瓣膜小叶应变的几何特征追踪框架。该方法通过整合群体几何参考图谱建立对应关系,并引入一种新颖的距离加权相干点漂移算法进行非刚性配准。与基于有限元的基准模型和传统点追踪方法相比,该方法在解剖对齐和应变量化方面表现出更高的准确性,并在儿科及成人患者(N=31)的不同瓣膜形态中实现了可靠的跨期变形追踪。分析揭示了与瓣叶膨出相关的主应变一致分布模式。该框架为从临床图像中表征生物力学应变模式、改善瓣膜性心脏病的预后评估和纵向监测提供了通用工具。
心脏瓣膜生物力学医学影像应变分析无创评估几何追踪