今日速览 · Fortune Health

q-bio 12-29 00:00

热带几何视角下的系统发育树空间：热带格拉斯曼流形的计算研究

本文探讨了系统发育树空间在热带几何框架下的新表征。经典方法如Billera-Holmes-Vogtmann空间虽具几何优雅性，但存在统计与计算局限。研究聚焦于Speyer和Sturmfels引入的热带格拉斯曼流形$\text{tropGr}(2,n)$，该流形与系统发育树空间重合。文章回顾了其结构，并提出了包括采样算法在内的计算方法，旨在为进化生物学家和计算科学家提供新工具，并推动代数几何与系统发育推断交叉领域的研究。

系统发育学热带几何格拉斯曼流形计算算法树空间进化推断

q-bio 12-29 00:00

OrchestRA：多智能体平台整合生物、化学与药理学，实现自主药物发现

本研究提出OrchestRA平台，通过一个由“指挥者”协调的多智能体团队（生物学家、化学家、药理学家智能体），将生物学知识图谱推理、化学结构设计（从头设计或药物重定位）与基于生理的药代动力学（PBPK）模拟评估相结合，形成动态反馈优化闭环。该平台将人类指导与自主执行无缝集成，旨在将药物发现从随机搜索转变为可编程的、基于证据的工程学科。

药物发现多智能体系统知识图谱pbpk模拟自主设计人机协同

q-bio 12-29 00:00

SLIM-Brain：一种数据与训练高效的新型fMRI基础模型

本研究提出SLIM-Brain，一种旨在解决功能磁共振成像（fMRI）基础模型面临的数据与训练效率双重瓶颈的新方法。模型采用两阶段自适应设计：首先通过轻量级时序提取器捕获全局上下文并对数据窗口进行显著性排序；随后，4D分层编码器（Hiera-JEPA）仅从筛选出的Top-$k$窗口中学习细粒度体素级表征，同时丢弃约70%的掩码图像块。实验表明，该模型在七个公开基准测试中取得了最先进的性能，且预训练仅需4千个会话，GPU内存消耗仅为传统体素级方法的约30%。

fmri分析基础模型训练效率数据效率脑成像自适应采样

q-bio 12-29 00:00

智能手机皮肤科中的颜色-临床脱钩：感知校准为何无法保证临床生物标志物可靠性

本研究挑战了智能手机远程皮肤科中色彩校准确保临床可靠性的假设。通过对965名韩国受试者（Fitzpatrick III-IV型皮肤）的43,425张图像分析发现，尽管线性色彩校正矩阵（CCM）将色彩误差降低了67-77%，达到接近临床的精度（ΔE < 2.3），但关键的临床生物标志物——个体类型角（ITA）在不同设备间的一致性很差（ICC = 0.40），而黑色素指数则表现良好（ICC = 0.77）。研究者将这种现象定义为“颜色-临床脱钩”，其根源在于ITA公式对b*通道噪声的敏感性，并受到解剖部位差异的加剧。面部区域贡献了25.2%的色彩变异，是设备效应（7.0%）的3.6倍，这挑战了单点校准的有效性。结果表明，当前的比色标准不足以支持临床级生物标志物提取，移动皮肤科需要区域感知的新协议。

远程皮肤科色彩校准生物标志物设备一致性肤色分析临床验证

q-bio 12-29 00:00

栖息地破碎化如何促进表型多样性种群中的合作演化

本研究通过空间显式智能体模型，探讨了栖息地破碎化与表型多样性对基于标签的合作行为演化的影响。研究发现，在适度破碎化的栖息地中，空位点的异质性分布与较高的表型多样性相结合，能有效抑制以标签为条件的利己合作，同时显著促进无条件利他行为的涌现。这一效应在较低的成本收益比 $r$ 下尤为明显，且对初始条件变化具有鲁棒性，揭示了合作者在严酷环境中的反脆弱性。

合作演化栖息地破碎化表型多样性空间博弈智能体模型雪堆博弈

q-bio 12-29 00:00

基于拟共轭性的两参数泊松-狄利克雷隐马尔可夫模型精确推断方法

本文针对仅能观测到聚合聚类摘要的时序数据（如社交网络、遗传数据），提出了一种非参数隐马尔可夫模型。其潜在状态是一个两参数泊松-狄利克雷扩散过程。通过利用该扩散过程与划分空间上纯死亡过程的对偶性，并结合编码新数据影响的凝聚算子，作者发展了一套无需枚举标签或直接模拟潜在状态的精确推断框架。该方法能递归计算任意时刻潜在状态的后验分布及未来或插值划分的预测分布，实现了完整的在线/离线推断与不确定性量化，在计算精度和效率上均优于传统的MCMC和序列蒙特卡洛方法。

非参数贝叶斯隐马尔可夫模型精确推断泊松-狄利克雷过程时序聚类不确定性量化

q-bio 12-29 00:00

生成式语言模型在人类基因核苷酸序列上的应用探索

本研究将人类基因的DNA序列视为由A、T、C、G四个字母组成的“文本”，首次系统性地探索了生成式语言模型（如GPT-3）在该领域的应用。研究发现，在处理这类小词汇表（仅4个核苷酸）但结构复杂的序列时，循环神经网络（RNN）表现最佳，而简单的N-gram方法也显示出潜力。研究强调了超越传统困惑度指标、使用真实生物任务进行评估的重要性，并指出即使词汇量极小，此类模型对数据量的需求依然巨大。这项工作为理解DNA的“语言”并生成有意义的基因序列开辟了新途径。

生成式模型dna序列分析语言模型生物信息学核苷酸语言gpt-3应用

q-bio 12-29 00:00

LANTERN：融合语言模型与分子表征的TCR-肽结合预测新框架

本研究提出LANTERN深度学习框架，通过结合蛋白质语言模型ESM-1b编码TCR β链序列，并将肽序列转化为SMILES字符串后由MolFormer处理，有效捕获了TCR-肽识别所需的丰富生物与化学特征。在零样本和少样本学习场景下，LANTERN在多个基准测试中超越了ChemBERTa、TITAN等现有模型，其稳健的负采样策略和嵌入分析也显著提升了预测性能与聚类效果。该工作为推进TCR-pMHC结合预测及个性化免疫疗法开发提供了有力工具。

tcr识别语言模型分子表征免疫疗法深度学习零样本学习

q-bio 12-29 00:00

机器学习与个性化基因调控网络整合预测癌症转移风险

本研究提出了一种结合传统机器学习与图深度学习的新框架，用于预测多种癌症的转移风险。研究整合了癌症细胞系百科全书（CCLE）的基因表达数据和DoRothEA的转录因子-靶点先验知识，聚焦9个转移相关调控因子。通过Kruskal-Wallis检验筛选差异基因后，使用ElasticNet、随机森林和XGBoost进行基准测试。进一步，利用PANDA和LIONESS构建个性化基因调控网络，并通过图注意力神经网络（GATv2）学习网络拓扑和表达特征。结果显示，XGBoost取得了最高的AUROC（0.7051），而图神经网络能捕获患者层面的非线性调控依赖关系。该框架为精准肿瘤学提供了一个可扩展且可解释的转移风险预测工具。

癌症转移预测机器学习基因调控网络图神经网络精准肿瘤学生物信息学

q-bio 12-29 00:00

GeneMamba：基于双向Mamba的单细胞转录组学基础模型

本研究提出GeneMamba，一个基于状态空间建模（SSM）的可扩展单细胞转录组学基础模型。针对单细胞RNA测序数据的高维、稀疏和批次效应等挑战，该模型利用双向Mamba（Bi-Mamba）架构，以线性时间复杂度高效捕获基因间的双向上下文关系，相比Transformer模型在计算效率上具有显著优势。模型在近3000万个细胞上进行预训练，并整合了通路感知对比损失和基于排序的基因编码等生物学启发式目标。在批次整合、细胞类型注释和基因-基因相关性预测等多个任务上，GeneMamba均表现出强大的性能、可解释性和鲁棒性。

单细胞测序状态空间模型基础模型批次效应校正基因表达分析计算生物学

q-bio 12-29 00:00

NicheFlow：基于流模型的空间转录组微环境轨迹推断方法

本研究提出了NicheFlow，一种基于流模型的生成方法，用于从连续的空间转录组切片中推断细胞微环境的时空演化轨迹。该方法将局部细胞邻域表示为点云，并联合利用最优传输和变分流匹配技术，共同建模细胞状态和空间坐标的演变。与现有单细胞层面的方法不同，NicheFlow专注于捕捉组织中细胞状态的协同发展。实验表明，该方法在从胚胎发育到大脑发育等多种时空数据集中，均能成功重建全局空间结构和局部微环境组成。

空间转录组学微环境演化流模型最优传输时空轨迹细胞邻域

q-bio 12-29 00:00

高维监控系统的数学困境：为何海量数据下的警报会失去证据价值

本文揭示了大规模人群监控系统（如基于多属性阈值的筛查）存在根本性的概率极限。研究发现，即使单个巧合事件概率极低（如10⁻³⁵），当系统在成千上万个属性中筛查数百万人时，误报警报几乎必然出现。系统可靠性会随着数据规模或相关性的微小增加而发生急剧转变，进入“警报失效”区间。这种失效并非算法缺陷，而是高维筛查的数学必然结果，且不平等的数据覆盖会放大失效，导致“结构性偏差”不可避免。该框架将DNA数据库争议重新解释为不同操作区间之间的转换。

监控失效高维筛查概率极限结构性偏差误报警报数据相关性

q-bio 12-29 00:00

系统发育树空间中的距离递减路径：NNI与SPR图上的Robinson-Foulds距离行为研究

本研究探讨了在系统发育树空间的两个常用图结构——最近邻交换（NNI）图和子树剪枝重接（SPR）图中，Robinson-Foulds（RF）距离沿路径的变化行为。研究发现，在NNI图中，任意两棵树之间都存在一条路径，使得沿该路径移动时，到目标树的RF距离单调递减；而在SPR图中，这种递减是严格的。同时，研究也构造了不存在严格递减NNI路径的树对实例。该结果为在树重排操作下高效探索树空间提供了理论依据。

系统发育学树重排robinson-foulds距离nni图spr图计算生物学

q-bio 12-29 00:00

MorphoCloud：为形态学数据分析提供云端高性能计算平台

随着生物标本数字化产生海量3D形态数据，分析所需的高性能计算资源成为研究瓶颈，尤其在本科院校等机构。MorphoCloud平台通过“IssuesOps”模式，利用GitHub Actions和JetStream2云资源，为研究者提供按需、基于GPU加速的云端桌面环境。用户仅需浏览器即可访问完整的3D Slicer和SlicerMorph工具套件，进行复杂3D分析和AI辅助分割，有效弥合了“计算鸿沟”，促进了科学协作与教育普及。

形态学分析高性能计算云端平台3d数据科学计算民主化

q-bio 12-29 00:00

分布式延迟如何稳定双稳态基因网络

本研究探讨了基因调控网络中固有的分布式延迟（由蛋白质合成过程的随机性导致）对双稳态电路动力学的影响。通过随机混合模型和广义三态模型分析，研究发现增加延迟分布的噪声水平能显著稳定亚稳态，大幅延长系统在各稳态的驻留时间。这一机制解释了生物进化如何调控开关稳定性，并为合成生物学中双稳态网络的设计提供了理论指导。

基因调控网络双稳态分布式延迟随机模型合成生物学系统稳定性

q-bio 12-29 00:00

代谢可塑性：神经元活动与细胞能量代谢的相互调控机制

本研究通过构建一个包含5000个神经元的生物物理模型，首次将温度依赖的Q10缩放作为代谢状态的代理，系统地耦合了代谢状态与神经元内在兴奋性及突触可塑性。模拟揭示了五个关键涌现特性：学习轨迹随代谢状态分叉、突触可塑性时间窗口发生形变、高代谢率导致信号特异性丧失、网络活动从稀疏异步向病理性超同步转变，以及这些状态对参数变化的鲁棒性。结果共同定义了生物能量与学习效率之间的“倒U型”关系，表明代谢约束是维持神经网络稳定的必要硬件调节器。

代谢可塑性脉冲神经网络生物物理模型突触可塑性网络稳定性能量代谢

q-bio 12-29 00:00

基于二维Ornstein-Uhlenbeck过程的脑电瞬态振荡数值孪生模型

本研究提出了一种用于脑电信号中瞬态振荡的数值孪生框架。该框架将窄带瞬态活动建模为二维Ornstein-Uhlenbeck过程，包含衰减率、平均频率和噪声幅度三个可解释参数。研究开发了两种互补的参数估计策略：一是通过拟合功率谱密度、幅度分布和自相关函数来恢复参数；二是通过分割振荡事件，并将经验统计量（持续时间、幅度、事件间隔）与模拟输出进行网格搜索匹配，结合事件计数解决参数简并问题。该框架可扩展至多频段和分段平稳动态，以追踪参数的缓慢漂移。在全麻脑电数据上的应用表明，该模型能准确复现α节律的形态和带限频谱，误差较低，并能实时追踪仅凭频带功率无法察觉的状态变化，为脑功能监测提供了稀疏且可解释的表示与度量。

脑电信号数值孪生ornstein-uhlenbeck过程瞬态振荡参数估计神经监测

q-bio 12-29 00:00

基于最大药物相似性的五维策略重塑药物筛选范式

为克服药物发现中高损耗率和临床转化率低的难题，本研究提出了“最大药物相似性”概念，并开发了五维MDL策略。该策略集成33个深度学习子模型，构建了一个33维属性谱，从理化性质、药代动力学、疗效、安全性和稳定性五个维度，量化候选分子与已上市药物的全局表型匹配度。基于此评分，从1600万分子库中筛选出15个高潜力分子。实验验证显示，先导化合物M2不仅具有25.6 ug/mL的强效抗菌活性，其结合稳定性也优于头孢呋辛。

药物发现深度学习药物相似性抗菌活性先导化合物筛选

q-bio 12-29 00:00

美国“全民研究计划”揭示真菌感染流行病学特征与数据质量挑战

本研究利用美国“全民研究计划”中超过40万参与者的电子健康记录，构建了球孢子菌病（n=1,173）、曲霉病（n=687）和组织胞浆菌病（n=345）三个真菌感染队列。分析确认了已知的流行病学模式，如球孢子菌病集中在美国西南部，组织胞浆菌病在中西部。感染在老年人、男性和非西班牙裔白人中比例更高。数据质量评估显示，常规血液学标志物（如血红蛋白）完整性高（>70%），但真菌特异性生物标志物（如β-1,3-葡聚糖）可用性低（<15%）。关键炎症标志物（如血沉）的单位一致性较差，影响了数据的临床应用潜力。

真菌感染流行病学数据质量电子健康记录公共卫生

q-bio 12-29 00:00

生物传感器设计新视角：样本体积成为关键性能参数

本研究揭示了在亲和力生物传感器设计中长期被忽视的关键参数——样本体积。研究团队开发了一个集成了简化传质、朗缪尔结合动力学和质量守恒的双室数学模型。该模型在有限体积约束下，能准确预测检测时间和最低所需样本量等关键性能指标，计算效率比商业软件提升万倍以上。通过系统分析，研究提出了将测量时间和样本体积作为主要决策变量的定量设计规则，并在石英晶体微天平传感器上进行了实验验证。该开源模型为即时检测和资源有限环境下的生物传感器优化提供了新工具。

生物传感器样本体积数学模型设计优化即时检测亲和力检测

q-bio 12-29 00:00

生物神经网络的表征漂移现象为人工系统持续学习提供新视角

深度人工神经网络在非平稳数据流上持续学习时，常面临灾难性遗忘与可塑性丧失的困境。传统方法致力于增强对旧任务的表征稳定性或促进新任务的可塑性。然而，生物学研究发现，动物（包括人类）在保持稳定行为的同时，其神经元的表征会随时间逐渐“漂移”。本文探讨了这种表征漂移现象，认为它是稳态更新与学习相关突触可塑性共同作用的结果，并评估了新任务学习如何引发旧任务表征的漂移及其跨脑区累积。研究指出，在人工神经网络中，表征漂移仅与那些不显式阻止参数更新以缓解遗忘的方法兼容。虽然漂移本身并非增量学习的解决方案，但对其深入研究可为人工系统的持续学习策略提供重要启示。

持续学习表征漂移神经网络稳定性-可塑性权衡生物启发灾难性遗忘

q-bio 12-29 00:00

基于纵向血液数据重建疾病网络：实现因果发现与干预分析

本研究提出一个方法框架，将血液检测结果的时间序列数据转化为相关图，用于探索疾病的因果假设。通过整合医学指南和研究文献，构建了包含105种典型疾病纵向模式的合成数据库，并开发了系统化流程，将多维临床数据转化为可用于因果发现与干预分析的疾病网络。该框架结合了多种阈值策略和因果图设计，旨在超越统计相关性，构建可临床检验的推理网络。结果表明，从纵向数据重建的知识图谱模型能将常规医疗数据转化为临床可解释的结构，为AI训练、精准医疗和预测医学提供更透明、可解释且可扩展的临床决策支持工具。

因果发现疾病网络纵向数据血液标志物临床决策支持知识图谱

24 小时跨学科精选

定量生物学

2025-12-29 速览 · 定量生物学

热带几何视角下的系统发育树空间：热带格拉斯曼流形的计算研究

OrchestRA：多智能体平台整合生物、化学与药理学，实现自主药物发现

SLIM-Brain：一种数据与训练高效的新型fMRI基础模型

智能手机皮肤科中的颜色-临床脱钩：感知校准为何无法保证临床生物标志物可靠性

栖息地破碎化如何促进表型多样性种群中的合作演化

基于拟共轭性的两参数泊松-狄利克雷隐马尔可夫模型精确推断方法

生成式语言模型在人类基因核苷酸序列上的应用探索

LANTERN：融合语言模型与分子表征的TCR-肽结合预测新框架

机器学习与个性化基因调控网络整合预测癌症转移风险

GeneMamba：基于双向Mamba的单细胞转录组学基础模型

NicheFlow：基于流模型的空间转录组微环境轨迹推断方法

高维监控系统的数学困境：为何海量数据下的警报会失去证据价值

系统发育树空间中的距离递减路径：NNI与SPR图上的Robinson-Foulds距离行为研究

MorphoCloud：为形态学数据分析提供云端高性能计算平台

分布式延迟如何稳定双稳态基因网络

代谢可塑性：神经元活动与细胞能量代谢的相互调控机制

基于二维Ornstein-Uhlenbeck过程的脑电瞬态振荡数值孪生模型

基于最大药物相似性的五维策略重塑药物筛选范式

美国“全民研究计划”揭示真菌感染流行病学特征与数据质量挑战

生物传感器设计新视角：样本体积成为关键性能参数

生物神经网络的表征漂移现象为人工系统持续学习提供新视角

基于纵向血液数据重建疾病网络：实现因果发现与干预分析