q-bio
02-06 00:00
本文提出scBIG框架,用于预测基因扰动后的转录响应。该框架突破了传统基因独立建模的局限,通过基因关系聚类从数据中归纳出协调的基因程序,并利用基因-簇感知编码器捕捉程序间相互作用。其采用结构感知对齐目标保持模块化协调性,并利用条件流匹配进行灵活预测。在多个单细胞扰动基准测试中,scBIG显著优于现有方法,尤其在未见及组合扰动场景下平均提升6.7%。
基因扰动预测模块归纳单细胞分析协调基因程序条件流匹配
q-bio
02-06 00:00
本研究提出了AFD-Instruction,首个专为抗体设计的大规模、带功能标注的指令数据集。该数据集包含两大核心模块:抗体理解(从序列推断功能属性)和抗体设计(在功能约束下进行从头序列生成),旨在建立明确的序列-功能对齐关系,并支持通过自然语言指令指导抗体设计。在通用大语言模型上的指令微调实验表明,AFD-Instruction能持续提升多种抗体相关任务的性能,为抗体建模和加速治疗发现奠定了新基础。
抗体设计大语言模型指令数据集序列功能对齐生物信息学
q-bio
02-06 00:00
本研究提出了学习进化性状关系(LETR)的数据驱动框架,将格兰杰因果性与生成映射、转移算子分析相结合,用于揭示病原体毒力与传播等性状间的动态因果联系。该框架通过合成粘液瘤病毒数据集验证了其可靠性,并在全球SARS-CoV-2数据分析中发现,过去的毒力能有效预测未来传播,反之则不然。不变密度估计揭示了毒力与传播的长期下降趋势及双峰分布,表明生态或宿主异质性的影响。该研究为理解复杂生物系统中性状间的机制性联系提供了通用方法。
因果推断病原体进化毒力传播关系动态建模格兰杰因果性生物复杂性
q-bio
02-06 00:00
本研究通过个体模型,揭示了半干旱生态系统植被不规则空间格局的形成机制。传统理论强调尺度依赖反馈导致规则斑块与突然崩溃,但本研究整合了间歇性降水(随机脉冲)与局域阿利效应(正密度依赖),发现两者的相互作用能生成不规则的植被集群,并显著调节灭绝风险。生态系统韧性不仅取决于总生物量,更源于局域空间协方差与邻域密度。这凸显了个体层面的随机过程在决定生态系统恢复力中的关键作用。
空间生态学阿利效应生态系统韧性干旱区植被随机模型斑块动态
q-bio
02-06 00:00
本研究提出了一种用于多尺度细胞模拟的新型可扩展高性能计算(HPC)解决方案,专注于分子扩散建模。通过高效实现先进的有限体积法(FVM)框架,团队开发了可扩展的生物有限体积法(BioFVM)库。性能分析表明,该方案相比现有最先进方案实现了近200倍的加速,并减少了高达36%的内存使用量,为高效计算下一代生物问题(如构建疾病数字孪生模型)铺平了道路。
高性能计算细胞模拟有限体积法扩散模型数字孪生计算生物学
q-bio
02-06 00:00
本研究提出一个将人类概念生成过程建模为在语义嵌入空间中导航轨迹的框架。通过使用Transformer文本嵌入模型,研究者基于累积嵌入构建了参与者特定的语义轨迹,并提取了距离、熵、速度、加速度等几何与动力学指标。该方法在四种不同语言的数据集上得到验证,能够有效区分临床组别与概念类型,为量化语义表征动态提供了一种计算基础强、人工干预少的数学框架。不同嵌入模型的结果相似性表明,尽管训练流程不同,学习到的表征具有内在一致性。
语义导航嵌入空间概念生成认知建模计算精神病学跨语言分析
q-bio
02-06 00:00
本研究通过反事实干预模型潜在变量,揭示了ESMFold预测蛋白质结构的内部计算机制。研究发现其折叠过程分为两个阶段:早期模块将序列信息(如残基身份和电荷)转化为成对生化信号;后期模块则将这些信号发展为成对空间特征(如距离和接触信息)。该工作表明,ESMFold的结构决策机制可以被定位、追踪并通过可解释的表征进行操控,具有显著的因果效应。
蛋白质折叠ai模型机制可解释ai结构预测计算生物学
q-bio
02-06 00:00
本研究提出一种基于Transformer注意力机制的大脑编码模型,用于解释人类在观看自然场景时的高级视觉神经响应。该方法将线性映射分解为空间权重和特征权重,利用注意力机制动态模拟视网膜拓扑特征如何根据输入内容的相关性,被路由到不同类别选择性脑区。相比传统静态感受野模型,该模型在预测大脑活动方面表现显著更优,且具有更高的可解释性——可直观可视化不同高级脑区对任意输入图像的注意力路由信号。
transformer大脑编码视觉神经科学注意力机制计算模型可解释性
q-bio
02-06 00:00
本研究通过一维活性粒子模型,揭示了细胞集群(如癌细胞团、发育器官)的生长与断裂如何共同决定其最终尺寸。研究发现,集群尺寸分布仅取决于细胞间连接断裂速率与细胞分裂速率的比值,从而建立了细胞运动性、细胞间力学与尺寸控制之间的定量联系。理论预测表明,将细胞分裂限制在集群边界或将断裂局域于中心,能实现更精确的尺寸调控。研究还推导出稳态下完整集群的普适存活概率 $S(t) = e^{-k_d t}$,该概率仅依赖于细胞分裂率 $k_d$,与断裂动力学无关。二维模拟结果在较宽参数范围内与一维解析理论基本一致。
组织尺寸调控细胞集群断裂活性粒子模型细胞运动性生物物理学
q-bio
02-06 00:00
本研究提出了Histo-Miner,一个专门用于分析皮肤组织全切片图像(WSI)的深度学习开源流程。该流程利用卷积神经网络和视觉变换器,在皮肤鳞状细胞癌(cSCC)患者样本上实现了细胞核分割(多类全景质量mPQ=0.569)、分类(宏平均F1=0.832)及肿瘤区域分割(平均交并比mIoU=0.907)。基于预测结果,流程可生成一个总结组织形态和细胞相互作用的紧凑特征向量。研究进一步利用该流程,基于45名患者治疗前的WSI预测其对免疫疗法的反应,识别出肿瘤附近淋巴细胞百分比、粒细胞与淋巴细胞比率等关键预测特征,为临床决策提供了可解释的生物学见解。
数字病理深度学习皮肤鳞癌图像分析免疫治疗预测特征提取
q-bio
02-06 00:00
本文提出CellForge,一个多智能体协作框架,旨在解决虚拟细胞建模中生物复杂性高、多模态数据异构及跨学科知识需求等挑战。给定原始多组学数据和任务描述,CellForge通过多个专业智能体的协同推理,自主发现并生成针对特定单细胞数据集和扰动任务(如基因敲除、药物处理)的神经网络架构及其可执行代码。其核心贡献在于框架本身,证明了多智能体协作机制能够超越人工设计或单一LLM提示,自主产生高质量、可执行的计算方法,甚至催生出轨迹感知编码器、扰动扩散模块等全新架构组件。在涵盖scRNA-seq、scATAC-seq、CITE-seq等多种模态的六个数据集上的评估表明,CellForge生成的模型性能与现有基线方法相当,并揭示了架构创新的系统性模式。这标志着计算生物学向自主科学方法开发范式的重要转变。
多智能体系统虚拟细胞建模计算生物学自主ai多组学数据神经网络架构搜索
q-bio
02-06 00:00
本研究构建了一个多尺度数学模型,模拟肿瘤、免疫细胞及细胞因子间的相互作用,以探究抗PD-L1抗体与癌症疫苗联合治疗结直肠癌的动力学机制。研究结合近似贝叶斯计算框架,生成虚拟肿瘤样本以捕捉治疗反应的个体异质性。结果显示,在抗PD-L1治疗中,多次低剂量方案比基线治疗更能显著降低晚期肿瘤负荷;而在疫苗治疗中,最大剂量方案对肿瘤生长控制更优。此外,细胞毒性T细胞被确定为治疗前后一致的有效预测生物标志物,其与调节性T细胞的比值可作为强有力的治疗前预测指标,为患者分层和个性化治疗提供临床潜力。
结直肠癌免疫治疗多尺度模型联合疗法生物标志物个性化医疗
q-bio
02-06 00:00
本研究提出了一种基于纯谱系关系的物种定义公理化框架。核心是“相同祖先点公理”:对于物种中的任一生物,要么该物种包含其后代的数量有限,要么包含其非后代的数量有限。结合凸性公理,该框架定义了“物种样簇”,在技术意义上减少了物种划分的主观性。研究还探讨了确保每个生物都归属于某个最大物种样簇的生物学约束条件,并证明了一组由两个约束构成的最小充分条件。
物种定义谱系图公理化图论生物分类学理论生物学
q-bio
02-06 00:00
本研究通过可解释深度学习框架CARSS分析单细胞RNA测序数据,发现CD34⁺PDGFRα⁺端细胞(CPTCs)是细菌性结肠炎期间筋膜和结肠中的主要机械感受器。体表机械刺激(如针灸)触发筋膜CPTCs中AP-1/Hsp70依赖的转录程序,诱导全身Wnt水平升高,进而在结肠CPTCs中引发“转录共振”,将其通讯网络从炎症放大器重编程为Wnt驱动的再生枢纽。该轴通过激活上皮β-catenin/Myc信号通路,抑制细胞凋亡并恢复屏障完整性,且不依赖于免疫细胞。
机械疗法肠道再生端细胞wnt信号通路单细胞测序深度学习
q-bio
02-06 00:00
本研究通过三维代表性体积元模型,探究了胶原纤维在组织壁厚不均区域作为主要承重结构的作用。研究发现,与纤维中断的网络相比,跨越厚度变化区域的连续胶原纤维能通过载荷传递,将拉伸差异从约20%降至0.68%,应力差异从约65%降至2.3%。这表明在模拟壁厚不均的软组织时,准确表征纤维结构的连续性至关重要,它能有效降低因厚度变化引起的应力集中。
生物力学胶原纤维软组织建模壁厚不均有限元分析载荷传递