q-bio
12-22 00:00
本研究针对经典Petri网独立性理论在建模生物化学反应网络时的局限性,提出了“弱独立性”新概念,以区分资源冲突与生物耦合。通过将Bio-PN定义从经典5元组扩展为包含调控结构、环境交换分类、依赖关系分类、异质变迁类型及生化公式追踪的12元组,系统性地将位置共享模式分类为竞争性、收敛性和调控性三类。在涵盖代谢、信号传导和基因调控的100个BioModels(含1775个物种、2234个反应)上验证,发现96.93%的变迁对表现出弱独立性,证实生物网络本质上是合作而非竞争的。基于此理论的SHYpn工具在30%的评估模型上实现了最高2.6倍的加速。
生物petri网弱独立性并行模拟系统生物学反应网络
q-bio
12-22 00:00
本研究首次大规模应用机器学习,基于Open Food Facts数据库中超过90万种产品的营养成分数据,对食品加工等级(NOVA分类)进行预测。LightGBM模型表现最佳,准确率达80-85%,能有效区分最低加工与超加工食品。分析发现,较高NOVA等级与较低的Nutri-Score(营养评分)和Eco-Score(生态评分)显著相关,表明超加工食品不仅营养价值较低,碳足迹也更高。此外,超加工食品中麸质和乳制品过敏原更常见,且含有更多添加剂。研究开发了用户友好的网页工具,便于利用营养成分数据预测NOVA等级。
机器学习食品加工等级营养健康环境影响过敏原分析大规模分类
q-bio
12-22 00:00
本研究提出一个结合图论与图神经网络(GNN)的框架,将人类推理中的归纳偏倚形式化为对结构与抽象的可操作先验。通过基于抽象与推理语料库(ARC)改编的人类行为数据集,研究表明基于图的先验差异可以解释个体解决方案的差异。该方法包含一个搜索图配置(包括边连接性与节点抽象)的优化流程,以及一种识别对模型预测最关键的计算子图的可视化方法。系统消融实验揭示了泛化如何依赖于特定的先验结构与内部处理,并解释了为何类似人类的错误会从不正确或不完整的先验中产生。
图神经网络归纳偏倚人类推理可解释ai计算认知科学
q-bio
12-22 00:00
本研究分析了具有可控抑制性神经元比例的人类神经元培养实验数据,发现其活动(爆发或雪崩)同时表现出尺度不变性和同步性,且该双稳态行为对抑制性神经元比例保持稳定。为解释这一现象,研究者提出了一种新型Kuramoto模型,该模型成功引入了兴奋性与抑制性两类振荡器群体的抑制动力学。模型完全复现了实验结果,证实了雪崩活动时间组织中存在相关性,并揭示了类似于人脑中的放大-衰减机制。
神经元雪崩kuramoto模型抑制动力学尺度不变性神经同步双稳态
q-bio
12-22 00:00
本研究将非竞争化学反应网络(CRNs)确立为阿贝尔网络(ANs)的特例,从而为分析其长期行为提供了一个统一的代数和概率框架。非竞争CRNs的静态状态与反应速率无关,并可实现ReLU神经网络。利用AN理论,作者证明了对于有限状态空间的非竞争CRN,其静态状态中“循环态”的比例与AN的临界群一一对应。该框架通过沙堆马尔可夫链描述网络对扰动的响应,为理解复杂生化系统中的自组织临界性提供了新工具。
化学反应网络阿贝尔网络自组织临界性沙堆模型系统生物学神经网络
q-bio
12-22 00:00
本研究利用计算方法分析了来自东波利尼西亚各主要群岛的49份“月夜”月历列表,每份列表包含约30个夜晚名称。通过构建有根系统发育树,结果显示月历清晰地分裂为两大群组:一组包括拉帕努伊(复活节岛)、曼加雷瓦和马克萨斯群岛的列表;另一组则包含新西兰、夏威夷、库克群岛、南方群岛、塔希提岛和图阿莫图的列表。这一模式与东波利尼西亚语言近期被划分为“远端”和“近端”两个亚群的最新分类相吻合。由于语言和月历都是在社群中传承和变化的符号系统,且许多群岛地理隔离,这种对应关系表明,东波利尼西亚月历的早期分化反映了该地区早期的人口迁徙和语言分化。
计算历史语言学月历系统波利尼西亚文化系统发育分析文化演化
q-bio
12-22 00:00
本研究通过机械连杆系统构建了一个类似ATP酶的简化模型,以模拟其将化学能(ATP梯度)转化为定向运动的核心机制。该模型具有两个机械自由度和两个离散结合位点,通过几何设计实现了位点间的负变构耦合与交替占据循环。研究揭示了两种协同工作机制:一是高亲和力ATP类似物结合并置换效应物;二是ATP类似物裂解(催化)引入的柔性允许效应物重新结合并置换产物。该工作为设计模拟ATP酶单体的合成系统提供了简洁的蓝图。
分子机器设计变构调控atp酶模拟机械连杆模型合成生物学能量转换
q-bio
12-22 00:00
本研究提出了一个包含易感菌、持久菌和耐药菌的一维生物膜模型,用于分析抗生素耐药性通过接合作用水平转移的过程。研究确定了消毒状态和共存状态的存在条件及其稳定性。通过数值模拟,比较了连续给药和周期性给药策略,发现不足的剂量可能导致治疗失败。最后,应用庞特里亚金极大值原理,推导出能确保细菌根除同时保持总剂量最低的高效给药方案,该方案表现为逐渐减量的给药模式,与临床及其他模型研究结果一致。
生物膜模型最优控制抗生素耐药性水平基因转移给药策略庞特里亚金原理
q-bio
12-22 00:00
本文提出DiffeoMorph,一个端到端可微分框架,用于学习指导一群相同智能体(如细胞)自组织形成目标三维形状的形态发生协议。每个智能体使用基于注意力的SE(3)-等变图神经网络,根据自身内部状态和接收到的邻居信号更新位置和状态。训练中,作者引入了一种基于三维Zernike多项式的新型形状匹配损失函数,该函数将预测形状与目标形状作为连续空间分布进行比较,而非离散点云,且对智能体数量、顺序和刚体变换具有不变性。通过包含一个对齐步骤(使用隐式微分计算梯度)来实现完全的SO(3)不变性(对旋转不变,但对反射敏感)。系统基准测试表明该损失函数优于其他形状比较度量,并能仅凭最小空间线索生成从简单椭球到复杂形态的各种形状。
形态发生多智能体系统可微分模拟图神经网络三维形状生成zernike多项式
q-bio
12-22 00:00
研究团队开发了SAGE(安全代理基因组评估器)框架,用于系统审计基因组基础模型(如ESM)的对抗性脆弱性。该框架通过注入软提示扰动、监控模型行为、计算AUROC/AUPR等风险指标,并生成结构化报告,实现了对嵌入空间鲁棒性的持续评估。研究发现,即使最先进的ESM2模型也对针对性软提示攻击敏感,可能导致性能显著下降。这揭示了基因组基础模型中此前未被发现的潜在安全风险,强调了在临床变异解读等生物医学应用中加强风险审计的重要性。
基因组基础模型对抗性攻击安全审计esm模型生物安全ai风险
q-bio
12-22 00:00
本文介绍了PathBench-MIL,一个用于组织病理学多示例学习(MIL)的开源AutoML与基准测试框架。该系统自动化了端到端的MIL流程构建,涵盖预处理、特征提取和MIL聚合,并对数十种MIL模型和特征提取器提供了可复现的基准测试。通过集成可视化工具、统一配置系统和模块化可扩展性,PathBench-MIL旨在促进跨数据集和任务的快速实验与标准化,以加速数字病理学领域的研究与应用。
多示例学习数字病理学automl基准测试开源框架组织病理学
q-bio
12-22 00:00
Bitbox 是一个开源工具箱,旨在降低行为科学家和临床研究人员使用先进人工智能技术分析视频行为的门槛。它基于可复现性、模块化和可解释性原则,提供了标准化的接口,用于从视频中提取面部表情、头部运动和身体动作等高层次行为测量。该工具箱的核心模块已在临床样本上得到验证,并允许轻松添加新测量指标,旨在弥合计算机科学与行为科学之间的转化鸿沟,加速计算行为测量在心理学、精神病学和心理健康研究中的应用。
行为分析视频分析人工智能开源工具临床研究计算精神病学
q-bio
12-22 00:00
本研究提出SimBinder-IF方法,通过冻结逆折叠模型ESM-IF的结构编码器,并仅训练其解码器进行偏好优化,使其偏好生成实验验证的高亲和力抗体序列。在AbBiBench基准测试中,该方法将序列对数似然得分与实验结合亲和力的平均斯皮尔曼相关性相对提升了55%(从0.264提升至0.410)。在四个未见抗原-抗体复合物的零样本泛化中,相关性提升156%(从0.115提升至0.294)。案例研究表明,其设计的抗体变体预测结合自由能变化($\Delta \Delta G$)显著优于基线模型(平均-75.16 vs -46.57),且仅需训练原模型约18%的参数,实现了参数高效的高亲和力抗体生成。
抗体设计逆折叠模型偏好优化亲和力成熟计算生物学蛋白质语言模型
q-bio
12-22 00:00
本研究首次评估了野火事件对PM2.5长期健康危害的叠加效应。通过对美国超过6000万老年人的数据分析发现,在发生野火事件的地区,长期暴露于PM2.5(包括所有来源)对死亡率的负面影响会显著加剧。这一结果为理解野火对人类健康的真实风险提供了新的、更现实的视角。
pm2.5野火长期暴露死亡率环境健康老年人群
q-bio
12-22 00:00
本文系统回顾了癌症研究中整合基因组学、蛋白质组学、影像学和临床因素等多模态数据的方法演进。重点探讨了从传统机器学习向新兴基础模型的范式转变,这些大型预训练模型为生物标志物发现、诊断优化和个性化治疗开辟了新途径。研究梳理了主流整合策略、验证协议及开源资源,并指出当前方法为开发下一代大规模AI模型奠定了关键基础,有望进一步革新肿瘤学。
多模态数据整合基础模型癌症研究人工智能肿瘤学机器学习
q-bio
12-22 00:00
本研究提出了一种新方法,将AlphaFold2在不同多序列比对深度下生成的蛋白质结构集合,与一个无记忆的粗粒度朗之万方程相结合,从而为生成模型产生的构象集合赋予时间尺度信息。通过对HIV-1蛋白酶六种变体的分析,证实了多序列比对深度与构象波动时间尺度之间存在反比关系。该方法可将AlphaFold2的预测能力扩展到微秒级分子动力学模拟所覆盖的时间尺度,并可推广至其他生成式结构预测模型。
蛋白质动力学alphafold2因果推断时间尺度构象集合朗之万方程
q-bio
12-22 00:00
针对单细胞RNA测序数据模拟的局限性,本研究提出了一种基于量子计算的模拟器qSimCells。其核心创新在于利用参数化量子电路与CNOT门构建量子核,通过量子纠缠同时编码复杂的非线性基因调控网络和具有明确因果方向的细胞间通讯拓扑。实验表明,生成的合成数据展现出非经典依赖性,传统的相关性分析无法恢复预设的因果通路。当量子纠缠激活时,推断出的细胞通讯概率相对提升高达75倍。这证明了量子核对于生成高保真基准数据集至关重要,并凸显了需要先进推理技术来捕捉基因调控中固有的复杂非经典依赖性。
量子计算单细胞测序生成模型基因调控网络细胞通讯量子纠缠
q-bio
12-22 00:00
本研究针对心血管建模中高保真仿真计算成本高昂的难题,探索了利用低保真度近似来加速贝叶斯后验分布采样的多种方法。核心策略包括:为高保真仿真本身构建代理模型;为高、低保真模型间的差异构建代理模型(使用全连接神经网络或非线性降维技术);或将模型与代理间的差异视为随机噪声,利用归一化流估计其分布以修正似然函数。研究在解析测试案例上验证了五种方法的准确性与计算成本,并在一维集总参数模型和患者特异性三维解剖结构两个心血管实例中进行了演示。
贝叶斯推断代理模型多保真度心血管建模降维技术计算加速
q-bio
12-22 00:00
本研究指出,DNA语言模型性能差异的关键瓶颈在于对稀疏且分布不均的DNA序列基序的分词处理。通过系统对比k-mer和BPE分词器,发现词汇量大小和分词器训练数据强烈影响模型捕获的生物学知识。基于此,作者提出了DNAMotifTokenizer,将DNA序列基序的领域知识直接融入分词过程。该分词器在多个下游任务基准测试中一致优于BPE,证明了知识注入的分词对于学习强大、可解释且可泛化的基因组表征至关重要。
基因组学语言模型分词器dna基序生物信息学表征学习
q-bio
12-22 00:00
本研究结合大规模分子动力学模拟与时间序列因果推断,揭示了机械敏感离子通道Piezo1解码不同机械刺激的分子机制。研究发现,在准静态膜张力下,信号通过杠杆状前馈通路从外周机械感受器传至中央孔道;而在法向冲击波作用下,则触发基于变构网络动态重编程的两阶段门控机制:初始压缩相激活源自帽结构域的顶端捷径通路,随后的张力相则利用具有复杂反馈环路的重新布线网络驱动通道完全开放。这表明分子机器的变构布线并非静态,而是可被物理输入特性动态重构,为理解机械化学和设计可编程刺激响应分子系统提供了新框架。
机械敏感通道变构网络分子动力学力信号转导piezo1因果推断
q-bio
12-22 00:00
本研究提出了BHiCect 2.0方法,用于从多分辨率的Hi-C数据中解析染色体的层次化结构。该方法利用谱聚类技术,将染色体描述为嵌套的、优先自相互作用的簇,从而更全面地刻画染色体从局部到全局的多尺度空间构象。新版本通过整合不同分辨率的Hi-C数据,改进了对染色体层级组织的描述。研究团队同时提供了R软件包,便于该工具与其他计算流程集成。
hi-c技术染色体构象多尺度聚类谱聚类生物信息学r语言工具
q-bio
12-22 00:00
本研究基于主动推理框架,探讨了不同预测策略和环境动力学知识(重力先验)如何影响拦截控制。通过模拟一个简化的接球任务,比较了四种策略:短时间视野预测下一位置与长时间视野估计拦截点,每种策略又分有无重力先验。结果表明,所有策略都能成功拦截,但结合重力先验和长时间视野的策略表现最佳。重力先验显著提高了空间和时间精度,而预测未来拦截点则能产生更低的动作值和更平滑的运动轨迹。这为大脑如何整合感官不确定性、物理预期和运动规划提供了统一的计算解释。
主动推理拦截行为重力先验预测控制计算神经科学运动规划
q-bio
12-22 00:00
本研究通过非线性脑连接模式,提出基于β相位同步动力学的多区域动态交互框架,识别工作记忆状态。研究发现:颞顶叶相位聚类在区分记忆状态上表现最优;光照增强环境可优化颞顶叶平衡;机器学习证实颞顶叶同步性是跨任务分类的主导特征。该结果为脑机接口实时认知工效评估提供了低维、精确的预测算法。
脑机接口工作记忆β同步性认知工效颞顶叶皮层光照效应
q-bio
12-22 00:00
本研究旨在通过奶牛蹄部标记点的三维运动学数据,预测其步态评分,以实现对跛行等步态异常的早期自动化监测。研究对12头奶牛进行了69次行走记录,提取了特定步态属性,并使用随机森林、梯度提升机等多种机器学习模型进行训练与预测。结果表明,梯度提升机模型在测试集上取得了0.65的总体准确率和F1分数。该研究为开发早期识别奶牛步态异常的自动化监测系统提供了技术基础,有助于提升奶牛福利与生产寿命。
奶牛健康步态分析运动学机器学习动物福利早期监测