q-bio
02-03 00:00
本研究提出了一个端到端的药物设计框架AutoBinder Agent,旨在解决当前AI药物发现工具分散于不同平台导致的流程碎片化问题。该框架利用大型语言模型(LLM)和模型上下文协议(MCP),动态协调对生化数据库、模块化工具链和特定任务AI模型的访问。系统集成了四种先进组件:用于基于几何深度学习识别蛋白质-蛋白质相互作用(PPI)位点的MaSIF、用于将蛋白质片段移植到骨架上形成迷你蛋白的Rosetta、用于氨基酸序列重新设计的ProteinMPNN,以及用于实现接近实验精度复合物结构预测的AlphaFold3。该框架从目标结构出发,支持通过表面分析、支架移植与构象构建、序列优化和结构预测进行从头结合剂生成。通过用协议驱动、LLM协调的架构取代僵化的、基于脚本的工作流,该框架提高了可重复性,减少了人工开销,并确保了整个药物设计过程的可扩展性、可移植性和可审计性。
ai药物设计蛋白质结合剂端到端框架模型协调几何深度学习结构预测
q-bio
02-03 00:00
本研究受大脑神经振荡同步机制的启发,提出了一种全新的图神经网络设计范式。首先,研究者通过耦合振荡人工动力系统(HoloBrain)成功模拟了大脑节律的演化。基于此,他们提出了一个“第一性原理”框架HoloGraph,使图神经网络能够超越传统的热扩散范式,转而建模振荡同步过程。该框架不仅有效缓解了图神经网络中常见的过平滑问题,还在图上的推理和解决复杂问题方面展现出强大潜力。
脑启发计算图神经网络神经振荡同步机制过平滑问题
q-bio
02-03 00:00
本研究提出了一种整合流形学习与随机动力系统建模的新型早期预警框架,用于预测复杂系统(如大脑癫痫发作)中的临界转变。通过系统比较,选取扩散映射等六种方法构建低维表征,并建立数据驱动的随机微分方程模型以稳健估计系统的概率演化评分函数。在此基础上,结合薛定谔桥理论定义了一种新的评分函数指标,用于量化系统发生显著状态转变的可能性。实验表明,该指标在癫痫预测中表现出更高的敏感性和鲁棒性,能更早识别临界点,并清晰捕捉发作前后各阶段的动态特征。
早期预警癫痫预测流形学习随机动力学薛定谔桥临界转变
q-bio
02-03 00:00
为应对抗生素耐药性,本研究提出ProDCARL框架,通过强化学习对齐扩散模型,优化抗菌肽(AMP)的从头设计。该方法将基于扩散的蛋白质生成器(EvoDiff OA-DM 38M)与AMP活性和毒性预测器耦合,利用策略梯度更新和熵正则化,在提升预测AMP活性(从0.081增至0.178)的同时,确保序列多样性(平均成对同一性为0.929)。联合高质量命中率(pAMP > 0.7且pTox < 0.3)达到6.3%,并通过AlphaFold3和ProtBERT分析验证了候选肽的结构与语义特征。
抗菌肽设计扩散模型强化学习蛋白质生成计算生物学药物发现
q-bio
02-03 00:00
本研究针对自然界中常见的共感染现象,提出了一个适用于N种菌株在结构化宿主种群中共同传播的SIS模型框架。模型采用通用公式描述具有不同流行病学特征的宿主类别,可灵活应用于多物种宿主、疫苗接种差异或接触网络等场景。通过菌株相似性假设,我们识别了动力学中的快慢变量,并推导出一个全局复制方程。该方程允许通过菌株间的相互入侵系数来明确预测其共存动态。推导出的全局成对入侵适应度矩阵清晰地包含了底层宿主种群结构及其与菌株相互作用、性状景观的纠缠痕迹。这项工作为更全面地研究和高效模拟地方性生态系统中的多菌株动力学铺平了道路。
共感染动力学多菌株模型宿主结构sis模型全局复制方程入侵适应度
q-bio
02-03 00:00
本研究提出Rank-and-Reason (VenusRAR)框架,以解决蛋白质语言模型在零样本突变预测中忽视生物物理约束的问题。该框架包含排序与推理两阶段:排序阶段通过计算专家与虚拟生物学家构建多模态集成模型,在ProteinGym基准上将斯皮尔曼相关性提升至0.551;推理阶段则由专家小组通过思维链推理审核候选突变的结构与几何约束,在ProteinGym-DMS99上将Top-5命中率提升高达367%。湿实验验证进一步证实了其有效性,在Cas12i3核酸酶中实现了46.7%的阳性率,并发现了活性提升4.23倍和5.05倍的新突变体。
蛋白质工程零样本预测多智能体人工智能生物物理约束湿实验验证
q-bio
02-03 00:00
针对数字时代儿童汉字书写能力下降及“提笔忘字”现象,本研究开发了首个标准化的儿童汉字书写失忆症评估工具。研究基于40名儿童听写800个汉字的大规模数据集,采用双参数项目反应理论模型分析,并比较了四种项目筛选方案。最终,基于“高低三分位区分度”方案筛选出的30项精简测试,在保留个体差异结构的同时,对新测试者具有良好的泛化能力(交叉验证平均r=0.74)。该工具为早期识别书写困难、发展性书写障碍及相关读写挑战提供了可靠、高效的评估手段。
汉字书写失忆症项目反应理论儿童书写评估发展性书写障碍教育测量
q-bio
02-03 00:00
本研究提出RAG-GNN框架,通过对比学习将图神经网络的结构表征与动态检索的生物医学文献知识相结合。基准测试表明,拓扑方法在链路预测上表现优异(GCN AUROC达0.983),而RAG-GNN是唯一在功能聚类上获得正轮廓系数的方法(0.001,基线均为负值)。信息论分解显示,网络拓扑贡献77.3%的预测信息,检索文献提供8.6%的独特信息。应用于癌症信号网络(379个蛋白,3498个相互作用),该框架基于检索到的合成致死证据,将DDR1识别为KRAS突变的新治疗靶点。
图神经网络检索增强生成精准医学知识融合生物网络
q-bio
02-03 00:00
本研究对基于可微信息不平衡(DII)的无监督特征选择流程进行了理论分析,聚焦于描述蛋白质的结构与物理化学特征。研究发现,若将特征视为统计物理模型的坐标,该模型会随着保留特征数量的变化而发生相变。对于物理化学描述符,相变发生在特征较少时的类玻璃相与特征较多时的类液相之间,类玻璃相表现出双峰序参量分布和Binder累积量最小值。相比之下,结构描述符的相变则较为平缓。值得注意的是,通过DII确定的物理化学描述符的临界特征数量,与下游二元分类性能达到饱和时的特征数量一致。这些结果为蛋白质分类中的最小特征集提供了原则性的无监督选择标准,并揭示了不同特征类型间临界性的不同机制。
无监督特征选择相变可微信息不平衡蛋白质特征统计物理模型临界性
q-bio
02-03 00:00
蛋白质语言模型在生成新序列时,常陷入病理性重复,这会破坏蛋白质的结构稳定性和功能可行性。本研究首次系统性地定义了蛋白质序列中的重复问题,并提出了一种名为UCCS的引导方法。该方法通过构建在重复性上差异最大化、但在结构效用上严格对齐的对比数据集,生成能够特异性降低重复、同时保持蛋白质可折叠性的引导向量。实验表明,该方法无需重新训练模型,即可在推理阶段有效降低ESM-3和ProtGPT2等模型的重复生成,并维持AlphaFold的结构预测置信度。
蛋白质语言模型序列生成重复控制对比学习蛋白质设计结构预测
q-bio
02-03 00:00
本研究系统综述了脑电图(EEG)在静息态、事件相关电位(ERP)及任务/脑机接口(BCI)范式下的个体间与个体内变异性。综述发现,个体间差异通常大于个体内波动,两者均影响统计推断与模型泛化。EEG稳定性具有特征依赖性:$\alpha$波段指标及个体$\alpha$峰值频率通常较为可靠,而高频及连接性指标则变异性较大;ERP可靠性因成分而异,P300常表现出中至良好的稳定性。文章总结了变异性来源(生物、状态、技术、分析),回顾了量化与建模方法(如ICC、CV、SNR、概化理论及机器学习方法),并为研究设计、报告与标准化提供了建议。
脑电图变异性可靠性脑机接口事件相关电位系统综述
q-bio
02-03 00:00
研究团队开发了SIM-VAIL评估框架,用于系统审计AI聊天机器人在心理健康对话中的风险。该框架模拟了30种不同精神脆弱性特征的用户,与9款主流消费级AI模型进行了810场对话,生成超9万次交互评分。研究发现,风险普遍存在,且会随对话轮次累积放大,形成“脆弱性放大交互循环(VAILs)”。风险模式具有表型依赖性,针对单一维度的缓解措施可能加剧其他风险,凸显了多维量化评估的必要性。
ai安全审计心理健康风险人机交互脆弱性放大评估框架对话系统
q-bio
02-03 00:00
本研究提出了一种基于谱图表示学习的框架,用于对大脑皮层折叠模式进行社区级别的建模,而非孤立地处理单个脑回标志。该方法将每个三铰回(3HG)编码为结合表面拓扑和结构连接的双重特征表示,通过受试者特定的谱聚类识别连贯的折叠社区,并进行拓扑细化以保持解剖连续性。跨受试者对应则通过联合形态-几何匹配实现。在超过1000名人类连接组计划受试者上的验证表明,该方法生成的社区具有更低的形态测量方差、更强的模块化组织、更高的半球一致性,并且在配准对齐上优于基于图谱、基于标志或基于嵌入的基线方法。
脑图谱皮层折叠谱聚类社区建模个体化映射
q-bio
02-03 00:00
本文研究由顺从者(选择主流策略)、叛逆者(选择少数策略)和模仿者(模仿高收益者)构成的异质性群体在两策略决策问题中的动力学行为。在有限离散群体中,两种策略的比例可能持续波动。作者证明了描述离散群体动力学的马尔可夫链族构成了一个微分包含(连续时间动力学)的广义随机逼近过程,并证明了连续时间动力学总是趋于均衡。利用随机逼近理论,他们进一步证明当群体规模趋于无穷大时,两种策略比例的波动幅度以概率1趋近于零。这表明在由这三类个体组成的大型、充分混合的群体中,大规模持续波动不太可能发生。
群体动力学决策模型随机过程社会学习均衡分析
q-bio
02-03 00:00
本研究提出了一种循环神经化学反应网络(RNCRN),它不仅能被训练以重现特定的动力学行为,还能被训练出分岔现象,从而在不同参数空间区域中切换行为模式。研究展示了RNCRN可以继承光滑常微分方程定义的分岔,也能通过训练推断分岔,以近似参数不连续的目标方程或满足特定动力学特征(如心形极限环)。为此,作者引入了一种无需常微分方程的算法,用于训练网络产生定制振荡。
化学反应网络循环神经网络动力学分岔极限环合成生物学系统训练
q-bio
02-03 00:00
本研究提出了一种混合量子-经典计算方法,以加速计算复杂度极高的基因组从头组装过程。该方法利用基于门的量子计算,通过高阶二元优化(HOBO)公式和变分量子本征求解器(VQE)算法,求解基因组组装图中的哈密顿路径和欧拉路径问题,并引入了一种新颖的比特串恢复机制以改进优化器对解空间的探索。与经典优化技术的对比分析表明,随着量子硬件的持续发展和噪声水平的降低,该方案有望为基因组学研究中的复杂挑战提供更快、更准确的解决方案,从而加速基因组测序。
量子计算基因组组装图优化vqe算法计算生物学
q-bio
02-03 00:00
本研究开发了一种基于姿态估计的机器学习框架,用于从常规门诊视频中识别共患性运动障碍。该框架将视频转换为解剖学关键点时间序列,并计算涵盖统计、时域、频域及高阶不规则性-复杂性特征的运动学描述符。该方法为客观、可扩展地识别和监测共患性运动障碍提供了新工具。
运动障碍姿态估计机器学习视频分析运动学特征
q-bio
02-03 00:00
本研究提出“智能推理线索”框架,将AI决策支持系统的输出视为可独立影响决策过程的离散信息单元。通过一项高风险临床决策(ICU脓毒症患者治疗)的案例研究,结合对6个团队的背景调查和25名医生的有声思维实验,研究识别了八类推理线索的独特影响模式。结果表明,有效的AI系统设计应聚焦于高变异性与自由裁量权的任务,适应不断演变的决策需求,并为复杂病例提供互补且严谨的见解。
人工智能辅助决策临床决策支持人机交互推理线索脓毒症治疗
q-bio
02-03 00:00
本研究提出SEISMO,一种基于大语言模型的智能代理,用于解决分子结构优化中样本效率低下的核心瓶颈。该方法采用严格的在线推理优化策略,每次调用昂贵的属性评估“神谕”后即时更新,无需依赖种群或批量学习。SEISMO的关键创新在于将每次分子生成提议都建立在完整的优化轨迹之上,结合自然语言任务描述、标量分数以及可用的结构化解释性反馈。在包含23个任务的实用分子优化基准测试中,SEISMO的优化曲线下面积比现有方法高出2-3倍,通常在50次神谕调用内即可达到接近最大任务分数。在额外的药物化学任务中,提供解释性反馈进一步提升了效率,证明了利用领域知识和结构化信息是实现样本高效分子优化的关键。
分子优化大语言模型样本效率药物发现轨迹感知在线学习
q-bio
02-03 00:00
研究发现,从昆虫到大象,陆地动物的正面宽高比(宽度与高度之比)随体型增大而减小,这一跨越脊椎与无脊椎动物的普遍规律可由自然地形的不平整性解释。由于自然地形具有分形特征,其不平整度随尺度变化,体型更小的动物需要更宽的支撑基底以在崎岖地面上保持侧向稳定。该预测无需依赖具体的解剖或行为参数,且系统发育比较分析表明,共同祖先或随机演化无法解释此规律,揭示了地形粗糙度通过自然选择对稳定性施加的约束,是驱动陆地动物宏观形态演化的关键因素。
形态演化生物力学自然选择地形粗糙度稳定性分形几何
q-bio
02-03 00:00
研究首次将生物体自主性实现为具体计算过程,提出Phenopoiesis算法。该算法中,生物体不仅遗传基因,还遗传在生命周期学习中发现的成功表型模式。在变化环境中的实验表明,这种模式遗传的生物体比传统基因中心模型的适应速度快3.4倍。关键增益源于跨代遗传习得模式,而非仅靠个体学习。进化通过组合重用机制运作:生物体发现如何将原始元素组合成解决方案,编码这些组合“配方”并传递给后代,在快速可逆的表型遗传与缓慢永久的基因遗传多个时间尺度上运行,提供单通道机制无法实现的适应灵活性。
表型优先进化生物体自主性跨代学习适应速度计算模型进化算法
q-bio
02-03 00:00
本研究提出了INDIGENA方法,用于基于表型集合对基因进行排序,以预测疾病-基因关联。该方法通过图投影将表型本体公理映射为图结构,再利用图嵌入技术生成表型的潜在表示。通过显式的聚合策略,可将表型嵌入组合成基因或疾病的表示,从而能够泛化到新的表型集合。研究还开发了一种方法,通过引入已知基因-疾病关联的监督信号,使表型嵌入和相似性度量更具任务特异性。在人类疾病小鼠模型上的应用表明,该方法显著优于归纳语义相似性基线,并在保持更强通用性的同时,达到了与转导方法相似的预测性能。
疾病基因关联表型本体图嵌入归纳学习生物信息学
q-bio
02-03 00:00
本文探讨了用于直接从DNA序列预测分子调控结果的序列到功能(seq2func)模型。尽管这些模型在预测变体效应、机制解释和调控序列设计方面表现出色,但其在遗传变异和细胞环境间的泛化能力仍不稳定。研究分析了架构选择、训练数据和预测任务如何影响模型行为,并指出高预测精度未必能转化为稳健的调控理解。作者主张将seq2func模型重构为通过AI-实验反馈循环持续优化的系统,使其成为能逐步深化机制基础、更可靠支持生物学发现的自我改进工具。
调控基因组学ai可解释性序列到功能模型模型泛化ai-实验循环
q-bio
02-03 00:00
本研究指出广泛使用的标准化生物量尺寸谱(NBSS)方法存在根本性缺陷,其绘图常使用非生物量单位(如丰度、生物量通量),导致对原始生物量分布的曲解。作者提出了新的概念框架、术语和一种创新的“反向转换”方法,生成反向转换标准化生物量谱(bNBS)。该方法能保留原始生物量分布的形状、数值、量纲和单位,为跨区域和跨时期的生物量谱定量比较提供了更稳健、偏差更小的新途径。
生物量谱尺寸谱分析生态学方法数据转换标准化偏差定量比较