今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

定量生物学

2025-12-30 12-30 15:26

今日q-bio领域研究呈现方法创新与跨学科整合的鲜明趋势,重点关注利用计算模型与AI技术解析复杂生物系统,并强调理论框架与实验数据的严谨结合。

  • AI与计算模型驱动生物发现与预测:大语言模型(LLU)被用于从文献中挖掘功能食品微生物菌株,而图神经网络(GNN)与Transformer则成功整合多模态数据(如脑连接动态与临床信息)以预测未来行为(如青少年烟草使用)。生成式AI框架(VAE+QSAR)则能基于有限数据设计新型气味分子。
  • 复杂系统理论与生物机制建模:研究通过非保守动力学框架分析生态共存,用计算模型(基于推理)解释决策瘫痪现象,并以信息论方法揭示母胎心率耦合的双重机制。λ噬菌体决策研究则提出了“层级抢占”这一新的信息控制原理。
  • 强调模型-实验对齐与数据严谨性:研究明确指出DNA开放态模型中自由度与实验比对的重要性。新推出的无数据污染蛋白质科学基准(LiveProteinBench)旨在更真实评估大模型能力。跨尺度生物多样性研究则系统警示了三种可能误导结论的“伪效应”。
  • 技术革新助力微观动态观测与定量分析:集成式光片显微镜平台实现了对胚胎、类器官中转录动态的亚细胞水平实时三维成像与定量,为发育生物学提供了强大工具。

2025-12-30 速览 · 定量生物学

2025-12-30 共 24 条抓取,按综合热度排序

← 返回日历
q-bio 12-30 00:00

基于大语言模型的文献挖掘系统助力功能食品微生物菌株发现

本研究开发了一个基于大语言模型(LLMs)和高级提示工程技术的领域自适应系统,用于从非结构化科学文献中自动识别参与功能食品(如氨基酸、纤维、植物化学物质和维生素)生物合成的微生物菌株。通过利用少样本提示和定制化查询设计,系统在多种配置下均表现出稳健性能,其中DeepSeekV3模型在准确性上优于LLaMA2。研究构建并验证了一个包含35种功能食品-菌株关联的结构化数据集,揭示了谷氨酸棒状杆菌、大肠杆菌和枯草芽孢杆菌在单一及共培养系统中的主导贡献,以及新兴合成菌群的应用潜力。该AI框架不仅提升了文献挖掘的可扩展性和可解释性,还为微生物菌株选择、合成生物学设计和功能食品的高价值精准发酵策略提供了可操作的见解。

文献挖掘大语言模型功能食品微生物合成提示工程合成生物学
q-bio 12-30 00:00

非保守动力学框架结合逻辑增长模型研究多物种生态共存

本研究提出了一种包含特定形式外力场的非保守动力学方程框架,用于模拟随机相互作用系统的演化。该框架被应用于生态学领域,对由捕食-被捕食机制相互作用的两个物种组成的系统进行建模。研究提供了关于共存平衡点的线性稳定性分析,并讨论了发生霍普夫分岔的一种情况。最后,通过数值模拟展示了一些相关演化场景。

动力学方程生态建模物种共存稳定性分析数值模拟
q-bio 12-30 00:00

INSIGHT:从常规病理切片预测结直肠癌生存,揭示上皮-免疫风险轴

本研究提出INSIGHT模型,一种图神经网络,可直接从常规病理切片图像预测II/III期结直肠癌患者的生存。模型在TCGA和SURGEN队列中训练与交叉验证,生成患者级别的空间风险评分。独立验证显示其预后性能优于传统pTNM分期(C-index 0.68-0.69 vs 0.44-0.58)。通过整合空间风险图与空间转录组、蛋白质组及单细胞数据,研究揭示了由上皮去分化、胎儿程序、$\mathrm{SPP1}^{+}$巨噬细胞/$\mathrm{LAMP3}^{+}$树突状细胞驱动的基质状态以及适应性免疫功能障碍构成的上皮-免疫风险图谱,为患者分层和联合治疗提供了新见解。

结直肠癌病理图像分析图神经网络空间转录组预后模型肿瘤微环境
q-bio 12-30 00:00

信息论揭示孕晚期母胎心率耦合的双重机制与压力敏感性

本研究将信息论方法引入母胎心率耦合分析,在120名孕晚期孕妇(58名压力组,62名对照组)中,通过计算转移熵、熵率等指标,揭示了两种不同时间尺度的耦合机制。研究发现:在短期(0.5-2.5秒)尺度上,存在压力无关的状态依赖性同步(母体减速对胎儿心率复杂性的耦合强度约60%)和压力敏感的时间信息传递。后者与母体皮质醇水平存在探索性关联,并显示出显著的性别与压力交互作用,女性胎儿表现出独特的耦合模式。研究还确定了4Hz为捕捉此信息流的必要且充分的采样率。

母胎耦合信息论转移熵胎儿压力心率变异性生物医学信号
q-bio 12-30 00:00

JParc:联合皮层配准与分区框架,实现90%以上Dice分数

本研究提出JParc,一种联合皮层配准与分区的框架。它通过浅层子网络微调传播的图谱标签,仅使用描述皮层折叠模式的基本几何特征(如沟深、曲率),便在Mindboggle数据集上实现了超过90%的Dice分数。实验表明,其优异性能主要归因于精确的皮层配准和学习的分区图谱,超越了现有最先进的分区方法。

脑皮层分区图像配准图谱学习神经影像几何特征
q-bio 12-30 00:00

DFINE模型扩展至颅内脑电信号建模,提升脑机接口预测精度

本研究将深度学习框架DFINE扩展应用于多部位人类颅内脑电图(iEEG)信号建模。DFINE结合了线性状态空间模型与神经网络,在捕捉信号非线性特征的同时,保留了线性模型灵活推理的优势。实验表明,在预测未来神经活动方面,DFINE显著优于线性状态空间模型,并与门控循环单元(GRU)模型精度相当或更优。此外,DFINE在处理信号缺失时表现出更强的鲁棒性,在高伽马频段的优势尤为明显,为下一代脑机接口的开发提供了强大且灵活的工具。

脑机接口深度学习非线性动力学颅内脑电图状态空间模型神经预测
q-bio 12-30 00:00

决策瘫痪的计算模型:意图与可供性饱和如何导致行动犹豫

本研究针对决策瘫痪现象,提出了一个基于推理的计算模型。模型将决策过程分为意图选择(追求什么)和可供性选择(如何追求),并将决策承诺形式化为在反向KL散度(寻求模式,促进快速承诺)和正向KL散度(覆盖模式,保留多种可能)混合目标下的推理过程。模拟显示,当选项价值相近时,正向KL偏向的推理会导致缓慢、重尾的反应时间,并产生两种独特的失败模式:意图饱和与可供性饱和。该模型将自闭症中的决策僵局视为一个基于推理的、普遍决策连续体的极端状态。

决策瘫痪计算模型kl散度意图选择可供性推理
q-bio 12-30 00:00

集成式单物镜光片显微镜实现胚胎与类器官亚细胞动态定量成像

本研究开发了一种完全集成且经过定量表征的斜平面显微镜(OPM)平台,专为胚胎、干细胞和三维培养系统中转录与核组织的动态研究而设计。该系统结合了高数值孔径远程重聚焦、倾斜不变光片扫描以及激光激发、振镜扫描和相机读出的硬件定时同步技术,提供了全面的光学性能表征。研究团队还开发了统一的采集与重建流程,支持硬件极限速率下的实时三维成像,并在活体果蝇胚胎、小鼠胚胎干细胞及其衍生的类原肠胚中,成功实现了对MS2标记转录位点的定量三维成像与转录强度轨迹提取。

光片显微镜定量成像活体胚胎转录动力学三维培养光学表征
q-bio 12-30 00:00

DNA开放态模型与实验比较中的自由度问题

本研究指出,在利用简单力学模型研究DNA开放态动力学时,模型与实验数据的正确比对至关重要。以Peyrard-Bishop-Dauxois模型为例,论文分析了两种常见错误:一是模型与实验观测的开放态类型不匹配;二是开放态的“阈值坐标”指定错误。作者引入了用于记录DNA链径向分离的有效总阈值坐标概念,并证明通过对实验数据的正确解释,可以消除理论与实验之间的差异。

dna动力学力学模型开放态参数化实验比对阈值坐标
q-bio 12-30 00:00

神经科学启示AI:整合行动、组合结构与情景记忆实现安全可解释AI

当前大型语言模型基于简单的下一词预测目标,但忽略了神经科学中预测编码模型的三个关键组件:行动与生成模型的紧密整合、层次化组合结构以及情景记忆。本文提出,将这些组件融入基础模型,可解决其现有缺陷——如因缺乏“接地”而产生的幻觉与概念理解肤浅、因缺乏控制而缺失主体感/责任感、因缺乏可解释性而威胁安全与可信度,以及能效低下。与当前增强方法(如思维链推理和检索增强生成)相比,脑启发组件的整合为构建安全、可解释、以人为本的AI提供了新路径。

人工智能神经科学预测编码可解释ai基础模型情景记忆
q-bio 12-30 00:00

解码生命系统架构:非平衡热力学与进化动力学的统一框架

本文探讨了进化力量、热力学约束与信息处理能力如何共同塑造生命系统的逻辑。研究指出,生命系统的实际运行依赖于复杂的基因调控、代谢反应和细胞信号网络,这些网络并非被动结构,而是通过其层级化、模块化的非平凡拓扑结构,主动催化“可进化性”的演化。利用统计物理分析表明,生物创新往往偏离平凡结构与热力学平衡态,而自然界中普遍存在的稀疏异质网络(如层级模块网络)在冗余、纠错和维持的能量成本权衡中更具优势。文章提出了一个基于互联性、可塑性和相互依赖性的统一建模框架,并运用动力系统理论和非平衡热力学进行分析,揭示了缓慢的进化动力学是受约束变分非平衡过程的直接结果。

生命系统架构非平衡热力学进化动力学复杂网络层级模块可进化性
q-bio 12-30 00:00

染色质力学性质由表观遗传状态编码:三维结构决定局部黏弹性

本研究发展了一种理论,通过三维基因组结构推断单个基因座的黏弹性。研究发现,染色质的力学性质由表观遗传标记和空间组织共同决定。在单基因座水平上,染色质表现出显著的异质性,可分为具有不同最长弛豫时间的两个亚群:单时间尺度和多时间尺度弛豫。富含活性标记(如H3K27ac)的基因座通常表现出多时间尺度弛豫,其最长弛豫时间与局部有效刚度呈负相关。模拟预测,这些区域在持续外力下更易变形,但能抵抗短暂的大脉冲。在更精细的基因组尺度上,启动子、增强子和基因体形成了与其相互作用焦点一致的“黏弹性岛”。这些结果表明,染色质黏弹性是三维基因组的一种有组织的、与表观遗传耦合的特性,可能影响增强子-启动子通讯、凝聚体介导的组织以及对细胞机械应力的响应。

染色质力学表观遗传三维基因组黏弹性基因座特异性弛豫时间
q-bio 12-30 00:00

身体并非为计算而生:评《信息具身化》中的计算主义身体观

本文评论了Pitti等人将计算与信息框架应用于理解动物身体演化与机器人设计的观点。作者认为,虽然计算与信息理论在理解神经系统和推动技术进步方面至关重要,但将身体的主要角色归结为“计算”是一种误导。身体的演化与存在,其核心功能在于与环境进行物理互动、支撑生命活动与实现生存目标,而非首要执行抽象的信息处理任务。这一评论挑战了将心智的计算隐喻过度延伸到身体领域的倾向,强调了身体的物质性、行动性与生态性本质。

具身认知计算主义身体哲学信息理论机器人学演化生物学
q-bio 12-30 00:00

基于边界观测的捕食者-猎物交叉扩散模型栖息地异常识别

本研究解决了数学分析与空间生态学交叉领域的一个开放反问题:仅利用边界观测数据,在多信号化学趋化捕食者-猎物系统中,唯一识别未知空间异常(解释为栖息地退化区域)及其相关生态参数。我们将问题表述为同时恢复未知内部子域及其边界上不连续的生态相互作用规则。建立了一个统一的理论框架,可唯一确定异常区域的几何形状以及表征退化区域内相互作用变化的不连续系数。结果涵盖了时变系统中的光滑异常,并扩展到稳态机制下的非光滑多面体包含物。这项工作弥合了生态传感与内部栖息地异质性定量推断之间的差距,为从有限外部数据检测和表征栖息地退化提供了数学基础。

反问题交叉扩散栖息地退化化学趋化边界观测空间生态学
q-bio 12-30 00:00

QSAR引导的生成式AI框架:从有限数据中发现新型气味分子

本研究提出了一种结合变分自编码器(VAE)与定量构效关系(QSAR)模型的生成式AI框架,用于从少量气味分子数据中设计新型气味物质。VAE通过自监督学习从ChemBL数据库学习SMILES语法,并通过QSAR模型提供的损失项引导其潜在空间按气味概率进行结构化。模型生成的分子100%语法有效,94.8%结构唯一,其与已知气味分子的Fr\'echet ChemNet距离(FCD)约为$6.96$,远优于基线($\approx 21.6$)。Bemis-Murcko骨架分析显示,74.4%的候选分子具有训练数据中未出现的新颖核心框架,表明模型实现了超越已知气味物简单衍生的化学空间探索。

生成式ai气味分子发现qsar模型变分自编码器化学信息学分子设计
q-bio 12-30 00:00

GNN-TF模型融合脑连接动态与临床数据,预测青少年未来烟草使用

本研究提出了一种结合时间感知图神经网络与Transformer融合机制的新模型(GNN-TF),用于整合非欧几里得脑成像数据(动态脑功能连接)与欧几里得临床表格数据,以预测未来行为。模型利用来自NCANDA纵向静息态fMRI数据集,在一个连贯的框架内有效利用变量的时间顺序。与多种现有机器学习及深度学习模型相比,GNN-TF在预测未来烟草使用方面展现出更优的预测准确性。其端到端、时间感知的融合结构成功整合了多模态数据并利用了时间动态性,为专注于临床结果预测的脑功能成像研究提供了有价值的分析工具。

图神经网络transformer融合脑连接动态纵向预测多模态数据烟草使用预测
q-bio 12-30 00:00

跨尺度生物多样性研究中的三种伪效应及其识别方法

本研究系统识别并阐述了在跨时空尺度研究生物多样性与生态系统功能关系时可能出现的三种伪效应:种群水平效应、独立性效应和算术效应。种群水平效应源于单个物种的种群动态,与生物多样性本身无关;独立性效应由物种在空间上的必然周转引起;算术效应则是数学函数行为的副产品。研究强调,要准确衡量真实的生物多样性跨尺度效应,必须对这些人为的、非生物性的伪效应进行有效控制。

生物多样性生态系统功能跨尺度研究伪效应方法论
q-bio 12-30 00:00

LiveProteinBench:无数据污染的蛋白质科学基准,揭示大模型真实能力

研究团队推出LiveProteinBench,一个旨在解决现有基准缺陷的新型多模态蛋白质科学评估基准。其核心创新在于测试集完全由2025年之后验证的新蛋白质构成,从根本上杜绝了数据污染。该基准包含12项任务,用于评估大语言模型在蛋白质性质与功能预测上的表现。评估结果显示:1)通用大模型在遇到新数据时展现出更强的零样本能力,准确率领先开源及领域专用模型超20%;2)有效利用多视角结构信息仍是重大挑战,加入结构图像常无法带来稳定增益,甚至可能降低性能;3)模型性能与推理时的计算成本关联更直接,凸显了思维链推理能力对蛋白质任务的关键作用。

蛋白质科学基准测试多模态模型数据污染生物信息学大语言模型
q-bio 12-30 00:00

λ噬菌体决策新机制:信息理论揭示层级抢占控制原理

本研究以λ噬菌体的裂解-溶原决策为模型,结合信息论分析,提出了一种名为“层级抢占”的新型控制机制。研究发现,高层级(如RecA损伤传感器)并非阻断低层级信号,而是通过将双稳态决策空间压缩为单稳态吸引子(98%溶原或85%裂解),从而获得2.01倍的信息优势。条件互信息分析表明,当RecA缺失时,整合信号CII的信息量(0.06比特)远低于RecA激活时(0.38比特)。这种饱和效应揭示了信号通过移除决策空间来协调细胞行为,在实现85-98%结果确定性的同时,保留了2-15%的“逃生路径”,为理解细胞决策中的层级信息处理提供了定量框架。

信息论层级控制λ噬菌体细胞决策互信息分析生物物理模型
q-bio 12-30 00:00

扩散面积如何影响种群灭绝阈值?

本研究通过晶格模型(接触过程)探究了有限扩散面积(A)对空间定殖-灭绝动力学的影响,并估算了灭绝阈值 λ_E(A)。结果表明,λ_E(A) 关系基本独立于晶格几何结构(除最小 A 外),并在两个广泛的 A 范围内遵循普适标度律。标度关系表明,扩散面积的增加,尤其是在低 A 值时,会施加显著的选择压力。这些发现为理解扩散面积的演化提供了新视角。

种群动力学空间模型灭绝阈值扩散面积标度律接触过程
q-bio 12-30 00:00

生物启发的整流谱单元网络:无需反向传播即可学习层次特征

本研究提出了一种受生物学启发的多层神经网络架构——整流谱单元(ReSU)。每个ReSU通过对其输入历史进行典型相关分析(CCA)获得典型方向,并对正负分量进行整流。通过将典型方向编码在突触权重和时间滤波器中,ReSUs实现了一种局部的、自监督的算法,用于逐步构建日益复杂的特征。在自然场景平移任务上训练的两层ReSU网络,第一层单元(由单个像素驱动)发展出类似果蝇光感受器后神经元(L1/L2和L3)的时间滤波器,第二层单元(对第一层进行空间池化)则变得具有方向选择性,类似于T4运动检测细胞。结果表明,ReSUs为建模感觉回路和构建无需反向传播的深度自监督神经网络提供了一个原则性框架。

生物启发计算自监督学习神经网络典型相关分析运动检测果蝇视觉
q-bio 12-30 00:00

早产儿疼痛经历加速感觉预测发育:脑电图研究揭示意外发现

本研究通过脑电图触觉oddball范式,首次在矫正胎龄35周的早产儿中检测到感觉预测的神经指标——重复抑制和失匹配反应。研究发现,新生儿期经历的医源性疼痛操作数量(而非早产程度)显著增强了这些神经反应。与预期相反,更多疼痛暴露的婴儿表现出更成熟的感觉预测模式,表明额外的宫外经验(即使是痛苦的)可能加速体感预测处理的发育。

早产儿神经发育感觉预测医源性疼痛脑电图研究神经可塑性发育加速
q-bio 12-30 00:00

热带核密度估计在系统发育树空间中的带宽选择方法

本研究针对系统发育树空间中的热带核密度估计器,提出基于似然交叉验证的带宽参数选择方法。通过理论推导获得最优带宽的显式解,并在多物种溯祖模型生成的模拟数据集上验证:相比基于最近邻的带宽估计,该方法在计算精度和效率上均表现更优。最后将方法应用于顶复门基因组实证数据。

热带几何核密度估计系统发育树带宽选择似然交叉验证
q-bio 12-30 00:00

节拍敲击实验揭示感觉运动同步的动态不兼容性

本研究通过节拍敲击实验,揭示了人类感觉运动同步中一个核心矛盾:对节拍周期“步进变化”和“相位偏移”两种扰动的响应,在独立实验中表现出动态不兼容性,无法用同一动力学系统描述,这解释了文献中许多矛盾结果。然而,当两种扰动在同一实验中随机出现时,响应变得兼容,表明存在一个可被时间背景重新校准的单一底层机制。研究结果为整合不同实验数据、深入理解纠错机制提供了新基础。

感觉运动同步节拍敲击动态不兼容时间背景纠错机制计算建模
AI速览助手