q-bio
12-19 00:00
本文批判性地评估了生物医学影像领域基础模型的现状与潜力。作者指出,当前模型虽在复杂空间关系理解与多模态数据整合上展现出灵活性,但其临床部署仍受限于算法偏见、数据隐私及模型幻觉等可信赖性问题。文章强调,未来的关键方向在于超越统计相关性,追求因果推断能力,并构建可验证安全的混合系统,以开发辅助而非替代人类专家的工具。
基础模型生物医学影像因果推断模型部署人工智能伦理临床验证
q-bio
12-19 00:00
本文探讨了皮层神经元尖峰时序的毫秒级精度如何通过尖峰时序依赖可塑性(STDP)支持长时工作记忆。研究发现,皮层传播波能够以高时间精度同步刺激兴奋性突触,而抑制性篮细胞在强瞬态超极化后的抑制性反弹可触发反向传播动作电位,从而激活STDP。这种机制可维持数小时,形成支持长时工作记忆的二级网络,为认知功能提供新的神经动力学解释。
尖峰时序长时工作记忆stdp皮层传播波神经动力学认知网络
q-bio
12-19 00:00
针对缺乏稳定结构的“不可成药”靶点——内在无序蛋白(IDPs),本研究开发了StructBioReasoner,一个可扩展的多智能体系统。该系统采用新颖的锦标赛式推理框架,让多个专业智能体协同工作,整合文献、AI结构预测、分子模拟和稳定性分析,在HPC基础设施上高效探索广阔的设计空间。在Der f 21和NMNAT-2蛋白上的基准测试表明,超过50%的设计候选物在结合自由能上优于文献中人工设计的参考结合物,并成功识别出包括已知界面在内的多种结合模式,为基于百亿亿次计算平台的IDP药物发现奠定了基础。
内在无序蛋白多智能体系统药物设计计算生物学ai辅助发现高通量筛选
q-bio
12-19 00:00
本研究提出一种结合湿实验与学习算法的协同设计方法,通过将压缩感知技术扩展至函数空间的神经网络,实现了对多种生物分子活性的同步测量与解卷积。该方法在模型训练过程中重构分子-活性图谱,理论上可将信息密度提升数个数量级。实验在抗体和细胞疗法领域验证了其有效性,为机器学习驱动的生物科学规模化研究提供了新策略。
压缩感知生物分子活性协同设计神经网络数据采集湿实验
q-bio
12-19 00:00
本研究提出一种新框架,利用临床监测患者长达一周的颅内神经信号与音频同步记录,将训练数据规模扩大两个数量级以上。通过对比学习模型进行监督预训练,其解码性能显著超越仅使用传统短时实验数据训练的模型,且性能提升与数据集大小呈对数线性关系。分析表明,虽然大脑活动编码语音特征,但其全局表征结构会随天数发生显著漂移,凸显了模型需显式处理跨日变异性的必要性。该方法为在真实生活与受控任务场景下解码和建模大脑表征开辟了可扩展路径。
脑机接口语音解码监督预训练颅内信号对比学习表征漂移
q-bio
12-19 00:00
本文探讨了智能体(尤其是人类智能)如何动态合成新目标函数的核心问题,并提出了“主观函数”的概念。主观函数是一种内生于智能体的高阶目标函数,其定义依赖于智能体自身的特征,而非外部任务。研究以“预期预测误差”作为具体案例进行分析,揭示了智能体如何从内部状态和认知过程中衍生出目标。该框架为理解人类目标形成机制以及赋予人工智能系统类似能力提供了新思路,并与心理学、神经科学及机器学习领域的相关思想建立了联系。
主观函数目标函数人工智能认知科学智能体
q-bio
12-19 00:00
本综述系统梳理了人工智能(AI)在微生物学与微生物组研究中的应用与突破。文章首先介绍了机器学习与深度学习等核心AI技术,并提供了根据研究目标选择方法的指导。核心应用场景涵盖从物种分类、功能预测、微生物-环境互作、生态学、代谢建模,到精准营养、临床微生物学及疾病防治等多个前沿领域。最后,文章探讨了当前面临的挑战并展望了未来方向,强调了AI在深化理解微生物生命及其对地球与人类健康影响方面的变革性作用。
人工智能微生物组机器学习精准营养临床微生物代谢建模
q-bio
12-19 00:00
本研究提出了一种结合持久同调和机器学习的计算方法,用于根据蛋白质结构数据对细菌鞭毛马达的功能状态(旋转与停滞)进行分类。通过将原子坐标构建为过滤单纯复形,提取多尺度拓扑特征(如持续图与条形码),这些特征捕捉了与马达功能相关的关键几何与连接模式。经向量化后,特征被输入包含降维与监督分类的机器学习流程。在来自不同细菌物种的实验表征数据集上,该模型展现出高分类精度与对结构变异的鲁棒性,凸显了拓扑数据分析在揭示传统几何描述符难以捕获的功能相关模式方面的强大能力。
拓扑数据分析持久同调蛋白质功能预测机器学习细菌鞭毛马达计算结构生物学
q-bio
12-19 00:00
针对深度学习方法在预测刚性蛋白结构上的成功,本文聚焦于建模内在无序蛋白(IDPs)的构象集合这一关键挑战。现有AI方法存在权衡:蛋白质语言模型(PLMs)缺乏物理基础,而生成完整构象集合的模型计算成本高昂。为此,作者提出GeoGraph,一种基于模拟信息的替代模型,可直接从序列预测残基-残基接触图的拓扑结构。该方法通过将粗粒度分子动力学模拟特征化为残基级和序列级图描述符,构建了信息丰富的学习目标。评估表明,GeoGraph生成的表示在预测关键生物物理性质方面优于现有方法。
无序蛋白构象集合图描述符分子动力学ai预测生物物理
q-bio
12-19 00:00
本文提出SPLICE方法,利用神经网络从成对的高维数据视图中推断出解耦、可解释的共享与私有潜在变量表示。相比现有方法,SPLICE能更有效地解耦共享与私有信息,通过保留几何结构提升表示的可解释性,并对潜在维度估计错误具有更强鲁棒性。该方法为神经科学等多领域分析多视角数据(如不同脑区记录)提供了通用框架。
多视角学习表示解耦几何保持神经网络神经科学无监督学习
q-bio
12-19 00:00
本文提出了一种知识驱动、多智能体协作的科学语料蒸馏框架,旨在解决生物医学大语言模型训练中开源标注语料数量不足、质量不高的瓶颈问题。该框架的核心是一个基于医学主题词表(MeSH)层级结构指导的多智能体架构,其中各专业智能体协同工作,从海量科学文献中自主提取、合成并自我评估高质量的文本数据,自动生成和精炼领域特定的问答对。实验表明,使用本框架蒸馏出的数据集训练的模型,在生物医学问答任务上表现优异,甚至能使Llama3-70B模型超越GPT-4(MedPrompt)和Med-PaLM-2等先进模型。消融研究和案例分析进一步验证了框架内各智能体的有效性与协同作用。
生物医学大模型语料蒸馏多智能体知识驱动医学主题词表问答对生成
q-bio
12-19 00:00
本研究提出PEM-UDE方法,结合预测误差法与通用微分方程,从混沌动力系统中提取可解释的数学表达式。该方法通过平滑优化景观并在拟合过程中去除混沌特性,成功从噪声数据中恢复隐藏状态和动态结构,例如在观测信号被5倍噪声污染时仍能恢复正确的动力学函数形式。应用于神经群体时,该方法推导出尊重网络稀疏性等生物约束的新控制方程,揭示了连接密度与振荡频率、同步性之间的涌现关系,并通过颅内电极记录数据验证了预测。
科学机器学习混沌系统神经动力学控制方程发现通用微分方程多尺度脑模型
q-bio
12-19 00:00
本研究通过构建包含酶-底物可逆结合步骤的反应-扩散模型,揭示了酶结合动力学如何调控代谢通路中的图灵不稳定性。研究发现,与简化模型相比,显式考虑复合物形成会改变均质稳态、弛豫动力学,并显著影响图灵不稳定区域的大小和位置。数值模拟证实,可逆结合会减弱图案振幅并延缓空间异质性的形成。该框架定量地建立了酶-底物结合动力学、扩散驱动不稳定性与介观空间组织(如液-液相分离)之间的联系。
反应-扩散模型图灵不稳定性酶促动力学代谢通路空间图案液-液相分离
q-bio
12-19 00:00
本研究提出了两种对传统NK适应度景观的改进模型:θNK模型引入参数θ,在子基因型贡献中整合局部“粗糙富士山”型相关性,以模拟更符合生物实际的、相关的适应度效应;HNK模型则通过引入掩蔽机制,让特定基因位点调控其他位点的表达,从而模拟基因调控网络效应。通过广泛的参数模拟,研究发现增加θ或掩蔽位点数量H通常能增强景观的可及性,即使在存在许多局部最优解的情况下也是如此,这表明景观的崎岖性并不必然阻碍进化路径。不同的交互模式(分块、相邻、随机)会导致可及性和最优解结构的不同表现。
适应度景观进化模型nk模型基因调控景观可及性模拟研究
q-bio
12-19 00:00
本研究针对皮肤镜图像自动分类中常见的类别不平衡问题,以ISIC 2016数据集为例,系统评估了多种平衡技术对轻量级CNN模型MobileNetV2性能的影响。研究发现,过采样方法(如SMOTE、ADASYN)虽能提升模型表现,但可能因生成冗余合成样本而导致过拟合。而混合方法(如SMOTE+Tomek Links)通过移除边界或噪声样本,有效缓解了此问题,增强了模型的泛化能力。该分析强调了在医学图像处理中,为构建稳健且敏感的诊断系统,选择合适的平衡策略至关重要。
类别不平衡皮肤病灶分类过采样欠采样混合采样医学图像处理
q-bio
12-19 00:00
本研究发布了一个名为retinalysis-fundusprep的开源Python软件包,用于自动、鲁棒地提取彩色眼底图像的参数化边界并进行对比度增强。该方法首先通过极坐标变换和最短路径算法检测图像轮廓,再利用RANSAC圆拟合算法稳健地定位圆形边界,并独立检测直线边界。在增强前对图像进行镜像处理以消除边缘伪影。在EyeQ数据集上的评估显示,其错误率仅为0.2%,显著优于先前工作的1.9%。在具有挑战性的鹿特丹研究数据集样本上实现了零错误。该工具包提高了边界检测的可靠性,有望在更广泛的数据集上实现自动化分析,减少人工验证需求。
眼底图像分析边界检测开源工具医学图像处理ransac算法对比度增强
q-bio
12-19 00:00
本研究探索了氧化镁涂层埃洛石纳米管(MgO HNTs)在增强种子萌发和早期植物发育方面的应用,覆盖地球、月球和火星土壤条件。通过响应面法优化,确定在25°C、12小时光照及100 mg/L MgO HNTs浓度下,地球土壤模拟物中根和芽长度增长最显著。在月球和火星风化层模拟物中的验证实验表明,MgO HNTs能在营养有限和高胁迫条件下支持种子萌发、根系穿透及幼苗活力,为地球和太空环境中的可持续植物栽培提供了纳米材料改良新思路。
太空农业纳米材料种子萌发土壤改良植物栽培胁迫耐受
q-bio
12-19 00:00
本文提出一个思想实验:如果大脑仅由神经元网络构成,可能无法独立产生“现在”的时间感知。作者认为,这种局限性会影响网络的信息处理效率,需要通过身体行为与外部物理世界建立周期性接触,从而产生时间标记流。这一观点可能弥合生态心理学与神经科学框架之间的分歧,为理解时间感知机制提供新视角。
时间感知思想实验神经科学生态心理学身体运动认知机制
q-bio
12-19 00:00
本文提出利用计算工具简化数学系统发育学中依赖大量案例分析的组合证明。研究表明,许多传统上需要冗长手工推导的证明可以通过计算方法更简洁地完成。该方法不仅验证了现有结论,还成功证明了若干新的组合引理,这些引理若手工证明将耗费巨大精力。作者认为,类似的计算辅助方法可在系统发育学领域得到更广泛的应用。
计算辅助证明数学系统发育学组合证明案例简化计算工具
q-bio
12-19 00:00
本综述系统梳理了2020-2025年间生物医学领域的检索增强生成技术。针对大型语言模型静态知识与临床证据动态性之间的根本矛盾,RAG通过外部数据增强生成,但引入了延迟与架构复杂性。研究将系统分为朴素、高级与模块化范式,并形式化了生物医学RAG的“三难困境”,揭示了推理深度、推断延迟与数据隐私之间的固有权衡。分析指出,近期智能体工作流虽能提升诊断推理能力,但可能带来难以接受的延迟;隐私约束则决定了在强大云端模型与本地部署之间的选择。最后,文章概述了多模态RAG的对齐差距,并为未来可自我纠正、可验证的临床智能体指明了方向。
检索增强生成生物医学人工智能临床决策支持大型语言模型数据隐私多模态学习
q-bio
12-19 00:00
本研究提出了一种基于随机Kermack-McKendrick模型和积分核回归的方法,用于从群体水平的随机流行病轨迹中推断关键的疾病属性。该方法能够从单条或多条轨迹中,恢复出种群平均传染性函数 $\beta(\tau)$、感染持续时间分布及其互补累积分布(感染生存分布)。研究证明,在假设个体传染性曲线具有自相似性的前提下,这些恢复的属性可用于求解个体传染性剖面 $\beta_i(\tau)$。这表明,通过对单一局部混合人群中新发传染病暴发的随机演化进行积极监测,可以确定其传播特征。
传染病模型参数反演随机过程流行病学kermack-mckendrick模型