q-bio
02-04 00:00
本研究提出了CryoLVM,一个用于冷冻电镜(cryo-EM)密度图分析的基础模型。该模型采用联合嵌入预测架构(JEPA)与SCUNet骨干网络,通过自监督学习从实验密度图中提取丰富的结构表征,并引入一种新颖的基于直方图的分布对齐损失函数以加速收敛。CryoLVM在密度图锐化、超分辨率和缺失楔形恢复三个关键下游任务上均超越了现有最优方法,展示了其作为统一、可扩展框架处理多种冷冻电镜分析任务的潜力。
冷冻电镜基础模型自监督学习密度图分析计算机视觉
q-bio
02-04 00:00
本研究提出一个利用任务态功能磁共振成像(fMRI)量化信息处理过程的新框架,包括主动信息存储(AIS)、传递熵(TE)和净协同性。为解决样本量有限、非平稳性等挑战,框架采用了结合静息态与任务数据的交叉互信息计算方法。应用于470名参与者的工作记忆任务(N-back)数据发现:AIS随记忆负荷在前额-顶叶区域增加;TE揭示了控制通路中定向信息流的增强;净协同性则表明全局向冗余性转变。该工作为在任务态fMRI中量化信息处理建立了新方法。
信息论功能磁共振认知神经科学工作记忆信息处理计算方法
q-bio
02-04 00:00
本研究利用基于ResNet34的深度学习模型,通过识别超过10,000种鸟类,提取模型高维嵌入空间权重,探索鸟类形态演化。研究发现,模型学习到的嵌入空间编码了表型收敛信息,并揭示了物种丰富度是驱动形态空间扩张的主要因素。通过时间序列的形态差异分析,研究发现了K-Pg大灭绝事件后鸟类视觉形态的“早期爆发”演化模式。此外,研究还挑战了CNN主要依赖局部纹理的普遍观点,证明模型能够学习整体形状表征(身体结构蓝图),并在高维空间中自发涌现出与生物分类学对应的层次化语义结构,为深度神经网络的可解释性提供了新见解。
深度学习形态演化鸟类视觉可解释ai表型分析物种丰富度
q-bio
02-04 00:00
本研究提出了一种新型的可解释深度学习框架PA-MIL,用于病理全切片图像(WSI)的癌症亚型分析。该框架通过构建癌症相关表型知识库,并利用其形态学描述作为语言提示来聚合特征。核心创新在于设计了基于基因型-表型关系的神经网络(GP-NN),为模型提供多层次指导,使其能够直接识别与癌症相关的表型特征用于分类。实验表明,PA-MIL在保持与现有先进方法相当性能的同时,通过表型显著性图谱和线性分类器,提供了更可靠、可追溯的解释性。
可解释人工智能病理图像分析多示例学习表型识别基因型-表型关系语言提示
q-bio
02-04 00:00
本研究提出了一种评估语言模型元认知能力(即模型对自身知识的觉知)的框架,并引入了“元认知对齐进化策略”(ESMA)。该方法通过双提示法测量模型的元认知能力指标 $d_{\rm{type2}}'$,并利用进化策略将模型的内部知识与其显式行为进行绑定。实验表明,ESMA 在多种未经训练的场景下均表现出良好的泛化能力,显著提升了模型参照自身知识的能力。参数分析进一步揭示,这种提升源于对模型参数中一小部分关键参数的稀疏修改。
元认知语言模型知识对齐进化策略模型评估
q-bio
02-04 00:00
本研究针对Xenium等高分辨率空间转录组学平台产生的超高维图像数据,提出了两种空间正则化的非负矩阵分解(NMF)方法。Spatial NMF(SNMF)通过扩散细胞的因子向量来增强局部空间平滑性。Hybrid Spatial NMF(hSNMF)则结合了空间邻近性(接触半径图)和转录组相似性,构建混合邻接矩阵进行正则化NMF和Leiden聚类。在胆管癌数据集上的评估表明,相比其他基线方法,SNMF和hSNMF在空间紧凑性(CHAOS < 0.004,Moran's I > 0.96)、簇分离度(Silhouette > 0.12,DBI < 1.8)和生物学一致性方面均有显著提升。
空间转录组学非负矩阵分解空间正则化图像分析聚类分析计算生物学
q-bio
02-04 00:00
本文针对大规模空间组学数据中模式检测方法缺乏统计共识和计算成本高昂的问题,提出了一个统一框架。研究将主流方法归纳为单一二次型,推导出普适的一致性条件,并揭示包括Moran's I在内的多种常用方法存在统计不一致性。作者提出了可扩展的修正方案,使新检验方法能够稳健地处理数百万个空间位点的数据,并成功应用于单细胞谱系追踪数据集。
空间模式检测统计一致性空间组学可扩展算法单细胞分析
q-bio
02-04 00:00
本文提出MARBLE,首个完全基于Mamba状态空间模型的多状态多示例学习框架,用于处理具有千兆像素分辨率的多层级全切片图像。该框架并行处理多个放大倍率,并在线性时间模型内集成从粗到细的推理,以最小参数开销高效捕获跨尺度依赖。相比传统单尺度方法及计算成本呈二次增长的Transformer架构,MARBLE在五个公开数据集上取得显著提升,AUC最高提升6.9%,准确率提升20.3%,C-index提升2.3%,为多尺度WSI分析提供了高效且可扩展的解决方案。
全切片图像分析多尺度学习状态空间模型多示例学习医学图像处理线性时间建模
q-bio
02-04 00:00
本研究提出了一种可重复、抗偏倚的机器学习框架,专门针对小样本神经影像数据。该框架整合了领域知识驱动的特征工程、嵌套交叉验证和校准决策阈值优化。传统交叉验证方法因重复使用相同数据折叠进行模型选择和性能评估,易产生乐观偏倚,限制了可重复性和泛化能力。在深部脑刺激认知结果的高维结构MRI数据集上,该框架通过重要性引导排序选择紧凑、可解释的特征子集,实现了嵌套交叉验证平衡准确率 $0.660 \pm 0.068$。该工作结合了可解释性和无偏评估,为数据有限的生物医学领域提供了可靠机器学习的通用计算蓝图。
机器学习神经影像小样本学习抗偏倚框架可重复性嵌套交叉验证
q-bio
02-04 00:00
本文针对人类行为建模中缺乏通用理论的难题,提出了一种“对抗性构造”方法,用于在大型任务空间中进行高效的实验设计。研究聚焦于由隐马尔可夫模型(HMM)参数化的二元序列预测任务空间。由于任务空间巨大,全面实验探索不可行。该方法通过主动识别最可能引发新颖定性行为的任务,显著优于随机环境采样,可作为高维任务空间中优化实验设计的有效代理方案。
实验设计对抗性构造任务空间隐马尔可夫模型行为建模序列预测
q-bio
02-04 00:00
本研究提出了MARADONER,一个用于“基序活性响应分析”的改进统计框架,旨在从RNA-Seq或ATAC-Seq等高通量数据中更准确地推断转录因子的调控活性。相比经典方法,MARADONER通过采用无偏方差参数估计和偏差校正的固定效应似然估计,提升了模型拟合优度与活性估计的准确性。该框架还能处理基序评分与活性估计中的异方差性问题,为跨条件、细胞类型或疾病的基因表达差异提供更可靠的机制解释。
转录因子活性基序分析统计模型系统生物学高通量测序
q-bio
02-04 00:00
针对单细胞RNA-seq数据高维、稀疏、无序的特性,本研究提出scDiVa模型,通过掩码离散扩散方法克服了自回归生成中的顺序偏差和误差累积问题。该模型在标记空间中定义了连续时间前向掩码机制,采用双向去噪器联合建模离散基因身份和连续表达值,并利用熵归一化序列化和潜在锚标记来最大化信息效率、保持全局细胞身份。在5900万个细胞上预训练后,scDiVa在批次整合、细胞类型注释和扰动响应预测等主要基准测试中展现出强大的迁移性能。
单细胞rna测序扩散模型联合建模生物信息学生成模型预训练模型
q-bio
02-04 00:00
本研究在一个极简的计算机模拟环境中,探讨了基于动作的序列预测是否足以让循环神经网络学习“世界模型”。模型通过从2D连续标记场景中顺序采样,并基于当前输入和类似眼跳的位移来预测下一个标记。在新场景中,预测准确性随序列推进而提高,表明存在情境学习。解码分析揭示了路径整合以及标记身份与位置的动态绑定。干预分析表明,新的绑定可以在序列后期学习,甚至能学习分布外的绑定。这些结果为理解支持预测的结构化表征如何通过灵活绑定而涌现,提供了机制性解释。
世界模型序列预测路径整合对象绑定循环神经网络情境学习
q-bio
02-04 00:00
本文提出一种受人类视网膜和初级视觉皮层启发的仿生视觉接口(FOVI),旨在解决计算机视觉系统处理高分辨率全视野图像时的效率瓶颈。FOVI将类似视网膜的变分辨率传感器阵列,转换为均匀密集的V1状传感器流形,并基于此定义了k近邻(kNN)感受野。通过一种新颖的核映射技术实现kNN卷积。研究展示了两种应用:端到端的kNN卷积架构,以及对DINOv3 ViT模型的仿生视觉适应(利用LoRA技术)。这些模型在显著降低计算成本的同时,取得了与非仿生视觉基线模型相竞争的性能,为高分辨率第一人称视觉的高效、可扩展主动感知开辟了新途径。
仿生视觉计算机视觉高效计算视觉接口深度学习
q-bio
02-04 00:00
本研究提出一个文化演化的Moran型模型,用于描述文化性状在群体中的产生、传递与消失。分析聚焦于文化谱系(称为祖先学习图),其动态行为与群体遗传学中的祖先选择图密切相关。研究发现,整个群体的谱系总长度随时间呈现锯齿状动态变化,即线性增长被随机时刻的近乎归零的崩溃所打断。这一现象与描述祖先及后代数量演化的随机逻辑斯蒂模型的亚稳态行为有关。通过为模型叠加类型(假设新发明独立出现于每个个体,且学习事件中文化亲本的所有性状均被传递给学习者),个体的性状集合与其谱系上的创新集合一致。因此,谱系的性质决定了样本性状集合的性质,特别是性状数量的矩可以从谱系总长度的矩推导得出。
文化演化祖先学习图谱系动态性状传递随机模型矩分析
q-bio
02-04 00:00
本研究训练深度强化学习智能体完成间隔计时任务,发现其内部状态涌现出与生物系统相似的振荡神经激活模式。分析表明,智能体的计时行为主要由振幅高、频率与目标间隔对应的振荡神经元驱动,其策略与生物上合理的纹状体节拍频率模型相似。智能体在不同视频序列(包括空白视频)上仍能保持振荡表征和任务表现,表明其已将计时机制内化,对环境依赖极低。这为利用人工神经网络理解生物时间处理机制提供了新视角。
强化学习时间感知神经振荡计算神经科学生物启发
q-bio
02-04 00:00
本研究通过建立数学模型,阐明了单纯疱疹病毒(HSV)引起的树枝状角膜炎病变模式的形成机制。模型表明,感染抑制性细胞因子产量的增加会诱导形成具有末端球状结构的树枝状病变,而细胞因子水平降低则会导致地图状病变。通过改变细胞因子的空间分布,模型成功再现了病变的树枝状尾部。此外,引入外部细胞因子分泌机制后,模型还能模拟非HSV角膜炎中观察到的锥形病变。这些发现不仅深化了对疱疹性角膜炎病理机制的理解,也凸显了数学建模在眼科学中的实用价值。
数学建模角膜炎病变模式细胞因子单纯疱疹病毒眼科学
q-bio
02-04 00:00
本研究针对多状态结构化种群模型(如积分投影模型和年龄结构McKendrick方程)中主导特征结构的解释难题,开发了一种基于参考点算子的无行列式谱系框架。该框架通过秩一构造在核水平上组织谱系,将稳定分布和生殖值表示为迭代核的收敛级数,并导出由参考点矩表达的Euler-Lotka型特征方程。所得展开式通过普通偏Bell多项式获得封闭组合形式,建立了从转移核到谱系量(如期望世代数、类型繁殖数和世代间隔)的直接桥梁。该方法避免了严格的Hilbert-Schmidt假设,阐明了时间记忆和多类型异质性如何通过跨世代累积产生,为多状态人口统计指标提供了统一的解释路径。
种群模型谱系分析积分投影模型特征结构多状态异质性渐近行为
q-bio
02-04 00:00
本系统综述总结了利用自监督学习(SSL)从多通道脑电图(EEG)中学习全脑网络表征的基础模型的最新进展。通过对截至2025年7月的文献分析,发现Transformer架构是当前主流预训练模型,而MAMBA、S4等状态空间模型正成为新兴替代方案。掩码自编码是最常见的SSL目标,下游任务则广泛多样。尽管该领域发展迅速,但仍受限于数据集多样性不足、缺乏标准化评估基准以及通用性模型的缺失。未来的进展将依赖于更大规模、更多样化的预训练数据集、标准化的评估协议以及多任务验证。
脑电图分析自监督学习基础模型transformer脑网络表征系统综述
q-bio
02-04 00:00
生成式人工智能(AI)的革新正在重塑蛋白质设计领域,催生了大量用于优化现有酶或从头创造新酶的模型。经过十多年计算设计酶的低成功率后,生成式AI模型现已成为设计高效酶的常用工具。本文全面概述并分类了用于酶设计的生成式AI模型,重点介绍了经过实验验证且适用于真实场景的模型,并指出了各自的局限性。作者认为,生成式AI模型现已成熟,足以用于创造和优化工业应用所需的酶。更广泛地采用结合实验反馈循环的生成式AI模型,可以加速生物催化剂的发展,并为下一代模型的构建提供社区评估依据。
生成式ai酶设计生物催化蛋白质工程人工智能模型工业应用
q-bio
02-04 00:00
本研究开发了一款名为smICA的开源分析软件,旨在解决传统荧光显微镜难以精确测量活细胞内荧光探针绝对浓度的难题。该方法通过单分子成像分析,仅需每个像素少量光子,即可生成绝对荧光团浓度的定量分布图,并整合了寿命分辨信号滤波与基于强度的细胞分割功能。与传统的荧光相关光谱(FCS)多点测量相比,smICA显著缩短了测定单个细胞平均浓度所需的时间。研究通过体外(聚合物水溶液)和体内(活细胞中的聚合物与EGFP)实验,验证了其测量结果与标准FCS测量的一致性。该工具为蛋白质表达、生物分子降解及酶反应监测等定量单细胞研究提供了新手段。
定量成像荧光探针单细胞分析开源软件生物医学光学