今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2025-12-19 12-19 19:09

今日计算机科学领域整体呈现“理论突破驱动应用创新”的趋势,尤其在AI与物理系统建模、高效算法设计及多模态智能体开发方面成果显著。

  • AI赋能物理系统建模与逆向设计:多个研究将AI深度融入物理系统,实现从数据到可验证模型的自动构建(如DiscoverDCP的凸优化模型)、高效逆向生成(如Janus框架),乃至核反应堆等复杂系统的生成式设计(ReactorFold),展现了AI在解决传统高成本优化问题上的潜力。
  • 模型效率与部署的持续攻坚:针对大模型的内存与计算瓶颈,出现了突破性方案。SHARe-KAN通过向量量化将视觉KAN模型内存压缩88倍;LLaDA2.0则创新地将自回归大模型系统转换为扩散模型,以低成本扩展至千亿参数,聚焦实际部署。
  • 多模态与语言模型的能力深化与纠偏:研究不仅追求能力提升(如Anubuddhi用自然语言设计量子实验),更关注模型缺陷的修正。D3G通过生成多样化人口数据来减少多模态模型的偏见;后验校正方法则利用大模型有效提升视觉物种识别的少样本学习性能,揭示了协同增效的新路径。
  • 图神经网络与推荐系统的理论反思:对图信号频率在推荐系统中作用的研究,挑战了依赖低频滤波的传统观点,证明高频信号具有等效作用,为图神经网络的设计提供了新的理论视角和即插即用的优化模块。
  • 智能体工作流与网络安全的自动化增强:GLOW框架通过图-语言协同推理,提升了对智能体工作流性能的预测精度;TAO-Net则利用大语言模型实现加密流量的细粒度未知应用识别,推动了自动化系统在复杂场景下的实用化。
  • 系统安全与伦理框架的前瞻性构建:研究超越具体技术,关注宏观挑战。对可重构智能表面安全隐私风险的综述,以及提出的“比例责任原则”伦理框架,均为新兴技术的负责任部署提供了重要指导。

2025-12-19 速览 · 计算机科学

2025-12-19 共 24 条抓取,按综合热度排序

← 返回日历
cs 12-19 00:00

快速动态点云与高斯泼溅体捕获重建系统发布,支持野外实时预览

本研究提出了一种快速高效的体积捕获与重建系统,能够处理RGB-D或纯RGB输入,生成点云和高斯泼溅体(Gaussian splats)形式的3D表示。系统改进了GPS-Gaussian回归器,以最小开销实现高质量重建。其设计易于部署,支持非受控光照、任意背景的野外操作,以及灵活的相机配置(包括稀疏设置、任意数量和基线)。捕获数据可导出为PLY、MPEG V-PCC和SPLAT等标准格式,并通过Web查看器或Unity/Unreal插件进行可视化。系统提供5-10 FPS的现场实时预览。该框架已开源,以促进可复现性和进一步研究。

三维重建体积捕获高斯泼溅体点云实时系统开源框架
cs 12-19 00:00

DiscoverDCP:基于符号回归的数据驱动框架,自动构建可验证的凸优化模型

本研究提出了DiscoverDCP框架,它将符号回归与规则化凸规划(DCP)的规则集相结合,用于系统辨识。该框架的核心在于强制所有通过符号回归发现的候选模型表达式都遵守DCP组合规则,从而确保输出的表达式在构造上就是全局凸的,绕开了事后凸性验证这一计算上棘手的难题。与传统固定参数的凸表达式(如二次函数)相比,此方法能发现形式更灵活、更精确的凸代理模型。生成的模型具有可解释、可验证和灵活的特点,适用于安全关键的控制与优化任务。

符号回归规则化凸规划系统辨识凸优化可验证模型数据驱动建模
cs 12-19 00:00

Value Lens:利用大语言模型理解人类价值观

本文提出Value Lens模型,旨在利用大语言模型(LLMs)检测文本中蕴含的人类价值观,以评估自主决策系统是否符合人类价值取向。模型采用两阶段方法:第一阶段由LLM生成基于既定价值理论的描述并经专家验证;第二阶段采用双LLM协作,一个负责检测价值存在,另一个作为评审员进行批判性审查。实验结果表明,该模型在同类任务中表现优异,甚至超越了其他方法。

大语言模型价值观检测人工智能伦理自主决策文本分析
cs 12-19 00:00

基于扩散模型的稳定控制器生成设计:Youla参数化方法

本研究提出了一种基于扩散模型的线性控制器生成框架,其核心在于利用Youla-Kucera参数化,从设计上保证闭环系统的内部稳定性。该模型学习从被控对象动力学和期望性能指标到可行Youla参数的映射,在满足严格稳定性理论保证的同时,灵活适配用户指定的性能目标(如灵敏度、调节时间)。通过在合成的稳定单输入单输出(SISO)系统及固定阶次Youla参数数据集上进行训练,该方法能够在未见系统上可靠地合成满足预设性能指标的控制器。这是首次证明扩散模型能够生成具有稳定性保证的控制器,将经典控制理论与现代生成建模的灵活性相结合。

扩散模型控制器设计youla参数化稳定控制生成式设计线性系统
cs 12-19 00:00

基于可辨识与平坦模型的机电系统间接轨迹跟踪控制

本文针对机电系统中难以直接测量或估计被控输出(如位置)的问题,提出了一种运行间间接轨迹跟踪控制方案。该方案结合了基于可辨识模型的控制器与预测器,并通过一个迭代回路,利用可测量输出(如线圈电流)与其预测值之间的误差来更新模型参数。仿真实验表明,该方法仅需电流测量即可有效跟踪期望的位置轨迹,为模型精度依赖型前馈控制提供了重要的反馈补充。

机电系统控制轨迹跟踪可辨识模型平坦模型迭代学习间接测量
cs 12-19 00:00

Anubuddhi:多智能体AI系统,用自然语言设计并模拟量子光学实验

本研究提出了Anubuddhi,一个无需专业编程知识即可根据自然语言提示设计和模拟量子光学实验的多智能体AI系统。该系统通过语义检索从三层工具箱中组合光学元件,并通过物理模拟进行收敛式精炼验证。其架构结合了意图路由、知识增强生成和双模式验证(QuTiP与FreeSim)。在涵盖基础光学、量子信息协议和先进技术的13个实验中,系统设计-模拟对齐度达到8-9/10,模拟结果能忠实反映预期物理。关键发现区分了结构正确性与定量准确性:高对齐度确认了正确的物理架构,而数值预测仍需专家审核。在11/13的实验中,自由形式模拟优于约束框架,揭示了量子光学多样性需要灵活的数学表示。该系统为研究和教学民主化了计算实验设计,生成用户可通过对话迭代优化的高质量初始设计。

量子光学多智能体ai实验设计物理模拟自然语言处理
cs 12-19 00:00

混合量子-经典集成学习框架提升标普500方向预测准确率至60.14%

本研究提出了一种混合量子-经典集成学习框架,用于预测标普500指数的方向。该框架融合了量子情感分析、决策变换器架构和策略性模型选择,在2020-2023年市场数据上实现了60.14%的方向预测准确率,相比单个模型提升了3.10%。研究解决了三个关键问题:1)架构多样性优于数据集多样性,不同算法(LSTM、决策变换器、XGBoost等)在同一数据上集成效果更好(60.14% vs. 52.80%);2)4量子比特变分量子电路增强了情感分析,为每个模型带来0.8%-1.5%的增益;3)智能过滤剔除弱预测器(准确率<52%),提升了集成性能。McNemar检验证实了结果的统计显著性($p<0.05$)。初步回测显示,基于置信度的过滤策略(需6个以上模型共识)获得的夏普比率为1.2,优于买入持有策略的0.8。

量子机器学习金融预测集成学习情感分析决策变换器变分量子电路
cs 12-19 00:00

比例责任原则:为人类与人工智能系统建立基于知识-责任的伦理平衡框架

本文提出“比例责任原则”(PPD),为不确定性下的伦理决策提供新模型。该框架认为,道德责任随主体的认知状态动态变化:不确定性增加时,“行动责任”会按比例转化为“修复责任”(即主动核实、探究、解决不确定性的责任)。其核心公式为 $D_{total} = K[(1-HI) + HI * g(C_{signal})]$,其中总责任是知识水平(K)、谦逊/不确定性系数(HI)和情境信号强度(C_signal)的函数。蒙特卡洛模拟表明,保持一定谦逊系数(λ > 0)的系统能产生更稳定的责任分配,降低过度自信决策的风险。该框架在临床伦理、法律、经济治理和人工智能四个领域得到验证,为可审计的AI决策系统开发提供了数学上可处理的伦理责任模型。

伦理人工智能责任分配不确定性决策道德框架系统稳定性
cs 12-19 00:00

SHARe-KAN:利用全息向量量化突破KAN模型的内存墙

KAN网络因其学习到的基函数导致参数量巨大,面临严重的内存带宽瓶颈。研究发现视觉KAN具有“全息拓扑”特性,信息分布于样条干涉中而非特定边,传统剪枝方法失效。本文提出SHARe-KAN框架,采用增益-形状-偏置向量量化技术,在保持密集拓扑的同时利用函数冗余。结合硬件感知编译器LUTHAM,在PASCAL VOC数据集上实现了88倍运行时内存压缩(1.13 GB降至12.91 MB),且精度无损。在NVIDIA Ampere架构上,>90%的L2缓存驻留率表明工作负载已摆脱基于样条架构固有的DRAM带宽限制。

kan网络内存优化向量量化模型压缩硬件感知
cs 12-19 00:00

LLaDA2.0:通过系统转换将扩散语言模型扩展至1000亿参数

LLaDA2.0提出了一种将自回归大语言模型(AR LLM)系统性地转换为离散扩散大语言模型(dLLM)的新范式,模型总参数最高可达1000亿。其核心创新在于一个三阶段的块级WSD训练方案:块扩散预热、全序列扩散稳定、块扩散衰减,实现了知识继承与渐进适应,避免了从头训练的昂贵成本。模型经SFT和DPO对齐后,得到面向实际部署优化的指令调优MoE变体LLaDA2.0-mini(160亿)和LLaDA2.0-flash(1000亿),在保持并行解码优势的同时,提供了前沿的性能与效率。

扩散语言模型模型转换参数扩展知识继承moe架构并行解码
cs 12-19 00:00

Janus框架:统一生成与预测的确定性逆向设计新方法

本研究提出Janus框架,通过耦合深度编码器-解码器与可分离的KHRONOS预测头,在单一潜空间中同时实现高精度物理属性预测与确定性逆向生成。该框架在MNIST数据集和异质材料微结构逆向设计中得到验证,前向预测精度$R^2=0.98$,逆向解满足目标属性1%相对误差,且潜空间呈现解纠缠特性,为计算昂贵的传统优化方法提供了高效替代方案。

逆向设计生成模型材料微结构潜空间学习物理信息机器学习
cs 12-19 00:00

D3G:通过多样化人口数据生成提升多模态模型零样本图像分类准确率

本文提出了一种无需训练、零样本的方法D3G,旨在提升预训练多模态模型(如CLIP)的图像分类准确率并减少人口统计偏差。该方法利用生成模型(如Stable Diffusion XL)在推理时生成多样化的人口数据,为模型提供更丰富、平衡的跨模态类别表征。实验表明,提供多样化的人口数据能有效改善模型在细粒度分类任务上的性能,并探讨了不同人口特征对最终准确率指标的影响。

多模态模型零样本学习图像分类人口偏差数据生成clip
cs 12-19 00:00

大模型在视觉物种识别中表现不佳?后验校正方法实现显著提升

视觉物种识别(VSR)对生物多样性评估至关重要,但标注数据稀缺。研究发现,尽管大型多模态模型(LMMs)在通用任务上表现出色,但在VSR任务中却显著落后于简单的少样本学习专家模型。然而,深入分析发现,LMMs能够有效校正专家模型的错误预测。基于此,研究者提出了一种无需额外训练的后验校正方法(POC),该方法利用LMMs对专家模型的Top预测进行重新排序,结合置信度分数和少样本示例。在五个VSR基准测试中,POC将少样本学习的准确率平均提升了6.4%,且能作为即插即用模块泛化到不同的骨干网络和LMMs。

视觉物种识别大型多模态模型少样本学习后验校正生物多样性模型增强
cs 12-19 00:00

GLOW:图-语言协同推理框架,提升智能体工作流性能预测精度

本文提出GLOW框架,旨在解决智能体工作流(AW)自动化生成中执行评估成本高、延迟大的瓶颈。现有预测方法难以同时捕捉AW中复杂的拓扑依赖关系和深层语义逻辑。GLOW创新性地将图神经网络(GNN)的图结构建模能力与大语言模型(LLM)的推理能力相结合:通过在图任务上指令微调的图导向LLM提取拓扑感知的语义特征,并与GNN编码的结构表示进行融合。此外,引入对比对齐策略优化潜在空间以区分高质量AW。在FLORA-Bench上的大量实验表明,GLOW在预测准确性和排序效用上均优于现有先进基线。

智能体工作流性能预测图神经网络大语言模型多模态融合对比学习
cs 12-19 00:00

TAO-Net:两阶段自适应网络实现加密流量的细粒度未知应用识别

针对加密流量分类中不断涌现的新应用(OOD流量)挑战,本文提出TAO-Net两阶段自适应分类网络。第一阶段采用基于Transformer的层间变换平滑度与特征分析的混合检测机制,有效区分已知与未知流量;第二阶段创新性地利用大语言模型及语义增强提示策略,将未知流量分类转化为生成任务,无需依赖预定义标签即可实现灵活、细粒度的分类。在三个数据集上的实验表明,其宏精确率(96.81-97.70%)和宏F1分数(96.77-97.68%)显著优于此前方法(44.73-86.30%),尤其在识别新兴网络应用方面表现突出。

加密流量分类分布外检测大语言模型细粒度分类两阶段网络自适应学习
cs 12-19 00:00

可重构智能表面在现实系统中的安全与隐私挑战综述

本文综述了可重构智能表面(RIS)在智能家居、车辆和工业等实际部署场景中的安全与隐私问题。研究分析了存在/不存在合法RIS的系统,以及拥有/不拥有恶意RIS的攻击者,揭示了RIS可能引入的新型窃听、干扰和欺骗攻击。同时,综述了针对这些攻击的防御策略,如应用额外安全算法、干扰攻击者以及早期检测未经授权的RIS。文章旨在为开发安全、鲁棒且保护隐私的RIS赋能无线系统提供指导。

可重构智能表面无线安全隐私保护物理层安全智能环境攻击防御
cs 12-19 00:00

KAN-Matrix:可视化非线性关系,提升物理数据洞察力

针对高维数据中变量共线性导致的解释难题,本研究提出基于Kolmogorov-Arnold Networks(KANs)的可视化工具。通过构建成对KAN矩阵(PKAN)和多变量贡献矩阵(MKAN),分别刻画变量间的非线性关联及对目标变量的相对贡献度。实验表明,该方法在鲁棒性和信息量上优于皮尔逊相关和互信息分析,支持从特征选择到模型解释的全流程,有助于发现隐藏的物理模式并指导领域知识驱动的模型开发。

可解释ai数据可视化非线性分析特征工程物理洞察kan网络
cs 12-19 00:00

ReactorFold:基于语言模型的核反应堆堆芯生成式设计框架

本研究提出ReactorFold,将核反应堆燃料组件设计重构为语言模型的序列建模问题。通过蒙特卡洛数据、参数高效微调和直接偏好优化(DPO),模型学习了压水堆组件的潜在结构,并能单次前向传播生成候选布局。值得注意的是,经DPO对齐的模型展现出涌现的设计空间扩展能力:尽管仅使用固定数量钆可燃毒物棒的配置进行训练,它仍能自主调整钆库存以满足严格的功率峰值约束。模型还发现了挑战传统对称装载启发式方法的高性能非对称配置,进入了传统搜索方法无法触及的设计领域,证明了语言模型能够内化因果物理关系并超越人为施加的设计约束。

核反应堆设计生成式模型语言模型直接偏好优化序列建模涌现能力
cs 12-19 00:00

Prompt-to-Parts:基于生成式AI的物理组装与可扩展指令生成框架

本研究提出了一个从自然语言描述生成物理可实现的组装指令的框架。与不受约束的文本到3D方法不同,该方法在一个离散的部件词汇表内运行,强制执行几何有效性、连接约束和可构建顺序。利用LDraw作为富含文本的中间表示,研究表明,大型语言模型可以通过工具引导,为包含超过3000个组装部件的基于积木的原型生成有效的分步构建序列和组装指令。该方法旨在实现可证明的可扩展性、模块化和保真度,弥合语义设计意图与可制造输出之间的差距。

生成式ai物理组装自然语言处理计算机辅助设计可制造性原型设计
cs 12-19 00:00

图信号频率对推荐系统的影响:揭示低频与高频信号的等效作用

本文挑战了谱图神经网络在推荐系统中主要依赖低频滤波的传统观点。通过理论证明,低频与高频图信号在推荐任务中具有等效作用,其核心机制均在于平滑用户-物品对的相似性。基于此,研究提出了一个即插即用的频率信号缩放器模块,可适配任何GNN模型以微调平滑度。同时,研究还指出并解决了基于图嵌入的方法在捕捉信号特征上的局限性,并证明了仅使用单一频率信号即可实现有效推荐。在四个公开数据集上的实验验证了方法的有效性。

图神经网络推荐系统图信号处理谱滤波用户-物品相似性
cs 12-19 00:00

NTK机制下ReLU网络在原点附近的二次外推特性

已有研究表明,ReLU多层感知机(MLP)对分布外数据点倾向于进行线性外推。本文聚焦于神经正切核(NTK)机制下的一个特殊情形:原点附近的评估点。由于NTK诱导的无限维特征映射不具有平移不变性,原点附近的外推与远离原点的外推并不等价。研究发现,在原点附近,ReLU网络在NTK机制下可能表现出二次外推行为,这为理解神经网络外推能力的边界提供了新的理论视角。

神经正切核外推行为relu网络机器学习理论特征映射
cs 12-19 00:00

多视图分类新方法:双限制核机提升计算效率与泛化性能

本文提出了一种新颖的多视图双限制核机(TMvRKM)模型,用于解决多视图分类问题。该模型通过正则化最小二乘法替代传统的大规模二次规划问题,显著提升了计算效率。其核心目标函数包含一个耦合项,能有效平衡多视图间的误差,并结合早期与晚期融合策略,充分利用所有视图的互补信息。在UCI、KEEL和AwA基准数据集上的实验与统计分析表明,TMvRKM在泛化性能上全面超越了现有基线模型。

多视图学习核方法分类算法机器学习计算效率
cs 12-19 00:00

Yantra AI:面向XRIT的智能制造平台,集成机器学习与GPT-4虚拟助手

本研究针对工业4.0背景下的智能制造需求,为XRIT开发并测试了一个智能生产平台。该平台集成了多种机器学习模型,如用于预测性维护的随机森林分类器(Random Forest Classifier)和用于异常检测的孤立森林(Isolation Forest),以优化能源管理、减少停机时间。系统通过Streamlit实现实时数据可视化仪表盘,并引入基于GPT-4的AI虚拟助手,为工人提供实时决策支持。测试表明,该系统能显著提升工作效率、能源管理水平和维修规划能力。未来工作将聚焦于实时数据集成与系统优化。

智能制造预测性维护工业ai实时可视化gpt-4助手能源管理
cs 12-19 00:00

语义约束联邦聚合:知识增强分布式学习的收敛理论与隐私-效用边界

本文提出语义约束联邦聚合(SCFA)框架,首次将领域知识约束融入分布式优化,并建立了基于约束的联邦学习收敛理论。理论证明SCFA的收敛速率为$O(1/\sqrt{T} + \rho)$,其中$\rho$为约束违反率。分析表明,约束能将有效数据异质性降低41%,并通过假设空间缩减因子$\theta=0.37$改善隐私-效用权衡。在$\epsilon=10$的差分隐私下,约束正则化能将效用维持在非隐私基线的3.7%以内,相比标准联邦学习的12.1%性能下降,实现了2.7倍的改进。在包含118万样本的博世生产数据上的实验验证了该框架,显示其能加速22%的收敛,并减少41.3%的模型发散。

联邦学习语义约束收敛理论隐私保护知识图谱分布式优化
AI速览助手