今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读生成中,请稍后刷新。

2025-12-18 速览 · 计算机科学

2025-12-18 共 24 条抓取,按综合热度排序

← 返回日历
cs 12-18 00:00

利用大语言模型检测与应对私信骚扰:Instagram案例研究

本研究针对私密社交平台(如Instagram)中的在线骚扰问题,构建了一个基于大语言模型(LLM)的检测与应对管道。首先,研究者通过人工标注构建了Instagram消息数据集,并利用LLM结合对话上下文进行大规模骚扰内容标注,其表现与人工标注具有可比性。进一步,研究使用LLM生成针对骚扰消息的模拟回应,并通过评估发现,这些模拟回应在“帮助性”上优于原始的人类回应。这项工作为在私密通信场景中自动化识别和干预在线骚扰提供了新的技术路径。

在线骚扰检测大语言模型私密消息平台内容安全人机交互
cs 12-18 00:00

基于数字足迹的游客兴趣分析与画像构建

本研究提出一种结合定性与定量分析的数字足迹分析方法,用于理解游客行为动态及景点网络关系。通过整合游客在旅行中留下的数字痕迹,不仅关注行为频次等量化指标,还深入挖掘行为背后的兴趣偏好与决策模式,为旅游目的地管理和个性化服务提供更全面的数据支持。

游客画像数字足迹兴趣分析行为动态景点网络旅游大数据
cs 12-18 00:00

图嵌入风险模型:经济网络上的随机生存动力学

本文提出了图嵌入风险模型(GEHM),这是一个用于建模加权经济网络上生存动力学的非线性演化框架。该模型将基于图的 $p$-Laplacian 扩散算子与随机结构漂移耦合,形成一个有限维的 PDE-SDE 系统,捕捉节点生存如何对非线性扩散压力做出反应,同时一个聚合复杂度因子根据 Itô 过程演化。利用增生算子理论、非线性半群方法和随机分析,研究建立了温和解的存在唯一性,推导了依赖于拓扑的能量耗散不等式,并刻画了区分耗散、临界、放大和爆炸状态的稳定性阈值。在 Barabási-Albert 网络上的数值实验证实,枢纽主导地位会放大非线性梯度并压缩稳定性裕度,产生重尾生存分布和偶发的爆炸行为。

图嵌入风险模型生存动力学经济网络非线性扩散随机分析稳定性阈值
cs 12-18 00:00

LLM作为神经架构师:在严格API约束下生成图像描述模型

本研究提出NN-Caption,一种由大语言模型(LLM)引导的神经架构搜索(NAS)流程,能够在严格的网络API合约下,自动生成可运行的图像描述模型。该方法利用DeepSeek-R1-0528-Qwen3-8B作为主要生成器,通过组合LEMUR分类主干中的CNN编码器与序列解码器(LSTM/GRU/Transformer)来构建模型。在MS COCO数据集上的评估显示,LLM生成的数十个模型中,超过一半成功训练并产生有意义的描述。研究还分析了提示中不同数量输入模型片段(5个 vs. 10个)的影响,发现提供更多候选组件时成功率略有下降。这项工作展示了LLM引导NAS的潜力,不仅能够提出架构,还能建议超参数和训练实践,同时为开源LEMUR数据集贡献了数十个新颖的描述模型。

神经架构搜索大语言模型图像描述自动机器学习代码生成
cs 12-18 00:00

SGEMAS:基于熵稳态的自生长多智能体系统实现无监督在线异常检测

本文提出SGEMAS,一种受生物学启发的自生长瞬时多智能体系统,用于生理信号的无监督在线异常检测。它将智能视为动态热力学过程,通过将结构可塑性机制(智能体生灭)与变分自由能目标耦合,系统以极高的稀疏性自然演化以最小化预测误差。在MIT-BIH心律失常数据库的跨患者零样本挑战性设置中,最终模型平均AUC达$0.570 \pm 0.070$,优于标准自编码器基线,验证了基于物理的、能量约束模型在高效生物医学AI中的潜力。

异常检测多智能体系统无监督学习生理信号熵稳态生物医学ai
cs 12-18 00:00

注意力即绑定:从向量符号视角看Transformer的推理机制

本文提出将Transformer的自注意力机制和残差流解释为一种近似的向量符号架构(VSA)。在该视角下,查询和键定义了角色空间,值编码了填充物,注意力权重执行软解绑,而残差连接实现了多个绑定结构的叠加。作者利用这一代数透镜,将Transformer的内部机制与思维链、基于程序的推理以及记忆增强的工具使用联系起来,并解释了变量混淆和逻辑相关提示间不一致等典型失败模式。基于此,本文提出了受VSA启发的架构偏置和训练目标,旨在促进角色-填充物分离和鲁棒的叠加,为构建更具可解释性和逻辑可靠性的推理系统提供了原则性路径。

transformer向量符号架构推理机制注意力机制可解释ai逻辑可靠性
cs 12-18 00:00

AutoS:多域自适应中的自主源知识选择方法

本文提出了一种名为AutoS的多域自适应方法,旨在解决从多个源域向无标签目标域迁移知识时,源信息冗余或无关导致的性能下降问题。该方法采用密度驱动的选择策略,在训练过程中自主选择源域样本,并决定哪些源模型应对目标预测做出贡献。同时,利用基于预训练多模态模型构建的伪标签增强模块,来减轻目标域标签噪声并改进自监督学习。在真实数据集上的实验验证了该方法的优越性。

多域自适应迁移学习知识选择无监督学习密度驱动
cs 12-18 00:00

社交网络中信息访问公平性的优化算法研究

本研究针对在线社交网络中少数群体因网络位置劣势而难以获取信息的问题,提出了一种通过添加新连接来提升信息访问公平性的优化方法。该方法以电阻距离衡量信息访问,强调全局网络结构与多路径连通性。研究证明该问题是NP难的,并提出了一种高效的线性时间贪婪算法,可在百万节点规模的网络上生成精确解。

社交网络公平性优化信息传播网络算法电阻距离
cs 12-18 00:00

SepsisSuite:超越风险分层——深度融合与专家堆叠在脓毒症处方AI中的比较分析

本研究针对脓毒症(占全球ICU入院20%)的AI预测与处方任务,系统比较了端到端深度融合与上下文感知专家堆叠两种架构。研究发现,在小样本抗生素队列中,新颖的Quad-Modal Hierarchical Gated Attention网络(SepsisFusionFormer)因“注意力饥饿”导致过拟合(AUC 0.66)。相反,一种更精简的上下文感知混合专家架构(SepsisLateFusion)将静态、时序和文本模态视为正交专家,通过CatBoost元学习器动态门控,在临床发作前4小时预测中实现了0.915 AUC的SOTA性能,并将漏诊率降低了48%。此外,针对多类抗生素选择的处方任务,四模态集成模型取得了最高性能(0.72 AUC)。所有模型已集成至开源临床决策支持框架SepsisSuite中。

脓毒症ai多模态融合混合专家临床决策支持处方预测
cs 12-18 00:00

基于贝叶斯潜在类别强化学习的自适应出行行为建模框架

本研究提出了一种潜在类别强化学习模型,用于捕捉个体在出行决策中通过经验形成偏好并随时间演化的过程。模型通过变分贝叶斯方法进行参数估计,能够同时处理个体间的异质性及其偏好的动态适应性。基于驾驶模拟器数据的应用识别出三类具有显著差异的个体:第一类表现出情境依赖的偏好和情境特定的利用倾向;第二类遵循持续利用策略;第三类则采用探索性策略并结合情境特定偏好。

强化学习贝叶斯建模出行行为潜在类别变分推断行为异质性
cs 12-18 00:00

GSE ResNeXt:可学习Gabor卷积与注意力机制提升水下声学分类性能

本文提出GSE ResNeXt深度学习架构,用于解决复杂水下噪声环境中的目标分类难题。该模型将可学习的二维Gabor卷积层作为自适应带通滤波器,与ResNeXt主干网络结合,并引入挤压-激励通道注意力机制。此设计增强了模型对判别性特征的提取能力,提升了训练稳定性与收敛速度。在三个复杂度递增的分类任务上,GSE ResNeXt在分类性能上均优于Xception、ResNet等基线模型。特别地,模型初始层加入Gabor卷积使训练时间减少了28%,并揭示了传感器与目标船只间的距离对模型性能的显著影响。研究强调了信号处理策略对于提升数据有限场景下模型可靠性与泛化能力的重要性。

水下声学分类gabor卷积注意力机制深度学习信号处理模型泛化
cs 12-18 00:00

比特如何改写故事:通过可微故障注入实现语义操控

本研究首次探讨了对大型语言模型权重进行比特级扰动(故障注入)如何影响其生成图像描述的语义,同时保持语法结构。作者提出可微故障分析框架BLADE,利用基于梯度的敏感性估计定位语义关键比特,并通过语义流畅性目标优化选择。研究表明,即使难以察觉的低层比特变化也能操控生成式视觉-语言模型的高层语义,为鲁棒性测试、对抗防御和可解释AI开辟了新途径。

故障注入语义操控可微分析大语言模型图像描述生成模型鲁棒性
cs 12-18 00:00

SEED:基于谱熵评估的多元时序预测方法,解决依赖建模三大难题

本文提出SEED框架,通过谱熵动态评估变量间的时空依赖关系,自适应平衡通道独立与依赖策略。核心创新包括:依赖评估器利用谱熵提供初步依赖评估;基于谱熵的融合器进一步细化权重,分离外部影响;带符号图构造器保留负相关性,克服softmax局限;上下文空间提取器帮助变量感知时序位置。在12个真实数据集上的实验表明,SEED达到了最先进的性能。

时序预测谱熵依赖建模多元时序图神经网络注意力机制
cs 12-18 00:00

CAP混合归因先验:提升小语言模型可解释性与鲁棒性的新训练框架

本文针对小语言模型在分类任务中,现有归因方法难以提供有效判别性监督信号的问题,提出了类感知归因先验框架。该框架通过引导模型关注细粒度的类间差异,生成更具区分度的归因先验。进一步提出的CAP Hybrid方法,融合了新颖先验与传统归因技术,形成了更全面、平衡的监督信号。实验表明,该方法在标准、少样本及对抗场景下,均能有效提升模型的可解释性与鲁棒性。

可解释ai归因先验小语言模型鲁棒训练分类任务对抗学习
cs 12-18 00:00

SoMe:首个面向LLM社交媒体智能体的综合性基准测试平台

本文提出了SoMe,一个用于全面评估基于大语言模型的社交媒体智能体的开创性基准测试平台。该平台包含8类社交媒体任务、超过900万条帖子、6500多个用户档案以及17000多个精心标注的任务查询,首次为LLM智能体处理理解媒体内容、分析用户行为和复杂决策等多样化社交媒体任务提供了真实且通用的评估环境。广泛的定量与定性分析表明,当前主流的大语言模型在处理这些现实任务时仍存在显著局限。SoMe为未来社交媒体智能体的发展提供了一个具有挑战性且意义重大的测试平台。

大语言模型智能体社交媒体基准测试任务评估人工智能
cs 12-18 00:00

HATSolver:基于分层注意力Transformer的Gröbner基学习算法

本文提出HATSolver,一种基于分层注意力Transformer(HAT)的神经网络方法,用于计算多元多项式方程组的Gröbner基。该方法通过引入树状结构的归纳偏置,有效建模数据中的层次关系,相比传统的平面注意力模型(如Kera等人NeurIPS 2024的工作)实现了显著的计算节省。结合课程学习策略,本方法能够处理更大规模的问题实例,并提供了详细的计算成本分析。

gröbner基分层注意力transformer计算机代数多项式方程组神经网络
cs 12-18 00:00

生成式城市风流建模:基于图扩散的几何到气流转换

本研究提出了一种生成式扩散框架,用于在非结构化网格上合成稳态城市风流场。该框架结合了分层图神经网络与基于分数的扩散建模,仅需几何信息即可生成准确且多样的速度场,无需时间推进或密集测量。模型经过多个网格切片和风向角度的训练,能够泛化到未见过的几何形状,恢复尾流和再循环区等关键流动结构,并提供不确定性感知预测。这是迈向建筑环境基础模型的第一步,可帮助城市规划者在城市密集化和气候不确定性下快速评估设计决策。

城市风流建模图神经网络扩散模型计算流体力学生成式ai城市规划
cs 12-18 00:00

量子决策变换器:通过量子纠缠与干涉机制提升离线强化学习性能

本研究提出量子决策变换器(QDT),一种融合量子计算启发的架构,用于解决离线强化学习中长期信用分配和复杂状态-动作依赖的难题。其核心包含两个协同设计的组件:利用纠缠操作捕获非局部特征关联的量子启发注意力机制,以及采用多路径处理和可学习干涉进行自适应计算的量子前馈网络。在连续控制任务上的实验表明,QDT相比标准决策变换器实现了超过2000%的性能提升,并在不同数据质量下展现出优异的泛化能力。消融研究揭示了组件间强烈的协同效应,表明有效的量子启发架构设计需要整体协同设计,而非模块化组件堆叠。

量子启发计算离线强化学习决策变换器注意力机制神经网络架构信用分配
cs 12-18 00:00

有限样本下医疗应用中的保形预测理论:统计保证与实际效用的差距

保形预测(CP)是一种为机器学习模型提供统计保证的不确定性量化工具,其理论声称即使在小规模校准集上也成立。本文通过理论分析和医学图像分类任务的实证研究指出,虽然CP的统计保证在任意大小的校准集上均成立,但这些保证的实际效用高度依赖于校准集的大小。在医疗领域数据稀缺的背景下,这一发现对依赖小校准集获得可靠不确定性估计的实践提出了重要警示。

保形预测不确定性量化医疗ai有限样本统计保证校准集
cs 12-18 00:00

SEMO:动态社交网络关系管理的自适应优化框架

本文提出SEMO框架,将人类在不确定性下的社交决策建模为一个集成的多臂老虎机与马尔可夫决策过程优化问题。智能体通过强化学习、贝叶斯信念更新和基于代理的模拟,在动态社交图上自适应地平衡对新社交关系的探索和对现有关系的利用,以最大化其社会进化适应度。框架定义了融合个体收益与网络层面收益的适应度函数,并提出了具有对数遗憾界保证的Social-UCB算法。仿真实验表明,该算法在累积社会适应度和网络连接效率上均优于基线启发式方法。

社交网络强化学习多臂老虎机自适应优化网络演化决策模型
cs 12-18 00:00

超网络理论中的边界机制:一种保守的可见性范围控制方法

本文形式化定义了超网络理论中的“边界”概念。边界是一种非结构性的标签,它通过投影操作 $\pi_b(H)$ 来筛选出携带特定标签 $b$ 的超单纯形,从而在不改变底层网络结构的前提下,限制其可见性。该方法实现了不变结构与范围分析之间的严格分离,支持模块化建模与重叠视角,确保了视图级推理的局部性和全局结构的完整性。

超网络理论范围控制模块化建模结构投影视图提取
cs 12-18 00:00

GPT-OSS金融评测:小模型展现高效能,挑战规模决定性能的固有认知

本研究对GPT-OSS系列及其他大语言模型在金融领域的十项NLP任务进行了全面评估。一个反直觉的发现是:参数更少的GPT-OSS-20B模型在精度上与更大模型相当(65.1% vs 66.5%),同时在计算效率上显著领先,其Token效率得分为198.4,处理速度达159.80 tokens/秒。评估表明,GPT-OSS模型在多项任务上超越了包括Qwen3-235B在内的更大规模竞品,揭示了模型规模并非直接等同于任务性能。研究引入的新效率指标为生产环境部署提供了关键决策依据。

大语言模型金融nlp模型效率性能评测gpt-oss
cs 12-18 00:00

基于真实世界数据自动生成胶质母细胞瘤合成患者数据规则

本研究提出一种从表格数据统计信息中自动生成Synthea规则的方法,并以胶质母细胞瘤为例,利用癌症报告数据创建了相应的Synthea模块。该方法生成的合成数据集成功复现了已知的疾病进程,并基本保留了原始数据的统计特性。合成数据在保护隐私的同时,为医学研究提供了可用于假设构建和原型开发的数据资源,但实际应用时仍需考虑其局限性。

合成数据医疗数据隐私规则自动生成胶质母细胞瘤synthea
cs 12-18 00:00

MS-Index:支持通道自选的多变量时间序列快速子序列搜索算法

本文提出了一种名为MS-Index的新型算法,用于解决多变量时间序列(MTS)在欧几里得距离下的最近邻子序列搜索问题。该算法支持在查询时动态选择相关通道,例如在飞机传感器数据中仅针对特定故障(如起落架)的相关通道进行搜索。MS-Index是一种精确算法,其查询性能随查询通道数量呈亚线性增长。通过在34个数据集上的全面实验评估,证明其性能比现有最优方法快一到两个数量级,适用于原始和归一化后的子序列。

多变量时间序列子序列搜索最近邻搜索索引算法欧几里得距离动态通道选择
AI速览助手