今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读生成中,请稍后刷新。

2025-12-17 速览 · 计算机科学

2025-12-17 共 24 条抓取,按综合热度排序

← 返回日历
cs 12-17 00:00

安宁疗护远程医疗应用设计:从理论框架到临床实践

本研究提出并实践了一个用于安宁疗护的增强型远程医疗应用设计框架。该框架整合了三个社会技术维度:技术质量(性能、安全、合规)、人文价值(同理心、包容性、透明度)以及现实世界适应性。通过多学科、基于经验的协同设计方法,联合临床医生、患者及照护者进行原型迭代、可用性测试和真实世界评估,最终开发出一款安全、公平且具有韧性的数字健康应用。此设计方法可为医疗及其他领域的软件设计提供参考。

远程医疗安宁疗护社会技术设计协同设计数字健康
cs 12-17 00:00

惯性导向驾驶技术:封闭赛道实验证实可优化跟车行为

本研究通过封闭赛道实验,验证了惯性导向驾驶技术(DI)对改善跟车行为的有效性。12名驾驶员在接受DI培训后,在真实跟车场景中表现出显著更低的加减速频率和速度波动,表明驾驶员能够从传统的“保持距离”策略转向“保持惯性”策略。该研究首次在真实赛道环境中证明了DI策略的实践潜力,为优化交通流稳定性提供了新思路。

跟车模型驾驶行为惯性导向交通流人机交互
cs 12-17 00:00

游戏文本特效研究:拟声词与语义文本如何提升玩家体验

本研究探讨了游戏中的“多汁感”(Juiciness)与文本特效的关系。传统研究多聚焦于粒子特效,而本文则关注拟声词和用于提供游戏反馈的语义文本。通过一项多阶段受试者内实验,研究发现用户对“多汁”文本特效的评价与粒子特效相当,且能提供更可靠的反馈。研究还暗示,结合粒子与文本特效可能进一步提升用户体验,并揭示了文本刺激在感知上可能与其他视觉刺激存在差异。

游戏设计用户体验文本特效拟声词视觉反馈交互媒体
cs 12-17 00:00

物理引导深度学习提升热泵应力检测精度

本研究提出一种物理引导深度神经网络方法,用于热泵系统应力分类。该方法基于包含13万样本的When2Heat数据集,通过物理知识指导特征选择与类别定义,并采用双正则化策略的深度网络架构。模型在测试集上达到78.1%的准确率,较基线方法提升最高达5.0%。消融实验验证了物理引导特征选择与可变阈值策略的有效性,为热泵状态监测提供了高效解决方案。

物理引导学习热泵监测深度学习能源系统故障检测
cs 12-17 00:00

AI时代写作共生:人类创意能动性的双重轨迹演化

本研究通过分析大语言模型(LLM)时代前后的海量写作数据,揭示了人类与AI在创意写作中的协同演化模式。研究发现,作者并未走向单一的文体同质化,而是呈现出“双重轨迹演化”:主题上围绕AI话题趋同,文体风格上却出现结构化分化。具体表现为三种适应模式:部分作者风格趋近AI,部分刻意远离,部分则保持稳定但内容涉AI。这一“创意原型地图”为理解人机协作、AI文本检测及创意多样性保护提供了新视角。

人机协作创意写作大语言模型文体演化协同进化文本分析
cs 12-17 00:00

基于本地部署大语言模型的临床记录结构化提取框架

本研究提出了一种安全、模块化的框架,利用在符合HIPAA标准的本地计算基础设施上部署的大语言模型,从非结构化的电子健康记录中自动提取结构化特征。该系统集成了检索增强生成和结构化响应方法,可部署于广泛场景。评估显示,与专家标注数据集相比,该框架在大量患者记录中提取多种医学特征时具有高准确性,甚至发现了人工审查遗漏的标注错误。该框架展示了LLM系统通过自动化提取减轻人工图表审查负担、提高数据捕获一致性并加速临床研究的潜力。

大语言模型临床记录结构化提取检索增强生成医疗ai自动化
cs 12-17 00:00

无需位置标签的盲无线地图构建:基于空间正则化的贝叶斯轨迹推断

本文提出了一种无需位置标签的盲无线地图构建框架。该方法首先证明了在准镜面反射环境模型下,非视距信道状态信息具有空间连续性,并推导出与物理距离成正比的CSI距离度量。基于此,研究开发了一个空间正则化的贝叶斯推理框架,能够联合估计信道特征、区分视距/非视距条件并恢复用户轨迹。在射线追踪数据集上的实验表明,该方法实现了平均0.68米的定位误差和3.3%的波束图重建误差,验证了其有效性。

无线地图盲定位贝叶斯推断mimo-ofdm轨迹恢复空间正则化
cs 12-17 00:00

AI产品护照:提升医疗AI透明度与可追溯性的标准化框架

本研究提出了“AI产品护照”框架,旨在通过基于生命周期的标准化文档,系统性提升医疗AI的透明度、可追溯性与合规性。该框架在AI4HF项目中开发,整合了欧盟AI法案等法规要求,设计了关系数据模型以捕获从研究定义到部署监控的全周期元数据。通过开源平台实现自动化溯源,生成机器与人类可读报告,并遵循FUTURE-AI原则确保公平性、可追溯性与可用性。

医疗人工智能透明度框架可追溯性ai合规开源平台生命周期管理
cs 12-17 00:00

Safe2Harm:利用语义同构攻击破解大语言模型安全防护

本文提出一种新型大语言模型越狱攻击方法Safe2Harm。研究发现,许多有害场景与合法场景在底层原理上高度一致。该方法通过四个步骤实现高效越狱:将有害问题重写为语义安全的同构问题,提取主题映射关系,让模型针对安全问题进行详细回答,最后根据映射关系反向重写得到有害输出。在7个主流模型和三类基准数据集上的实验表明,该方法具有较强的越狱能力,整体性能优于现有方法。

大语言模型安全越狱攻击语义同构对抗性攻击内容安全
cs 12-17 00:00

大语言模型训练中退火策略的缩放与可迁移性研究

本研究深入探讨了大语言模型训练中学习率退火策略的动态特性及其可迁移性。研究改进了Warmup-Steady-Decay调度器下的通用预测框架,通过整合训练步数、最大学习率和退火行为,实现了学习率调度的高效优化。实验表明,最优退火比率在不同训练配置间遵循一致模式,小模型可作为优化大模型训练动态的可靠代理,为免于繁琐超参数搜索而选择最优策略提供了实用指导。

大语言模型学习率调度退火策略训练优化超参数迁移模型缩放
cs 12-17 00:00

混合训练策略:解决数学推理微调中的灾难性遗忘问题

研究发现在对大型语言模型进行数学推理任务微调时,模型会出现灾难性遗忘,即数学能力提升的同时,原有的自然语言推理能力急剧下降。通过实验,研究者提出混合训练策略,在训练中交错使用数学和自然语言推理样本。结果表明,1:1的混合比例能在保持数学性能的同时,完全避免遗忘,将自然语言推理准确率维持在86.2%。该策略表明,专业化训练无需以牺牲通用能力为代价。

灾难性遗忘混合训练数学推理模型微调语言模型
cs 12-17 00:00

基于机器学习的物联网设备行为识别:通过流量分析实现智能监控

本研究提出一种基于机器学习(随机森林、多层感知机、K近邻)的网络流量分析方法,用于识别物联网设备类型及其行为。通过搭建包含多种智能设备的测试环境,实验表明该方法能有效分类设备,其中随机森林模型准确率达91%,但安全摄像头的部分行为识别仍存在挑战。

物联网安全机器学习流量分析设备识别随机森林
cs 12-17 00:00

机器学习模型利用环境数据预测RSV相关住院率

本研究开发了一个机器学习框架,通过整合废水监测、气象和空气质量数据,预测美国与呼吸道合胞病毒相关的住院率。研究发现,废水中的RSV水平是最强预测因子,其次是温度、臭氧浓度和比湿度等环境变量。分析还揭示了美国原住民和阿拉斯加原住民社区以及高海拔州的住院率显著更高。研究成果已集成至一个交互式R Shiny仪表板,以辅助公共卫生干预和资源分配。

机器学习呼吸道合胞病毒公共卫生预测环境数据健康公平废水监测
cs 12-17 00:00

LoopBench:用LLM群体发现分布式系统中的对称破缺策略

研究团队提出LoopBench基准,用于评估大语言模型在分布式对称破缺问题中的推理与协调能力。该基准聚焦于用有限颜色为奇数环图着色这一经典难题,其中非通信的确定性代理会陷入无限循环。通过引入策略传递机制作为一致性记忆,研究发现,尽管标准LLM和经典启发式算法难以应对,但具备高级推理能力的模型(如O3)能够设计出打破僵局的策略。LoopBench为研究基于语言推理的涌现式分布式算法提供了测试平台。

大语言模型分布式系统对称破缺集体智能算法涌现基准测试
cs 12-17 00:00

元分层强化学习框架提升O-RAN资源管理效率

本文提出一种自适应元分层强化学习框架,用于联合优化O-RAN中的资源分配与网络切片。该框架结合分层控制与元学习,高层控制器负责切片间资源分配,低层代理执行切片内调度,并通过基于时序差分误差方差的元更新机制提升稳定性。理论分析证明了两层学习过程的次线性收敛与遗憾界。仿真结果表明,相比基线方法,网络管理效率提升19.8%,在eMBB、URLLC和mMTC切片中实现了更快的适应性与更高的QoS满意度。

o-ran元分层强化学习资源管理网络切片自适应优化
cs 12-17 00:00

联邦小样本学习:在隐私约束下实现个性化癫痫发作检测

本研究提出了一种两阶段联邦小样本学习框架,用于解决临床实践中癫痫发作检测面临的数据稀缺、分布不均和隐私保护难题。第一阶段通过联邦学习在模拟的非独立同分布医院站点上微调预训练的BIOT模型,实现无需集中数据的共享表征学习。第二阶段仅使用每位患者的5个标记EEG片段进行个性化分类器适配,在保留发作特异性信息的同时利用跨站点知识。该方法在TUH事件语料库上验证,个性化模型平均平衡准确率达0.77,表明其在现实数据可用性和隐私约束下能有效支持患者自适应的癫痫检测。

联邦学习小样本学习癫痫检测脑电图隐私保护个性化医疗
cs 12-17 00:00

自适应择优框架:通过社会经济地位校正实现锚定公平的大学招生机制

本文提出自适应择优框架(AMF),旨在解决大学招生中择优与公平的结构性矛盾。该框架包含三个核心设计:以常规录取者最低分为基准的择优锚定架构、动态调整的录取阈值,以及基于行政数据验证的连续社会经济地位测量。基于PISA 2022韩国数据的实证分析表明,AMF能在不降低学术标准的前提下,识别出因社会经济劣势而被低估潜力的学生,实现小幅但精准的扩招。该框架为替代零和博弈的配额制、构建统一且多维的招生评估体系提供了模板。

教育公平招生政策社会经济地位择优录取算法设计实证评估
cs 12-17 00:00

大语言模型存在“我们vs他们”偏见,角色扮演会加剧群体对立

本研究基于社会认同理论,揭示了GPT-4.1、DeepSeek-3.1等多款主流大语言模型普遍存在“内群体偏好、外群体贬损”的偏见。研究发现,模型在默认状态下已习得此类社会关联,而角色扮演(如保守派/自由派人设)会系统性改变其评价与归属语言模式,加剧偏见。研究还提出了一种名为ION的微调优化方法,可将情感偏差降低最高69%,为未来LLM的偏见缓解提供了可行路径。

大语言模型偏见社会认同理论角色扮演影响偏见缓解群体对立模型伦理
cs 12-17 00:00

Adjudicator:基于知识图谱与多智能体辩论的标签噪声纠正系统

本文提出Adjudicator系统,旨在解决高价值工业应用中训练数据标签噪声问题。该系统采用神经符号方法,首先构建动态知识图谱统一项目上下文,然后驱动一个由多个专业大语言模型智能体组成的“委员会”进行辩论和投票,以判断标签有效性。在AlleNoise基准测试的1000项平衡子集上,该系统F1分数达到0.99,显著优于单LLM基线(0.48)和无知识图谱的委员会(0.59)。其核心优势在于通过知识图谱驱动的覆盖逻辑,实现了对复杂结构性错误的完美识别,为受严格监管的工业环境生成高质量“黄金数据集”提供了可解释的自动化验证方案。

标签噪声纠正知识图谱多智能体系统大语言模型数据质量神经符号ai
cs 12-17 00:00

VPIA:从稳态数据中重建复杂交互网络的变分物理信息方法

本文提出了一种变分物理信息拟设(VPIA)方法,用于仅从异构稳态数据中推断复杂动力系统的交互结构。该方法将动力学的稳态约束嵌入可微分的变分表示中,通过最小化物理导出的稳态残差来重建潜在的耦合关系,无需时间轨迹、导数估计或监督。结合残差采样和自然梯度优化,VPIA能够可扩展地学习大规模和高阶网络。实验表明,该方法能在强噪声下准确恢复有向、加权和多体结构,为仅能获取快照观测的复杂交互网络物理约束推断提供了一个统一且鲁棒的框架。

网络重构稳态数据变分方法物理信息复杂系统高阶耦合
cs 12-17 00:00

结合SAR与机器学习预测肯尼亚洪水易发区

本研究利用哨兵-1号合成孔径雷达(SAR)影像和环境水文数据,对肯尼亚尼安多河流域的洪水易发性进行建模。通过处理2024年5月洪水事件的SAR数据生成洪水清单,并结合坡度、高程、土地利用等六种环境因子,训练了逻辑回归、决策树、支持向量机和随机森林四种机器学习模型。评估结果显示,随机森林模型预测性能最佳(准确率0.762),其生成的易发性地图成功识别出维多利亚湖附近低洼的卡诺平原为最高风险区,与历史记录一致。该方法为数据稀缺地区的洪水风险制图与灾害防控提供了有效工具。

洪水预测合成孔径雷达机器学习随机森林灾害风险环境变量
cs 12-17 00:00

文档分类高效遗忘新方法:Hessian重分配实现类级别数据移除

本文提出Hessian重分配方法,用于文档分类模型的高效类级别遗忘学习。该方法通过两步实现:首先利用共轭梯度求解Hessian-向量系统,一次性减去目标类别所有训练数据的影响;其次通过Top-1分类强制执行决策空间保证,避免随机重分类。在标准文本基准测试中,该方法在保持接近完整重训练精度的同时,运行速度提升数个数量级,并能有效降低针对移除类别的成员推理攻击优势。

机器学习遗忘文档分类hessian方法类级别遗忘模型安全高效训练
cs 12-17 00:00

AI辅助标注管道:提升大语言模型稳定性的协同方法

针对大语言模型在关键行业应用中存在的不稳定、幻觉及性能波动问题,本研究提出了一种人机协同的AI辅助标注管道。该方法通过自动化弱监督与置信度标注,结合人工验证,系统性地识别、标记并修正模型输出中的不稳定模式。框架引入了语义一致性、事实正确性和逻辑连贯性等稳定性专项标注类别,旨在通过持续反馈循环校准模型,以可扩展的方式提升其鲁棒性与可靠性。

大语言模型模型稳定性人机协同自动化标注反馈循环鲁棒性增强
cs 12-17 00:00

ValuePilot:基于人类价值观的两阶段个性化决策框架

本文提出ValuePilot框架,旨在解决AI在现实应用中如何根据个人价值观进行个性化决策的挑战。该框架包含数据集生成工具包和决策模块两阶段:前者通过人机协作构建多样化的价值标注场景;后者学习基于个人价值偏好评估行动,实现情境敏感的个性化决策。在未见过的场景测试中,其决策模块在符合人类行为选择方面,表现优于GPT-5、Claude-Sonnet-4等主流大模型基线。研究表明,以价值驱动的决策是构建可解释、个性化AI代理的有效工程路径。

个性化决策价值驱动人机交互可解释ai大语言模型
AI速览助手