cs
12-24 00:00
本文针对开放无线接入网(O-RAN)中传统静态功能部署效率低下的问题,提出了一种动态服务功能链(SFC)配置与O-CU选择方法。研究将问题建模为马尔可夫决策过程,并设计了GRLDyP算法——一种结合图神经网络(GNN)与深度强化学习(DRL)的智能体。该智能体能够根据实时网络拓扑与资源(如CPU、带宽)状态,为每个服务流联合选择路由和O-CU位置(从候选站点中),在满足服务质量(QoS)约束的同时最小化网络能耗。基于蒙特利尔市24小时流量轨迹数据集的评估表明,相比静态映射基线,该方法能显著降低能耗且不违反QoS,为能源感知、资源自适应的O-RAN部署提供了可行的控制方案。
o-ran深度强化学习图神经网络服务功能链能耗优化服务质量
cs
12-24 00:00
本研究利用大语言模型(LLM)自动化检测和分类5G核心网故障。通过在基于Kubernetes的测试网络中注入多种故障(如Pod故障、网络延迟、丢包、磁盘I/O故障),并收集包括组件日志、系统描述、事件、RTT测试等在内的多源数据。研究团队在该数据集上通过API对GPT-4.1 nano模型进行微调,使其故障检测准确率相比基础模型有显著提升。结果表明,基于LLM的方法有望实现闭环、免人工干预的故障管理,从而提升网络可靠性并降低运营商因停机产生的运营成本。
5g核心网故障检测大语言模型网络可靠性自动化运维
cs
12-24 00:00
本文提出一个面向6G集成感知与通信(ISAC)的全息大规模MIMO框架。针对现有NOMA-ISAC研究的不足,该框架:1)建立了包含空间相关瑞利衰落、球面波前传播和亚波长天线耦合效应的统一近场信道模型;2)设计了速率分割增强型NOMA(RS-NOMA)架构,以灵活管理感知与通信间的干扰;3)开发了一套多目标优化方案,比较了HAO-SCA、WMMSE、SDR、FP及DRL等多种算法;4)通过5000次蒙特卡洛仿真与显著性检验进行统计验证。结果表明,在相同感知效用下,RS-NOMA相比传统NOMA和WMMSE分别实现了11.7%和18.8%的和速率提升,感知CRLB改善了2.4 dB,且统计置信度达99%。
全息mimonoma-isac近场通信速率分割多址多目标优化6g
cs
12-24 00:00
研究分析了arXiv上717篇标题包含“All You Need”的预印本(2009-2025),发现自2017年《Attention Is All You Need》发表后,此类标题呈指数增长($R^2 > 0.994$),仅2025年就有200篇。在遵循“X [Is] All You Need”结构的论文中,“Attention”仍是最常被宣称的“必需品”(出现28次)。研究从迷因理论出发,指出这种模式的流行反映了科学传播中竞争压力加剧,使得标题的“易记性”日益优先于“精确性”。
学术传播论文标题迷因文化机器学习transformer
cs
12-24 00:00
本研究提出了一种基于大语言模型(LLMs)的新框架,用于预测电子设计自动化(EDA)云任务的资源需求和生命周期。该方法通过文本到文本回归进行微调,并引入科学记数法和前缀填充来约束模型输出,显著提升了格式可靠性。研究发现,对滑动窗口注意力LLMs进行全注意力微调和推理,能有效提高预测精度。该框架在真实云数据集上验证了其有效性,为EDA领域的性能预测设立了新基准。
大语言模型电子设计自动化云任务预测资源调度文本回归
cs
12-24 00:00
本研究在脑肿瘤磁共振成像评估中,首次系统对比了两种人机协作范式:AI辅助放射科医生与放射科医生辅助AI。结果显示,双向协作不仅提升了放射科医生的诊断准确性和元认知能力,同样也显著增强了AI代理的性能。更重要的是,当AI代理获得人类专家支持时,患者获益最大。协同效应体现在准确性、元认知表现及评估者间一致性等多个维度,表明AI的价值并非取代人类,而是通过常规性地利用和放大人类智能,创造出更强大、更自信、更一致的临床决策代理。
人机协作脑肿瘤诊断医学影像ai元认知双向增强临床决策
cs
12-24 00:00
本文提出PHANTOM框架,利用变形艺术原理生成视角依赖的物理对抗样本,可欺骗自动驾驶视觉感知系统。该方法无需访问模型内部(黑盒攻击),在YOLOv5、SSD等四种主流检测器上均表现出强迁移性。CARLA仿真显示,在最优条件下攻击成功率超90%,恶劣环境下仍保持60-80%有效性,且攻击在目标6-10米内才被激活,留给车辆的应急时间不足。SUMO-OMNeT++联合仿真进一步表明,攻击可通过V2X通信传播虚假紧急信息,使信息峰值年龄增加68-89%,危及整个CAV系统的安全通信。
自动驾驶安全物理对抗攻击变形艺术黑盒攻击v2x通信目标检测
cs
12-24 00:00
本研究系统探索了可穿戴设备人体活动识别(HAR)中标注依赖与性能的权衡。通过比较全监督、无监督、弱监督、多任务学习及自监督方法,提出了一种结合领域知识与少量标注数据的弱自监督学习框架。实验表明,该框架仅使用10%的标注数据即可达到与全监督方法相当的性能,多任务学习通过任务间知识共享进一步提升了效果。这为标注数据有限的现实应用提供了高效解决方案。
可穿戴计算活动识别弱监督学习自监督学习多任务学习标注效率
cs
12-24 00:00
本研究开发并验证了一个多模态深度学习模型,用于预测危重患者入住ICU后24小时内的院内死亡风险。模型整合了时间不变变量、时间序列变量、临床文本笔记和胸部X光图像等多源数据。在包含超过20万次ICU入院记录、覆盖200多家医院(2001-2022年)的数据集上进行训练和外部验证。结果显示,整合结构化数据的模型AUROC达0.92。在仅包含有笔记和影像数据的患者子集中,加入多模态信息后,模型性能(AUROC)从0.87提升至0.89。研究强调了整合多源患者信息进行死亡率预测的重要性以及外部验证的关键作用。
人工智能死亡率预测多模态学习重症监护临床决策支持外部验证
cs
12-24 00:00
本文提出了一种实用的推理时搜索框架——逆因果聚焦算法(ICFA),用于在大规模候选空间中高效寻找稀有但有用的解。ICFA将搜索视为目标条件重加权过程,复用已有的提议采样器和任务相似度函数,形成聚焦采样分布,并通过自适应控制聚焦强度避免退化。研究提供了清晰的实施方法、基于有效样本量的稳定性诊断、理论分析,并在约束语言生成和稀疏奖励导航任务中验证了其有效性。此外,文章揭示了结构化提示如何近似实现语言层面的ICFA,并提出了结合提示推理与算法重加权的混合架构。
推理时搜索目标条件采样聚焦采样语言生成强化学习提示工程
cs
12-24 00:00
本文提出了一种新颖的深度学习架构——多尺度双路径特征聚合网络(MDFA-Net),用于锂离子电池的剩余使用寿命(RUL)预测。该网络包含两条路径:第一条多尺度特征网络(MF-Net)保留序列的浅层信息,防止信息丢失;第二条编码器网络(EC-Net)捕捉序列的连续变化趋势,保留深层细节。通过有效整合深浅层特征,模型能同时把握电池退化序列的局部与全局关联模式。在两个公开锂离子电池数据集上的测试表明,该方法在RUL预测精度上超越了现有先进方法,能更准确地映射容量退化轨迹。
剩余寿命预测锂离子电池深度学习多尺度特征双路径网络退化建模
cs
12-24 00:00
本文提出了一种符号感知的多态Jaccard/Tanimoto框架,将基于重叠度的距离度量从非负向量推广到任意实值与复值信号,同时保留了有界度量与正定核结构。其核心是将信号表示为带符号状态空间上的原子测度,通过广义Jaccard重叠度定义相似性。对于实信号采用正负拆分,对于复信号采用笛卡尔与极坐标分解,将信号嵌入到非负多态表示中。由此产生的 $[0,1]$ 距离族满足三角不等式,并定义了可直接用于核方法与图学习的正定核。此外,通过Möbius反演进行联盟分析,可将信号幅度分解为非负、可加的贡献,实现跨信号联盟的精确预算闭合。该框架在一个统一的符号感知体系下,同时提供了有界度量、正定核、概率语义和透明的预算核算,适用于科学和金融应用中的相关图、特征工程和相似性图构建。
jaccard核符号感知复值信号度量学习正定核信号分解
cs
12-24 00:00
本文提出了一种用于强化学习的拆分策略架构,以解决视觉策略在资源受限的边缘设备上部署的挑战。该架构的核心是一个在设备端运行的小型编码器(通过OpenGL片段着色器实现),它将高维观测数据压缩为紧凑的特征张量,再传输至远程策略头进行决策。这种方法显著减少了数据传输量,在带宽受限环境下降低了决策延迟,同时减少了服务器端的计算开销。在NVIDIA Jetson Nano、Raspberry Pi等设备上的评估表明,该方法在保持与基准方法可比的学习性能(最终100回合平均回报)的同时,实现了更低的端到端决策延迟和更好的可扩展性。相关代码已开源。
强化学习边缘计算模型部署低延迟视觉策略嵌入式gpu
cs
12-24 00:00
本文提出FlowFM模型,通过联合训练表征编码器与条件流匹配生成器,解决了扩散模型在自监督学习中生成质量与判别性能的权衡问题。模型利用流匹配学习更简单的速度场,加速并稳定了训练过程。在可穿戴传感器数据上的实验表明,FlowFM相比基于扩散的方法训练时间减少50.4%,在下游任务中超越现有最优方法,推理速度提升最高达51.0倍,同时保持高生成质量。
自监督学习流匹配生成模型表征学习高效推理可穿戴数据
cs
12-24 00:00
本文提出ArcGen,一种新颖的黑盒神经网络后门检测方法,旨在解决现有基于学习的检测方法在遇到训练阶段未见过的模型架构时泛化能力不足的问题。其核心创新在于引入一个对齐层来处理模型输出特征,并设计了两种对齐损失函数,要求具有相似后门行为但不同架构的模型在分布和样本层面实现特征对齐,从而获得架构不变的特征。在大规模评估中,该方法在未见架构上的检测性能(如AUC)提升高达42.5%。
后门检测模型安全特征对齐黑盒检测神经网络泛化能力
cs
12-24 00:00
本文提出了一种名为Double-Win NAS的新型神经网络架构搜索范式,旨在解决嵌入式智能系统中深度网络精度高但硬件效率低、浅层网络效率高但精度不足的矛盾。该方法首先自动搜索获得高精度的深度网络,然后将其等价转换为具有相同功能的浅层网络,从而在保持精度的同时大幅提升硬件效率。此外,研究还引入了混合可转换训练和任意分辨率弹性训练两种增强技术,以优化训练精度并实现网络在不同输入分辨率下的自然弹性。在NVIDIA Jetson AGX Xavier/Nano平台及ImageNet等数据集上的实验表明,该方法优于现有先进NAS方案。
神经网络架构搜索嵌入式系统模型压缩硬件效率深度学习
cs
12-24 00:00
本研究揭示了商业VPN在IPv6处理上的两大“粗糙边缘”。首先,许多仅支持IPv4的VPN会泄露用户的IPv6流量至ISP,导致用户原生IPv6地址暴露,损害隐私。通过对12.9万VPN用户的真实数据分析,发现12款此前被认为安全的VPN仍有至少5%的用户存在泄露。其次,大多数双栈VPN用户实际选择了IPv4而非IPv6,根源在于VPN分配的IPv6地址在标准地址选择规则中常被降级。研究提出解决方案:定义新的VPN专用IPv6地址范围以避免降级,并在Linux上实现原型。
vpn安全ipv6泄露隐私保护网络协议地址选择
cs
12-24 00:00
本文介绍了Synthetic Data Blueprint (SDB),一个基于Python的模块化库,旨在对合成表格数据的保真度进行定量和可视化评估。SDB支持自动特征类型检测、分布与依赖关系保真度度量、基于图与嵌入的结构保持评分,以及丰富的数据可视化方案。通过在医疗诊断、社会经济金融建模、网络安全分析三个差异显著的现实用例中进行验证,SDB展示了其在处理混合类型临床变量、高基数分类属性及高维遥测信号等多样化数据保真度评估挑战时的鲁棒性与领域无关的适用性,为跨领域提供了一致、透明且可复现的基准测试工具。
合成数据数据评估保真度度量模块化框架表格数据python库
cs
12-24 00:00
本文提出了一种用于高效部署任务专用大语言模型(LLM)变体的压缩方法。针对微调后权重与基础模型权重差异较小且具有结构性的特点,该方法将权重增量(delta)表示为仅存储符号位的1比特数据,并结合轻量级的每轴(行/列)FP16缩放因子。缩放因子通过少量校准数据学习得到,在保持1比特增量紧凑性的同时,更准确地捕捉了不同权重维度间的变化,从而相比标量缩放方案提升了重构质量。从系统角度看,该方法通过为每个模块单次传输打包的增量数据,显著降低了冷启动延迟和存储开销,其存储产物比完整的FP16检查点小数倍。该方法即插即用,仅需极少量校准数据,并通过避免密集重构保持了推理效率。
模型压缩权重增量1比特量化高效部署冷启动优化大语言模型
cs
12-24 00:00
本研究提出了一种根据节点特定成本函数不对称性调整预测的方法。该模型通过将成本不对称性动态纳入预测误差的概率分布,以偏向成本最低的情景,从而实现节约。模型计算节约金额,并利用一个自我调节机制,根据观察到的节约情况来调整修正幅度,使其能够适应特定站点的条件以及未建模因素(如校准误差或宏观经济动态变化)。实证结果表明,该模型能够实现每年510万美元的成本节约。
需求预测成本优化动态调整反馈机制金融科技
cs
12-24 00:00
本文提出了一种新颖的端到端框架,将数据质量评估与机器学习模型操作在实时生产环境中高效集成。该框架通过结合动态漂移检测、自适应数据质量指标和MLOps,弥补了理论方法与实际应用之间的关键差距。在钢铁公司电渣重熔真空泵送过程中的验证表明,模型性能提升12%(R² = 94%),预测延迟降低四倍。研究探讨了数据质量可接受阈值的影响,为工业应用中平衡数据质量标准与预测性能提供了可行见解。
数据质量mlops实时决策工业应用漂移检测生产环境
cs
12-24 00:00
本文探讨了在持续学习场景中集成分布外检测的关键挑战。现实世界的数据流不断变化,传统基于独立同分布假设的模型难以应对部署后出现的新情况。研究指出,将持续学习与分布外检测相结合,对于开发能够增量学习、识别异常输入并保持过去知识的鲁棒、自适应AI系统至关重要。这为解决模型在动态环境中可靠运行的问题提供了设计原则和评估基准。
持续学习分布外检测机器学习自适应系统基准测试
cs
12-24 00:00
本研究针对航天技术预测的复杂性,开发了一种结合长短期记忆(LSTM)神经网络与改进摩尔定律的混合模型,用于预测航天器运行寿命。模型创新性地应用了启动时间-结束时间集成(STETI)方法,有效解决了因右删失数据导致的寿命估计偏差问题,即近期发射的航天器因仍在轨运行而无法提供完整寿命数据,从而扭曲寿命-发射日期曲线。该研究为航天任务规划与政策制定提供了定量分析工具。
技术预测lstm神经网络航天器寿命steti方法趋势外推机器学习
cs
12-24 00:00
本文提出了一种轻量级后训练流程,旨在解决大语言模型在数学推理中常犯的结构性错误。该方法首先在CoT数据上进行监督微调,然后引入一个紧凑的MathVerifier,将候选解分解为六维错误特征,并聚合为可解释的错误分数和荒谬分数。这些验证器信号用于挖掘“接近正确但存在结构性缺陷”的硬负样本,并为偏好对定义重要性权重。最后,通过验证器引导的加权公式将其整合到离线直接偏好优化目标中。在1.5B参数的Qwen2.5模型上的实验表明,该方法比普通SFT和未加权的DPO带来了更有针对性的改进,特别是在那些解在数值上接近正确但逻辑不一致的问题上,同时避免了训练大型奖励模型或依赖外部评判的开销。
数学推理直接偏好优化硬负样本后训练小语言模型验证器