今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2026-01-07 01-07 15:36

今日计算机科学领域研究聚焦于人工智能与推荐系统的深度融合、具身智能的社会化发展,以及AI治理与可靠性的前沿挑战,呈现出从技术优化迈向人机协同与可信可控的鲜明趋势。

  • 推荐系统迈向可解释与可信赖:研究通过引入“推理优先”的LLM策略、利用文本作为跨域语义桥梁,以及结合SHAP与LLM生成用户友好解释,系统性地提升推荐系统的透明度、可迁移性与用户信任度。
  • AI生成内容的影响与平台治理策略凸显:研究表明AI生成评论与人类评论存在文本差异,影响推荐模型性能,而平台通过策略性框架(如调整评论语气)可有效引导生成效果;同时,为网页代理设计权限清单的提案,标志着对AI行为进行主动、精细化治理的开端。
  • 具身智能关注社会接受度与安全心智建模:调查显示公众对赛博格的能力增强功能接受度存在显著差异,多语言与学习功能最受欢迎;与之呼应,研究综述强调需为具身AI建立“心智世界”模型以理解社会交互,并系统梳理了LLM控制机器人面临的安全威胁与防御路径。
  • 大语言模型的科学评估与可靠性遭遇严峻审视:研究指出当前LLM在战略研究评估中存在因提示词、抽样等因素导致的输出不稳定性,并揭示了其在科学发现声称上面临的“可证伪性鸿沟”,凸显了建立标准化评估协议与提升研究透明度的紧迫性。
  • 算法公平性与合规性成为关键应用考量:研究不仅探讨了通过算法最小化用户不便来实现数字支付市场的公平流量分配,还从伊斯兰教法视角系统评估了多种电商模式的合规性,体现了技术部署中对社会价值与地域文化规范的深入思考。
  • 边缘计算与网络优化聚焦效率与安全:研究提出了无需改造现有设施的轻量级物联网安全网关架构,以及利用NOMA网络副产品优化5G/6G切换决策的Transformer模型,致力于在资源受限环境下实现高效可靠的连接与防护。

2026-01-07 速览 · 计算机科学

2026-01-07 共 24 条抓取,按综合热度排序

← 返回日历
cs 01-07 00:00

AI生成评论如何影响推荐系统:文本差异、性能变化与平台控制策略

本研究探讨了AI生成评论对基于内容的推荐系统的影响。通过分析TripAdvisor酒店评论数据,发现AI生成评论在多个文本维度上与人类评论存在系统性差异。实验表明,使用人类评论训练的模型性能最优,且能稳健地泛化到AI内容;而使用AI评论训练的模型在两类内容上均表现不佳。研究还发现,基于语气(鼓励性、建设性或批判性)的框架策略能显著提升平台生成评论的效果,凸显了平台在控制AI评论生成与整合中的战略重要性。

推荐系统ai生成内容文本分析平台策略人机交互
cs 01-07 00:00

赛博格化身能力增强的社会接受度调查:多语言与学习功能最受欢迎

本研究通过一项在迪拜进行的大规模调查(n=1001),探讨了公众对机器人及虚拟化身作为能力增强工具的接受度。调查覆盖身份探索、健康与行为转变、旅行能力扩展、感官与身体能力扩展、认知增强及意识永生六大领域共16个场景。结果显示,支持率最高的场景是多语言沟通(77.5%)和学习能力增强(68.7%),其次是辅助行动不便者(64.5%)与行为转变(59.5%)。而涉及通过意识转移实现永生的场景支持率最低(34.9%)。该研究为负责任地设计、开发并整合赛博格化身提供了实践指导,旨在促进其社会接受度与和谐共存。

人机交互能力增强社会接受度化身技术问卷调查
cs 01-07 00:00

LLM-Rec:通过推理优先策略构建可信推荐系统

本研究提出了一种基于大语言模型(LLM)的推荐系统(LLM-Rec),旨在解决传统推荐系统过度追求准确性而忽视透明度与可信度的问题。该方法采用“推理优先”的指令微调策略,即模型在输出推荐物品前,先生成逻辑连贯的推理依据(采用思维链风格)。通过在亚马逊评论数据集(时尚与科学领域)上的实验表明,该方法不仅增强了推荐的可解释性,也显著提升了推荐性能。为促进可复现性,研究团队公开了包含用户历史、推理与推荐物品的数据集。

可信推荐大语言模型可解释ai推理生成推荐系统
cs 01-07 00:00

FUSE:多模态搜索推荐中的故障感知子代理证据利用框架

本文提出FUSE框架,旨在解决多模态创意助手中检索任务面临的意图理解、内容选择、召回与排序等多阶段潜在故障问题。核心创新在于用紧凑的“接地设计表示”(GDR)替代大部分原始图像提示,并系统评估了七种上下文预算策略。实验表明,上下文压缩策略在788个查询上实现了最优性能:意图准确率93.3%,路由成功率86.8%,召回率99.4%,NDCG@5达88.5%。该研究证明了策略性的上下文摘要优于全面或极简的上下文处理方法。

多模态检索故障感知上下文压缩智能体系统搜索推荐
cs 01-07 00:00

TextBridgeGNN:通过文本引导实现跨域推荐的图神经网络预训练框架

本文提出TextBridgeGNN,一种解决图推荐模型跨域迁移难题的预训练与微调框架。传统基于ID嵌入的图推荐模型因ID空间隔离和异构图结构不兼容而难以迁移。该框架以文本为语义桥梁,通过多级图传播连接不同领域:预训练阶段利用文本信息打破数据孤岛,分层GNN学习领域特定与全局知识;微调阶段提出相似性迁移机制,从语义相关节点初始化目标域ID嵌入,成功迁移图模式。实验表明,该方法在跨域、多域及免训练场景下均优于现有方法,有效融合了预训练语言模型的语义与图协同过滤,且无需昂贵的语言模型微调或实时推理开销。

跨域推荐图神经网络预训练模型文本语义协同过滤知识迁移
cs 01-07 00:00

跨平台数字话语分析:以色列-哈马斯冲突中的情感、主题与事件动态

本研究对Telegram、Twitter/X和Reddit三大平台在2023年10月至2025年中期的冲突相关讨论进行了大规模分析。通过整合潜在狄利克雷分配(LDA)、BERTopic主题建模以及基于Transformer的情感与情绪模型,揭示了不同数字领域叙事的生产、放大与对抗机制。研究发现,Telegram提供高强度、未经过滤的事件记录,Twitter/X将叙事框架放大至全球受众,而Reddit则承载了更具反思性的审议讨论。研究贡献包括一个多平台、符合FAIR原则的数据集,一个结合主题建模、情感分析和垃圾信息过滤的综合分析流程,以及对平台特性如何塑造数字冲突传播演变的实证洞察。

数字话语分析跨平台研究主题建模情感分析社交媒体冲突传播
cs 01-07 00:00

DSMOE:基于蒸馏的场景自适应专家混合模型提升多场景推荐匹配效果

针对多场景推荐匹配阶段中,传统MMoE模型因独立双塔架构的盲目优化和头部场景参数主导而受限的问题,本文提出DSMOE模型。该模型设计了场景自适应投影模块,生成轻量级、场景特定的参数,有效防止长尾场景中的专家崩溃;同时引入跨架构知识蒸馏框架,利用交互感知的教师模型指导双塔学生模型学习复杂匹配模式。真实数据集实验表明,DSMOE显著提升了数据稀疏、代表性不足场景的检索质量。

多场景推荐专家混合模型知识蒸馏匹配阶段长尾场景双塔架构
cs 01-07 00:00

数字支付公平分配:通过最小化用户不便实现交易流量再平衡

针对印度数字支付市场因PhonePe和Google Pay双头垄断引发的监管担忧,本文研究了如何将用户交易重新分配到不同UPI应用中,以强制执行单一应用交易量不超过30%的上限。该问题被形式化为二分网络上的最小边激活流问题,目标是满足应用容量限制的同时,最小化需要用户安装新应用的数量。作者证明了该问题是NP完全的,并提出了一种名为解耦两阶段分配策略的可扩展启发式算法。实验表明,该算法能在数秒内找到接近最优整数线性规划解的结果,为公平高效地执行交易上限提供了实用方案。

数字支付公平分配np完全问题启发式算法监管合规交易网络
cs 01-07 00:00

战略研究中LLM评估的可靠性挑战与标准化协议

本文系统分析了大型语言模型(LLM)作为评估工具在战略研究中的可靠性问题。研究发现,LLM评估输出存在显著不稳定性,主要源于提示词措辞、上下文、抽样程序、提取方法及模型间差异等多重因素。这种不稳定性会损害基于LLM评估的研究推断的有效性。为此,作者开发了一套全面的、方差感知的、规范化的且可审计的协议,为LLM在商业文本语料库评估中的应用提供了从临时性工具到严谨、可操作、可审计的标准化测量方法的实践指导。

大型语言模型战略研究评估可靠性测量方法标准化协议文本分析
cs 01-07 00:00

为AI网页代理引入权限清单:agent-permissions.json框架

随着基于大语言模型的网页代理日益普及,其复杂的交互方式(如导航界面、提取信息、完成任务)超出了传统robots.txt等治理机制的管控范围。为解决网站所有者与代理之间的协调难题,本文提出了agent-permissions.json——一种轻量级的JSON格式权限清单。网站可通过该文件明确允许的交互行为,并辅以API参考。这一框架为双方提供了低摩擦的协调机制:网站仅需编写简单清单,代理则可自动解析并遵守规定。它延续了robots.txt的精神,旨在建立合规框架,在尊重网站偏好的同时,促进有益的自动化应用(如电商服务、无障碍工具),而非全面封禁代理。

网页代理权限管理人机协调自动化治理json清单
cs 01-07 00:00

LeafTutor:基于大语言模型的编程作业辅导AI助手

针对STEM课程高入学率带来的师资短缺问题,本研究开发了基于大语言模型(LLMs)的AI辅导代理LeafTutor。该系统旨在为学生提供可扩展的、个性化的编程作业分步指导。通过在真实编程任务上的评估,结果表明LeafTutor能够提供与人类导师相当的分步编程指导。这项工作展示了LLM驱动的辅导解决方案在增强和个性化STEM教育学习方面的潜力。

ai教育编程辅导大语言模型stem教育个性化学习
cs 01-07 00:00

机器人运动基元技术综述:从示教学习到复杂任务生成

本文对机器人学中的运动基元技术进行了百科全书式的综述。运动基元作为从生物系统启发的运动基本单元,是机器人通过人类示教学习并生成复杂控制轨迹的关键方法。文章按时间顺序系统回顾了主要框架,包括具有弹簧-阻尼系统解析特性的模型、基于概率耦合的多示教融合方法,以及面向高维系统的神经网络应用等,并分析了各自的优势与局限。同时,综述还探讨了运动基元在抓取、投掷等具体任务中的成功应用,并指出了该领域面临的开放性问题与实际挑战。

运动基元机器人学习示教学习轨迹生成运动控制综述
cs 01-07 00:00

大语言模型的科学验证困境:可证伪性鸿沟与透明度挑战

本文指出,当前关于大语言模型(LLMs)具备科学发现或人类水平通用智能的论断,因不满足波普尔的可证伪性原则而缺乏科学严谨性。作者揭示了该领域研究方法上的多个陷阱:因训练数据不透明且不可搜索而无法验证发现的“新颖性”;模型持续更新导致结果“不可复现”;以及缺乏人机交互记录和失败案例数据,造成选择偏差并可能夸大模型能力。为此,文章提出了旨在提升LLM推理研究科学透明度与可复现性的指导原则。

大语言模型可证伪性科学方法研究透明度可复现性评估偏差
cs 01-07 00:00

面向O-RAN的上下文RAG框架:提升5G/6G网络标准文档问答准确性

本文提出了一种面向开放无线接入网(O-RAN)的上下文检索增强生成框架,旨在解决5G/6G网络中快速演进的复杂技术文档带来的知识获取难题。该框架采用候选答案引导文档检索的策略,为大型语言模型提供更具针对性的上下文,从而提升问答准确性。在ORANBenchmark-13K数据集上的评估表明,相比传统RAG和基础提示方法,上下文RAG在保持运行效率和碳排放竞争力的同时,能显著提高模型性能,为动态技术领域的知识发现提供了可扩展的解决方案。

检索增强生成o-ran5g/6g网络大型语言模型上下文检索技术文档问答
cs 01-07 00:00

融合混合情感分析与强化学习的新闻推荐系统研究

本研究针对传统新闻推荐系统在情感分析上面临的歧义性、词典不一致及上下文理解不足等问题,提出了一种自适应、情感感知的推荐框架。该框架将混合情感分析(结合VADER、AFINN、TextBlob和SentiWordNet)与强化学习(Q-learning)相结合,利用BBC新闻数据集生成稳健的文章级情感估计(积极、消极、中性),并将情感状态嵌入Q-learning架构中,以指导智能体学习最优推荐策略。结果表明,该方法能有效识别并推荐情感匹配的文章,并通过迭代更新持续提升个性化水平,为用户提供了一种可行、可解释且自适应的新闻推荐方案。

情感分析强化学习新闻推荐个性化q-learning混合模型
cs 01-07 00:00

Deep-SIC:基于Transformer的NOMA网络信道预测与切换优化

本文提出Deep-SIC,一种基于知识的信道预测模型,用于优化5G及下一代移动自组织网络中的切换决策。该模型创新性地利用非正交多址接入(NOMA)中连续干扰消除(SIC)的副产品——部分解码数据(PDD)作为反馈信号,持续改进预测。Deep-SIC采用Transformer架构,学习速度比现有先进算法(如Graph-NOMA)快68%,并在用户移动性(如车速60 km/h)下提供可验证的稳定性保证。系统级仿真表明,该策略可将切换失败率降低高达40%,有效抑制乒乓效应,并在低信噪比(SNR)场景下将归一化均方根误差(NRMSE)降低20%,同时保持$O(K)$的线性计算复杂度。

信道估计noma网络深度学习移动性管理transformer切换优化
cs 01-07 00:00

基于SHAP与LLM的食品推荐系统可解释性增强方法

本文提出了一种面向普通用户的食品推荐系统可解释性增强方法。该方法采用后处理范式,结合SHAP(Shapley Additive exPlanations)进行混合特征重要性提取,并利用大型语言模型(LLM)对提取的关键变量进行动态、全面的解释生成。相比现有方法,该方法能为非专业用户提供更令人信服、更易于理解的推荐结果解释,从而有效提升用户对推荐系统的信任度和系统透明度。

可解释人工智能推荐系统大型语言模型特征重要性用户信任食品推荐
cs 01-07 00:00

面向Wi-Fi物联网的安全边缘网关架构:无需改造基础设施的本地防护方案

本文提出了一种面向Wi-Fi物联网的安全边缘网关架构,旨在不改变现有网络基础设施的前提下增强本地网络防护。该网关作为Wi-Fi接入点与核心网络之间的中间控制点,通过监控流量、隔离不可信设备以及阻止欺骗、断连和未授权访问等常见无线攻击来提升安全性。设计侧重于自适应流量过滤与轻量级策略执行,而非复杂的分析模型,适用于中型网络环境。在部署了约70台设备(含28个物联网单元)的真实办公室环境中,持续运行十天的测试表明:与WPA3基线配置相比,该系统将成功欺骗事件减少了87%,断连后的恢复时间提升了42%,而网络延迟仅增加3.1%,吞吐量下降不足4%。

物联网安全边缘网关wi-fi防护流量监控轻量级策略
cs 01-07 00:00

LLM控制机器人安全调查:威胁、防御与挑战

本文系统性地综述了大型语言模型(LLM)与机器人结合所带来的新兴安全威胁与防御策略。研究指出,LLM的抽象推理与机器人物理、情境依赖特性之间的“具身鸿沟”是关键安全漏洞来源。攻击向量包括越狱、后门攻击和多模态提示注入等;防御机制则涵盖形式化安全规范、运行时监控、多LLM监督和提示强化。文章强调了开发情境感知安全解决方案的紧迫性,并为构建安全可靠的LLM控制机器人系统提供了路线图。

机器人安全大型语言模型具身智能安全威胁防御机制多模态攻击
cs 01-07 00:00

具身AI的“心智世界”建模:理论框架、推理范式与评估基准综述

本文针对具身智能体(Embodied AI Agents)在社交交互理解中的核心挑战,系统综述了心智世界模型(MWM)的研究进展。传统物理世界模型(PWM)难以刻画社会智能,而MWM作为对人类内部心智状态的结构化表征,是实现自然人机协作与动态社会适应的关键认知基础。本文首次构建了完整的MWM理论框架,厘清了其与PWM的本质区别;通过两种心智要素表征范式系统定义了MWM的关键组成部分;全面分析了两种核心心智理论(ToM)推理范式下的19种方法;并梳理了神经符号混合架构的融合趋势,综合了26个ToM评估基准。该工作旨在推动具身智能体融入人类社会,促进人机协同交互的深入发展。

具身人工智能心智世界模型心智理论人机协作社会智能神经符号ai
cs 01-07 00:00

TAG-HGT:低成本高精度学术推荐框架,推理速度提升45万倍

针对学术平台中新学者(冷启动)的实时推荐难题,本研究提出TAG-HGT框架。该框架采用“语义优先、结构优化”的解耦范式:利用冻结大语言模型(DeepSeek-V3)离线生成语义知识,并通过跨视图对比学习将其蒸馏至轻量级异构图变换器(HGT)中。关键洞见在于,LLM语义提供全局召回,而图结构信号则在密集嵌入空间中提供关键的局部判别力,以区分有效合作者与语义相似但社交不可达的学者。在OpenAlex数据集上的验证表明,TAG-HGT实现了91.97%的召回率,较纯结构基线提升20.7%。其最大工业价值在于,推理延迟从780秒降至1.73毫秒(提升$4.5 \times 10^{5}$倍),单次千次查询成本从约1.5美元降至不足0.001美元,成本降低99.9%。

冷启动推荐图神经网络知识蒸馏大语言模型学术平台工业部署
cs 01-07 00:00

AI治理峰会系列的未来:从布莱切利到巴黎的演进与挑战

本政策备忘录分析了始于2023年布莱切利公园、延续至2024年首尔和2025年巴黎的国际AI治理峰会系列。报告评估了该系列早期成功的支撑因素,并剖析了其在治理范围、参与方、连续性和机构设计方面面临的挑战。通过与国际现有治理模式比较,报告对主办安排、秘书处形式、参与者遴选、议程设置及会议频率等选项进行了评估,旨在为保持峰会聚焦于先进AI治理,同时兼顾包容性、有效性与长期可持续性提供设计建议。

人工智能治理国际峰会政策设计可持续性国际合作
cs 01-07 00:00

伊斯兰电子商务合规性研究:数字平台交易在教法框架下的有效性分析

本研究通过文献综述与教法学方法,评估了六种主流电商模式(如代发货、先买后付、算法营销等)是否符合伊斯兰教法原则。研究发现,直接销售合同下的代发货和预售因缺乏“占有”要素和存在不确定性而无效,但可通过重构为代理或预购合同合规。传统先买后付因含利息被判定不合规,误导性展示与无效清真认证构成欺诈,而诱导消费的算法营销则违背保护财产与理智的教法宗旨。研究强调需对合同合法性、算法伦理及界面设计进行全面教法审计。

伊斯兰金融电子商务教法合规算法伦理合同重构清真认证
cs 01-07 00:00

GCRank:面向外卖广告排序的生成式上下文理解框架

本研究提出了一种名为GCRank的新型生成式排序框架,将排序任务重构为上下文理解问题。该框架通过统一的架构建模外卖场景中复杂的动态空间、时间和个体信号。其核心包含生成式上下文编码器(GCE)和生成式上下文融合(GCF)两大组件。GCE通过个性化、群体和动态三个增强模块分别捕获用户、群体和实时情境信息,GCF则利用低秩自适应技术无缝融合这些表征。在大规模外卖广告平台上的实验与部署表明,该方法在点击率和平台收入等关键业务指标上取得了显著提升。

生成式推荐广告排序上下文理解外卖平台低秩自适应
AI速览助手