今日速览 · AI 导读

24 小时跨学科精选

自动抓取 arXiv 多学科 RSS,DeepSeek 自动润色标题与摘要,最快 24 小时内汇总。每日 14:00 初始化批次并每 15 分钟轮询学科,24h 无数据则回退 72h/7 天;arXiv 周末停更时自动跳过。

AI 导读

计算机科学

2026-01-12 01-12 15:41

今日计算机科学领域聚焦于提升AI系统的知识整合、检索与推理效率,核心趋势是构建更精准、高效且可解释的智能应用框架。

  • SP-Rank数据集:提出了首个融合一阶偏好与二阶预测的大规模排序评测数据集,研究表明结合二阶信号能显著提升排序恢复与行为建模的准确性,为复杂偏好建模提供了新基准。
  • TagRAG框架:通过标签引导的层次知识图谱改进RAG,在跨领域任务中实现高胜率,核心创新在于用结构化标签链提升全局推理效率与可扩展性。
  • RAG评估新指标:提出影响力分数(IS),首次能量化单个检索文档对生成结果的具体贡献,增强了RAG系统的可解释性与恶意内容检测能力。
  • 跨文档主题对齐分块:解决RAG中的知识碎片化问题,通过语料库层面的主题对齐与合成,显著提升多跳推理任务的忠实度与引用准确性。
  • LiveVectorLake架构:设计支持实时向量更新与时间检索的双层知识库,通过内容寻址与冷热存储分离,平衡了知识更新速度与查询延迟的矛盾。
  • 免模拟PSRO方法:通过动态窗口与纳什聚类消除博弈模拟瓶颈,显著降低了计算成本,为高效求解近似纳什均衡提供了新思路。

2026-01-12 速览 · 计算机科学

2026-01-12 共 22 条抓取,按综合热度排序

← 返回日历
cs 01-12 00:00

SP-Rank:首个融合一阶偏好与二阶预测的大规模排序数据集

本文提出了首个大规模公开数据集 SP-Rank,用于评测融合一阶偏好(个人投票)与二阶预测(对他人投票的预测)的排序算法。该数据集包含超过 12,000 个人工生成的数据点,涵盖地理、电影和绘画三个领域,并包含九种不同子集规模的收集格式。研究通过基准测试对比了仅使用一阶投票的传统方法与同时推理两种信号的 SP-Voting 方法。结果表明,结合二阶信号能显著提升在完整排序恢复、子集排序恢复及投票者行为概率建模等核心任务上的准确性。该数据集支持从嘈杂群体中提取专家知识、学习排序及基于偏好的奖励模型训练等下游应用。

排序数据集偏好聚合二阶预测社会选择人机对齐基准评测
cs 01-12 00:00

TagRAG:基于标签引导的层次知识图谱检索增强生成框架

本文提出TagRAG,一种创新的标签引导层次知识图谱RAG框架,旨在解决传统片段检索和GraphRAG在全局推理、效率及可扩展性方面的不足。其核心包括:1) 从文档中提取对象标签及其关系,构建层次化领域标签链以结构化表示知识;2) 在推理时检索以领域为中心的标签链,定位并综合相关知识。实验表明,在农业、计算机科学、法律等跨领域数据集上,TagRAG平均胜率达95.41%,同时在构建和检索效率上分别比GraphRAG提升约14.6倍和1.9倍,显著适配更小规模的语言模型并支持高效知识增量更新。

检索增强生成知识图谱标签引导层次检索全局推理高效构建
cs 01-12 00:00

CourtNav:法庭语音导航系统,快速定位法律文档关键段落

针对法官在庭审中需快速查阅动辄数百页法律文档的痛点,研究团队开发了CourtNav系统。该系统通过语音指令(如“跳转到第23段”),结合基于语法规则和少量示例的大语言模型路由分类器,以及感知文档布局的混合索引检索技术,能在10-15秒内精准定位并高亮显示目标段落,将查找时间从手动操作的3-5分钟大幅缩短。系统设计仅展示文档原文,确保证据的可验证性与可审计性。

法律科技语音交互文档检索人机交互司法效率
cs 01-12 00:00

NAIAD:基于大语言模型的内陆水体智能监测助手

NAIAD是一个面向内陆水体监测的智能体AI助手,旨在提供综合性解决方案。它利用大语言模型(LLM)和外部分析工具,通过单一提示界面将自然语言查询转化为可操作的洞察。系统集成了检索增强生成(RAG)、LLM推理、外部工具编排、计算图执行和智能体反思等技术,从精选数据源中检索并综合知识,生成定制化报告。其工具链涵盖天气数据、哨兵2号影像、遥感指数(如NDCI)计算、叶绿素a估算以及CyFi等成熟平台。在专用基准测试中,系统在正确性和相关性指标上分别达到77%和85%以上,初步结果显示其在不同查询类型中具有良好的适应性和鲁棒性。

智能体ai内陆水体监测大语言模型遥感分析检索增强生成
cs 01-12 00:00

KP-Agent:基于大语言模型与情境赌博机的搜索广告关键词优化系统

本研究针对搜索广告中关键词修剪这一被忽视的环节,提出了KP-Agent系统。该系统将大语言模型(LLM)与情境赌博机框架结合,通过生成代码片段并利用强化学习来动态优化广告关键词集。基于美团平台上50万条医药广告数据的实验表明,KP-Agent能将累计利润提升高达49.28%,有效解决了广告主手动调整关键词的效率瓶颈。

搜索广告关键词优化大语言模型情境赌博机强化学习智能代理
cs 01-12 00:00

基于生成式查询索引的多阶段热点检测方法:从事件到趋势

本文针对LLM对话系统在处理新闻趋势查询时的不足,提出了一种多阶段热点检测框架。该框架通过利用选定热点事件生成索引查询,在静态事件与动态用户查询间建立桥梁,并采用检索匹配机制进行实时在线检测。核心创新在于引入级联召回与排序架构以平衡检测效率与准确性,并设计了冷启动策略以收集在线数据微调重排序器。实验表明,该框架在离线和在线A/B测试中均显著优于基线方法,用户满意度(正负反馈比)相对提升了27%。

热点检测对话系统检索匹配查询生成级联架构在线学习
cs 01-12 00:00

RAG-LLM新评估指标:量化检索文档对生成结果的影响

本研究针对检索增强生成(RAG)系统中缺乏评估单个检索文档贡献度的问题,提出了一种基于部分信息分解(PID)的新颖度量指标——影响力分数(Influence Score, IS)。该指标能够量化每个检索文档对最终生成响应的具体影响。实验验证包括:1)在三个数据集上进行投毒攻击模拟,结果显示IS在$86\%$的情况下能正确识别出恶意文档为最具影响力的文档;2)消融实验表明,仅使用IS排名靠前的文档生成的响应,与原响应的相似度显著高于使用剩余文档生成的响应。IS为提升RAG系统的透明度和可靠性提供了有效工具。

检索增强生成影响力评估信息分解大语言模型系统透明度文档检索
cs 01-12 00:00

个性化评论排序与摘要系统:缓解信息过载,提升决策效率

本研究提出一个集成个性化评论排序与摘要生成的框架,以应对在线评论信息过载问题。系统通过分析用户历史评论,结合星级评分与文本内容进行混合情感建模,并利用句子嵌入和聚类技术构建用户语义偏好画像。基于情感与产品方面相似度的相关性评分算法,将用户画像与未读评论进行匹配,并对匹配度高的评论生成个性化摘要。一项70人参与的用户研究表明,该方法显著提升了用户满意度、内容相关性与决策信心,同时减少了阅读时间。

个性化推荐评论摘要信息过载用户画像情感分析决策支持
cs 01-12 00:00

LLM2IR:无监督对比学习将长上下文LLM转化为高效检索模型

本文提出LLM2IR,一种简单高效的无监督对比学习框架,可将仅解码器架构的大语言模型(LLM)直接转化为信息检索模型。该方法无需大规模预训练,在LoCo、LongEmbed和BEIR等多个基准测试中验证了其有效性。研究发现,在同一模型家族中,上下文长度更长的模型往往展现出更强的检索能力。这项工作不仅为在先进LLM上构建检索模型提供了有效途径,也揭示了模型检索能力与上下文长度之间的关系。

信息检索大语言模型无监督学习对比学习长上下文
cs 01-12 00:00

时间弯曲编辑距离的广义度量空间形式化

本文提出了一种广义时间弯曲编辑距离(GTWED),将Marteau(2009)提出的TWED从时间序列推广到任意度量空间。通过将观测域和时间域分别视为度量空间$(X, d)$和$(T, \Delta)$,在温和假设下,GTWED仍保持为真度量。文章提供了其度量性质的自包含证明,并表明当$X = \mathbb{R}^d$,$T \subset \mathbb{R}$,且$g(x) = x$时,经典TWED是其特例。这一理论扩展使得TWED类度量能应用于符号数据、流形或嵌入等任意域上的序列,超越了传统时间序列分析。

度量空间时间序列编辑距离弹性距离序列分析
cs 01-12 00:00

RAG系统架构与可信框架综述:构建模块化知识增强生成系统

本文对2018至2025年间检索增强生成(RAG)系统的学术研究、工业应用与真实部署进行了系统性综述。RAG通过模块化方式为大型语言模型(LLM)集成外部知识,无需增加模型参数量。研究梳理了日益多样化的RAG方法,包括多种融合机制、检索策略与编排方法,并将其整合为统一的分类体系。文章提供了定量评估框架,分析了其对系统可信度与对齐性的影响,旨在为部署稳健、安全且可领域自适应的RAG系统提供实用框架与技术参考。

检索增强生成大语言模型系统架构可信人工智能知识融合文献综述
cs 01-12 00:00

跨文档主题对齐分块:解决RAG系统中的知识碎片化问题

本文提出跨文档主题对齐(CDTA)分块方法,以解决检索增强生成(RAG)中因知识分散于多文档导致的“知识碎片化”问题。该方法在语料库层面重构知识:先识别跨文档主题,再将相关文本片段映射并合成为统一的知识块。在HotpotQA多跳推理任务上,其忠实度达0.93,较上下文检索(0.83)和语义分块(0.78)提升12%(p < 0.05);在阿联酋法律文本上,忠实度达0.94,引用准确率达0.93。尽管索引成本较高,但合成的信息密集块显著减少了查询时的检索需求,尤其适用于高查询量、知识分布式的场景。

检索增强生成知识碎片化跨文档分块多跳推理主题对齐信息检索
cs 01-12 00:00

工业零件规格提取新框架:检索增强的多LLM集成系统

本文提出了一种检索增强的多LLM集成框架(RAGsemble),用于从非结构化文本中提取工业零件规格。该框架采用三阶段流水线,协调了包括Gemini、GPT-4o、Mistral Large等在内的九个先进大语言模型,并利用基于FAISS的语义检索将输出与事实数据关联。系统通过并行提取、针对性研究增强和智能合成(含冲突解决与置信度评分)三个阶段,结合了不同模型家族的互补优势。实验表明,相较于领先的单模型基线,该系统在提取准确性、技术完整性和结构化输出质量方面均有显著提升。

工业信息提取大语言模型集成检索增强生成多模型协同制造业ai
cs 01-12 00:00

集成LLM与层次分析法:将用户定义标准转化为可解释的评估指标

本研究提出了一种结合大语言模型与层次分析法的可解释性聚合框架,用于解决复杂文本评估中用户标准量化难题。该方法通过LLM生成特定标准评分,利用Jensen-Shannon距离衡量判别力,并基于AHP成对比较矩阵计算统计权重。在亚马逊评论质量评估和抑郁相关文本评分实验中,该框架在保持预测能力的同时,实现了高解释性与运行效率,适用于对延迟敏感的实时网络服务。

可解释ai大语言模型层次分析法文本评估标准量化聚合框架
cs 01-12 00:00

高效AI系统:自动识别与描述手稿插画,助力大规模视觉研究

本研究提出了一种快速、可扩展的AI流程,用于从数字化手稿中检测、提取和描述插画。该系统采用三阶段流水线:首先,微调图像分类模型过滤纯文本页面;其次,高效目标检测模型定位并裁剪插画;最后,多模态图像描述模型生成简洁、可读的描述。所有结果存入可搜索数据库,学者可通过关键词查询检索相关视觉材料。将该流程应用于超过300万页数字化手稿,系统以每页低于0.06秒的速度,自动识别并提取了超过20万幅独特插画,在效率和可访问性上远超传统分割技术,为历史、艺术史和文化遗产领域的大规模视觉研究开辟了新途径。

手稿插画深度学习图像描述文化遗产数字化多模态ai视觉分析
cs 01-12 00:00

LiveVectorLake:支持实时向量更新与时间检索的双层知识库架构

本文提出LiveVectorLake,一种解决检索增强生成(RAG)系统中知识更新与查询延迟矛盾的双层时态知识库架构。其核心创新包括:1)基于SHA-256哈希的内容寻址分块同步机制,实现无需外部状态跟踪的确定性变更检测;2)分离热层(Milvus+HNSW向量索引)与冷层(Delta Lake+Parquet列式版本存储)的双层存储,独立优化查询延迟与存储成本;3)支持跨层ACID一致性的时态查询路由,实现基于增量版本的时间点知识检索。在包含5个时间点的100文档语料评估中,系统在更新时仅需重新处理10-15%的内容(相比完全重建索引的100%),当前知识检索延迟低于100毫秒,跨版本历史的时间查询延迟低于2秒,并通过冷热分层显著优化了存储成本。

知识库架构向量检索时态查询版本控制rag系统双层存储
cs 01-12 00:00

基于LLM语义嵌入增强交易理解基础模型

针对现有交易分析基础模型将商户文本字段离散化导致语义丢失的问题,本文提出一种混合框架。该框架利用大型语言模型(LLM)生成高质量的语义嵌入作为轻量级交易模型的初始化,通过多源数据融合、噪声过滤和上下文感知增强来提升数据质量,并采用“一词约束”原则确保不同LLM架构下嵌入生成的一致性。在大规模交易数据集上的实验表明,该方法在多个交易理解任务上均取得了显著的性能提升,同时兼顾了可解释性与实时部署的运算效率。

交易理解语义嵌入大型语言模型多源数据融合基础模型
cs 01-12 00:00

3×3矩阵乘法新突破:仅需59次加法运算的秩23算法

本研究将3×3矩阵乘法的算术复杂度降至新低。在保持乘法次数为23次(当前已知最优)的前提下,通过优化Mårtensson、Stankovski Wagner和Stapleton的方法,成功将加法运算次数从先前方案的60次进一步减少至59次,且无需进行基变换。这一进展延续了自Strassen算法以来对矩阵乘法计算复杂度的持续优化探索。

矩阵乘法计算复杂度算法优化数值线性代数算术运算
cs 01-12 00:00

贝叶斯方法在概率联盟结构恢复中的优势:稀疏恢复视角

本文研究了概率联盟结构生成(PCSG)问题,该问题可重构为基于联盟关联设计的 $l_0$ 型稀疏恢复问题。研究发现,在联盟重叠导致设计矩阵高度相干(存在近似重复列)的PCSG典型场景下,标准的 $l_1$ 松弛和贪婪追踪(如OMP)方法可能无法可靠恢复最优联盟结构,因为不满足不可表示条件且存在不可逆的误选风险。相比之下,理论证明,采用高斯-伽马层次先验的稀疏贝叶斯学习(SBL)方法在相同结构假设下具有支撑集一致性。SBL诱导的凹稀疏惩罚能有效抑制伪近重复列,以概率趋于1恢复真实的联盟支撑集,从而在理论上确立了凸优化、贪婪算法与贝叶斯稀疏方法在解决PCSG问题上的性能分离。

联盟结构生成稀疏恢复贝叶斯学习算法分离计算博弈论np难问题
cs 01-12 00:00

免模拟PSRO:消除策略空间响应预言机中的博弈模拟瓶颈

本研究针对策略空间响应预言机(PSRO)算法在近似零和博弈纳什均衡时计算成本高昂的问题,提出并系统化“免模拟PSRO”概念。分析表明,博弈模拟是PSRO运行时的主要瓶颈。为此,论文提出了一种新颖的动态窗口免模拟PSRO方法,通过引入策略窗口概念来替代PSRO维护的原始策略集,并限制窗口内策略数量,从而简化对手策略选择并提升最佳响应的鲁棒性。同时,利用纳什聚类选择待淘汰策略,有效控制窗口规模。多环境实验证明,该机制相比现有方法显著降低了可利用性,并展现出优秀的兼容性。

博弈论强化学习纳什均衡算法优化策略空间响应预言机
cs 01-12 00:00

单模型框架在电商多语言分类相关性判断中的高效解决方案

本研究针对电商搜索中的多语言分类相关性判断任务,提出了一种基于思维链任务分解的简化框架。传统集成方法虽能提升精度,但存在训练、推理和维护复杂度高的问题。本方法将相关性判断分解为翻译、意图理解、类别匹配和相关性判断四个可解释子任务,并采用LoRA对Qwen2.5-14B模型进行轻量化微调。实验表明,该单模型框架在保持竞争力的精度(公开/私有榜单分别达0.8902/0.8889)的同时,显著提升了效率,在单张A100 GPU上可达20样本/秒的推理速度,为可扩展的工业AI应用提供了新范式。

多语言搜索思维链轻量化微调电商ai模型可解释性
cs 01-12 00:00

PubMed规模向量检索:分离语义扩展与线性几何的新框架

本研究提出了一种在PubMed规模(约4000万条记录)下进行检索的新框架,其核心思想是将语义解释与度量几何分离。首先利用大语言模型将自然语言查询扩展为简洁的生物医学短语,然后在固定的、去均值且近似各向同性的嵌入空间中进行检索。文档和查询向量由词元嵌入的加权平均构成,并投影到干扰轴的补空间上,最后通过Johnson-Lindenstrauss变换进行压缩。整个系统无需训练参数,仅使用256维int8向量进行精确余弦搜索,即可在整个MEDLINE语料库中检索出连贯的生物医学主题簇。评估完全基于几何指标(如头部余弦相似度、紧致性、质心闭合性和各向同性),并与随机向量基线进行比较。

向量检索语义扩展几何分离生物医学信息无参数模型各向同性嵌入
AI速览助手