cs
02-18 00:00
本文提出了一种基于多体哈密顿量的CMOS可逆逻辑(CIL)电路。与传统的二体相互作用哈密顿量相比,新方法引入了自旋(概率节点)的三体相互作用,为设计更简单的哈密顿量(能量)景观提供了自由度。更简单的能量景观使得系统更容易达到全局最小能量。通过在FPGA上进行设计和评估,结果表明,所提出的三体CIL电路在面积开销可忽略不计的情况下,收敛速度比传统的二体CIL电路提高了数倍。
可逆逻辑多体哈密顿量cmos电路随机计算退火算法fpga实现
cs
02-18 00:00
本研究针对大语言模型在社会科学学术写作中评估粗糙的问题,提出了首个专注于教育领域的评估平台EduResearchBench。该平台基于分层原子任务分解框架,将完整研究流程分解为6大模块、24个原子任务,实现了从整体评分到细粒度诊断评估的转变。研究还提出课程学习策略,并利用5.5万学术样本训练出专用模型EduWrite。实验表明,30B参数的EduWrite在多项核心指标上显著优于72B通用模型,证明了垂直领域中数据质量与分层训练比参数规模更具决定性。
教育ai学术写作评估任务分解大语言模型垂直领域训练
cs
02-18 00:00
本研究提出了CircuChain诊断基准,旨在分离大语言模型在电路分析中的物理推理能力与遵循用户指定约束(如符号惯例)的能力。该基准包含控制/陷阱问题对,并采用多阶段验证流程。研究发现,最强模型物理推理近乎完美,但在惯例违反时合规性差;而较弱模型物理保真度低,却更遵从显式指令。这表明模型能力的提升并不保证约束对齐的改善。
大语言模型电路分析基准测试ai对齐物理推理指令遵循
cs
02-18 00:00
本文提出了Indic-TunedLens,一个专门针对印度语言的多语言大语言模型(LLM)可解释性框架。针对现有工具主要面向英语、模型表征空间存在英语中心化的问题,该框架通过学习共享的仿射变换($\mathbf{h}_{\text{aligned}} = \mathbf{W}\mathbf{h} + \mathbf{b}$),调整每种目标语言的隐藏状态,使其与目标输出分布对齐,从而更忠实地解码模型内部表征。在包含10种印度语言的MMLU基准测试中,该方法显著优于现有最先进的可解释性方法,尤其对形态丰富、资源匮乏的语言效果提升明显,为理解多语言Transformer的层级语义编码提供了关键洞见。
多语言模型可解释性印度语言仿射变换表征对齐低资源语言
cs
02-18 00:00
本研究首次在可调谐的架构晶格材料框架内实现了原位电阻抗成像(EIT)技术。通过采用受二维壁纸对称性启发的Voronoi分支主干分支图案设计晶格,并使用碳纳米管增强光固化树脂进行3D打印,研究人员在晶格外围布置了16个电极。在准静态拉伸载荷下,利用相邻和跨接电流注入方案重建的导电率分布图,能够以高时间分辨率解析连续的韧带断裂过程。局部的导电率损失与断裂位置(包括远离电极的区域)在定量上高度吻合。该工作为架构多功能材料提供了一种可扩展的全场传感模式,为构建面向结构、生物医学和能源应用的数字孪生框架提供了数据丰富的材料状态信息。
电阻抗成像架构材料损伤监测3d打印多功能复合材料数字孪生
cs
02-18 00:00
本文提出了一种统一的智能体通信协议(ACP),旨在解决异构智能体在跨平台、去中心化环境中安全、高效协作的难题。该协议构建于现有智能体架构与模型上下文协议(MCP)之上,通过集成去中心化身份验证、语义意图映射和自动化服务等级协议,实现了智能体间的发现、协商与工作流协同执行。评估表明,ACP在保持零信任安全态势的同时,显著降低了智能体间通信延迟。这项工作为实现可扩展、可互操作的自主数字实体生态系统迈出了关键一步。
智能体通信联邦协作零信任安全去中心化工作流编排语义映射
cs
02-18 00:00
本研究提出了CLOT系统,旨在解决长时间全身人形机器人遥操作中因全局位姿漂移累积导致的挑战。该系统通过高频定位反馈实现闭环全局运动跟踪,确保长时间无漂移的人机动作模仿。针对强化学习中直接施加全局跟踪奖励会导致动作激进且不稳定修正的问题,研究团队提出了一种数据驱动的随机化策略,将观测轨迹与奖励评估解耦,从而实现平滑稳定的全局修正。此外,系统还通过对抗性运动先验来正则化策略,抑制不自然行为。研究收集了20小时精心策划的人类运动数据进行策略训练,设计并训练了一个基于Transformer的策略模型(耗时超过1300 GPU小时),并将其部署在一个具有31个自由度(不包括手部)的全尺寸人形机器人上。仿真和真实世界实验均验证了该系统在高动态运动、高精度跟踪以及仿真到现实迁移的强鲁棒性方面的优异表现。
人形机器人遥操作运动跟踪强化学习全局定位仿真到现实
cs
02-18 00:00
本文提出Safe-SDL框架,旨在解决自动驾驶实验室(SDL)部署中的核心安全挑战——“语法到安全鸿沟”,即AI生成的语法正确指令与其物理安全后果之间的脱节。该框架通过三个协同组件实现:1)形式化定义的运行设计域(ODD),将系统行为约束在数学验证的边界内;2)控制屏障函数(CBF),通过连续状态空间监控提供实时安全保证;3)新颖的事务性安全协议(CRUTD),确保数字规划与物理执行之间的原子一致性。评估表明,当前基础模型存在显著安全缺陷,凸显了架构安全机制的必要性。
自动驾驶实验室ai安全控制屏障函数运行设计域物理信息ai实验室自动化
cs
02-18 00:00
本研究通过系统性文献综述(遵循PRISMA指南,纳入86篇文献),探讨了大语言模型(LLMs)对人机交互(HRI)领域的深刻影响。研究发现:1)LLMs正在重塑HRI的基础,包括机器人对情境的感知、生成社会性交互行为,以及在具身环境中持续与人类需求保持对齐的能力;2)当前研究多为探索性,不同研究在实验设置、方法和评估指标上差异巨大。文章最后为LLM与HRI交叉领域的未来研究提供了关键设计考量与挑战的概览及指导。
人机交互大语言模型系统性综述具身智能社会性机器人研究范式
cs
02-18 00:00
本文针对不确定敏捷对地观测卫星调度问题(UAEOSSP),提出了一种有效的遗传编程超启发式算法(GPHH)。该算法能够自动生成调度策略,以应对任务收益、资源消耗和任务可见性等多种不确定因素。实验结果表明,GPHH生成的调度策略在实时调整计划方面表现优异,其性能平均优于前瞻启发式算法(LAHs)5.03%,优于人工设计启发式算法(MDHs)8.14%。
卫星调度遗传编程超启发式不确定性优化对地观测
cs
02-18 00:00
该研究通过交互式视听装置《无形胜利》,以数字媒体技术重新诠释了萨莫色雷斯胜利女神雕塑。装置将雕塑实体解构为空间中圆柱排列的彩色纤维(内含导电传感器),观众通过触碰与移动,能触发声音环境,从而用声音取代了传统雕塑的体积感。研究重点探讨了“虚空”作为雕塑形式缺席的象征意义,以及时间作为磨损因素(熵)的作用,旨在创造一种观众、空间与时间之间的新型体验对话。
交互艺术数字媒体雕塑重构视听装置文化遗产数字化
cs
02-18 00:00
本研究提出GRAFNet,一种受人类视觉系统层级结构启发的医学图像分割模型,旨在解决结肠息肉分割中形态多变、与正常组织相似及多尺度检测的挑战。模型核心包含三个模块:模拟皮层神经元的方向性注意模块(GAAM)以增强边界识别;模拟视网膜神经节细胞的多尺度视网膜模块(MSRM)进行并行特征分析;以及基于预测编码的引导皮层注意反馈模块(GCAFM)进行迭代优化。在五个公开基准测试中,GRAFNet实现了最先进的性能,Dice系数提升3-8%,泛化能力提高10-20%,同时提供了可解释的决策路径。
医学图像分割仿生视觉模型结肠息肉检测多尺度特征融合注意力机制预测编码
cs
02-18 00:00
本研究提出了一种结构感知的符号钢琴伴奏生成方法,将高层规划与音符级实现解耦。系统首先通过轻量级Transformer预测基于乐段/乐句结构与功能和声的可解释风格规划,随后通过检索器从语料库中选择并重和声化人类演奏的钢琴模式。检索过程被形式化为在显式能量函数下的模式匹配,该函数考虑了和声可行性、结构角色兼容性、声部进行连续性、风格偏好和重复控制。给定结构化的主旋律谱和可选的关键词提示,系统可生成钢琴伴奏MIDI。实验表明,基于Transformer风格规划器的检索能生成风格表现力强、多样化的长篇伴奏。
音乐生成钢琴伴奏结构感知风格规划模式检索transformer
cs
02-18 00:00
本文介绍了CSLib,一个受数学形式化库Mathlib成功启发而建立的、快速发展的计算机科学与软件形式化统一库。文章阐述了其核心的技术原则、运作模式、抽象层和语义框架。主要贡献包括:提供了可复用的语义接口(如归约系统和带标签的转移系统),开发了证明自动化工具,建立了用于维护自动化及与Mathlib兼容性的持续集成/测试支持,并完成了首批语言与模型的重要形式化开发工作。
形式化验证定理证明lean语义框架计算机科学基础
cs
02-18 00:00
S-PRESSO 是一种 48kHz 音效压缩模型,通过结合预训练的潜在扩散模型解码器与离线量化技术,实现了低至 0.096 kbps 的超低码率压缩。该方法利用扩散解码器的生成先验,将帧率降至 1Hz(750倍压缩率),在牺牲部分精确保真度的前提下,能生成具有说服力且逼真的音频重建。实验表明,即使在极高压缩率下,S-PRESSO 在音频质量、声学相似性和重建指标上均优于现有的连续与离散基线模型。
音频压缩扩散模型超低码率生成式编码离线量化音效处理
cs
02-18 00:00
本文在压缩瞬时噪声逻辑(INBL)方案中实现了成对异或(XOR)和同或(XNOR)门运算。INBL是一种利用随机过程编码二进制信息的计算框架,通过$M$个噪声比特对应的$2M$个正交随机参考噪声,构建维度为$2^M$的超空间(希尔伯特空间),为特定问题提供指数级加速的经典并行计算方案。研究验证了所提门运算在比特级和$M$比特长字符串上均具有正确的布尔行为,并保持了瞬时求值特性。该工作是构建压缩INBL方案中更复杂算法所需门集的关键部分,推动了INBL门通用性的发展,强化了INBL作为一种能模拟量子计算某些结构优势的灵活经典计算框架。
噪声计算瞬时逻辑超空间运算经典并行逻辑门设计计算框架
cs
02-18 00:00
本研究提出了一种基于量子启发混合群智能(QiHSI)的优化框架,用于解决高级驾驶辅助系统(ADAS)标定中的多目标权衡问题。该方法将量子启发机制嵌入樽海鞘群优化过程,以增强高维决策空间中的全局搜索能力和种群多样性,并引入“决策者在环”策略以整合专家指导,使优化过程能动态响应设计优先级和系统约束的变化。实验表明,与多种先进算法相比,QiHSI能以更快的收敛速度生成分布良好的帕累托最优解,为智能ADAS标定提供了可靠且可扩展的解决方案。
量子启发优化群智能算法adas标定多目标优化决策者在环自动驾驶
cs
02-18 00:00
本研究提出一种基于量子退火的接入点(AP)选择算法,用于解决预算约束下的室内定位优化问题。该算法将AP选择问题建模为二次无约束二进制优化(QUBO)问题,并利用量子退火求解器进行高效求解。实验表明,在保持可比3D定位精度的前提下,该方法能将所需AP数量减少96.1%,同时计算速度比经典算法快61倍(仅需0.20秒),平均定位误差降低10%。在楼层定位任务中,量子方法达到73%的准确率,优于经典算法(58.6%)甚至使用全部AP的方案(70.4%)。
量子优化室内定位接入点选择量子退火预算约束qubo问题
cs
02-18 00:00
本研究提出了一种基于注意力门控循环残差U-Net(R2U-Net)的三平面(2.5D)模型,用于改进脑胶质瘤的语义分割。该模型通过集成残差、循环和三平面架构,在保持计算效率的同时增强了特征表示和分割精度。在BraTS2021验证集上,全肿瘤分割的Dice相似系数达到0.900。此外,三平面网络为生存天数预测提取特征,经人工神经网络降维后,在测试集上取得了45.71%的准确率。
脑肿瘤分割注意力机制u-net生存预后医学图像分析深度学习
cs
02-18 00:00
本研究为2025年新提出的双曲Sombor指数(HSO)建立了基于M-多项式的闭式推导公式。该指数在化学图论中已显示出对烷烃异构体的结构敏感性和适用性。通过提出的公式,作者计算了若干标准图及化学结构族的HSO指数,并提供了M-多项式与HSO指数的数值及图形化表示,为拓扑指数的计算提供了一种系统化的多项式方法。
拓扑指数m-多项式双曲sombor指数化学图论图多项式闭式公式