利用大语言模型检测与应对私信骚扰:Instagram案例研究
本研究针对私密社交平台(如Instagram)中的在线骚扰问题,构建了一个基于大语言模型(LLM)的检测与应对管道。首先,研究者通过人工标注构建了Instagram消息数据集,并利用LLM结合对话上下文进行大规模骚扰内容标注,其表现与人工标注具有可比性。进一步,研究使用LLM生成针对骚扰消息的模拟回应,并通过评估发现,这些模拟回应在“帮助性”上优于原始的人类回应。这项工作为在私密通信场景中自动化识别和干预在线骚扰提供了新的技术路径。
2025-12-18 共 24 条抓取,按综合热度排序
本研究针对私密社交平台(如Instagram)中的在线骚扰问题,构建了一个基于大语言模型(LLM)的检测与应对管道。首先,研究者通过人工标注构建了Instagram消息数据集,并利用LLM结合对话上下文进行大规模骚扰内容标注,其表现与人工标注具有可比性。进一步,研究使用LLM生成针对骚扰消息的模拟回应,并通过评估发现,这些模拟回应在“帮助性”上优于原始的人类回应。这项工作为在私密通信场景中自动化识别和干预在线骚扰提供了新的技术路径。
本研究提出一种结合定性与定量分析的数字足迹分析方法,用于理解游客行为动态及景点网络关系。通过整合游客在旅行中留下的数字痕迹,不仅关注行为频次等量化指标,还深入挖掘行为背后的兴趣偏好与决策模式,为旅游目的地管理和个性化服务提供更全面的数据支持。
本文提出了图嵌入风险模型(GEHM),这是一个用于建模加权经济网络上生存动力学的非线性演化框架。该模型将基于图的 $p$-Laplacian 扩散算子与随机结构漂移耦合,形成一个有限维的 PDE-SDE 系统,捕捉节点生存如何对非线性扩散压力做出反应,同时一个聚合复杂度因子根据 Itô 过程演化。利用增生算子理论、非线性半群方法和随机分析,研究建立了温和解的存在唯一性,推导了依赖于拓扑的能量耗散不等式,并刻画了区分耗散、临界、放大和爆炸状态的稳定性阈值。在 Barabási-Albert 网络上的数值实验证实,枢纽主导地位会放大非线性梯度并压缩稳定性裕度,产生重尾生存分布和偶发的爆炸行为。
本研究提出NN-Caption,一种由大语言模型(LLM)引导的神经架构搜索(NAS)流程,能够在严格的网络API合约下,自动生成可运行的图像描述模型。该方法利用DeepSeek-R1-0528-Qwen3-8B作为主要生成器,通过组合LEMUR分类主干中的CNN编码器与序列解码器(LSTM/GRU/Transformer)来构建模型。在MS COCO数据集上的评估显示,LLM生成的数十个模型中,超过一半成功训练并产生有意义的描述。研究还分析了提示中不同数量输入模型片段(5个 vs. 10个)的影响,发现提供更多候选组件时成功率略有下降。这项工作展示了LLM引导NAS的潜力,不仅能够提出架构,还能建议超参数和训练实践,同时为开源LEMUR数据集贡献了数十个新颖的描述模型。
本文提出SGEMAS,一种受生物学启发的自生长瞬时多智能体系统,用于生理信号的无监督在线异常检测。它将智能视为动态热力学过程,通过将结构可塑性机制(智能体生灭)与变分自由能目标耦合,系统以极高的稀疏性自然演化以最小化预测误差。在MIT-BIH心律失常数据库的跨患者零样本挑战性设置中,最终模型平均AUC达$0.570 \pm 0.070$,优于标准自编码器基线,验证了基于物理的、能量约束模型在高效生物医学AI中的潜力。
本文提出将Transformer的自注意力机制和残差流解释为一种近似的向量符号架构(VSA)。在该视角下,查询和键定义了角色空间,值编码了填充物,注意力权重执行软解绑,而残差连接实现了多个绑定结构的叠加。作者利用这一代数透镜,将Transformer的内部机制与思维链、基于程序的推理以及记忆增强的工具使用联系起来,并解释了变量混淆和逻辑相关提示间不一致等典型失败模式。基于此,本文提出了受VSA启发的架构偏置和训练目标,旨在促进角色-填充物分离和鲁棒的叠加,为构建更具可解释性和逻辑可靠性的推理系统提供了原则性路径。
本文提出了一种名为AutoS的多域自适应方法,旨在解决从多个源域向无标签目标域迁移知识时,源信息冗余或无关导致的性能下降问题。该方法采用密度驱动的选择策略,在训练过程中自主选择源域样本,并决定哪些源模型应对目标预测做出贡献。同时,利用基于预训练多模态模型构建的伪标签增强模块,来减轻目标域标签噪声并改进自监督学习。在真实数据集上的实验验证了该方法的优越性。
本研究针对在线社交网络中少数群体因网络位置劣势而难以获取信息的问题,提出了一种通过添加新连接来提升信息访问公平性的优化方法。该方法以电阻距离衡量信息访问,强调全局网络结构与多路径连通性。研究证明该问题是NP难的,并提出了一种高效的线性时间贪婪算法,可在百万节点规模的网络上生成精确解。
本研究针对脓毒症(占全球ICU入院20%)的AI预测与处方任务,系统比较了端到端深度融合与上下文感知专家堆叠两种架构。研究发现,在小样本抗生素队列中,新颖的Quad-Modal Hierarchical Gated Attention网络(SepsisFusionFormer)因“注意力饥饿”导致过拟合(AUC 0.66)。相反,一种更精简的上下文感知混合专家架构(SepsisLateFusion)将静态、时序和文本模态视为正交专家,通过CatBoost元学习器动态门控,在临床发作前4小时预测中实现了0.915 AUC的SOTA性能,并将漏诊率降低了48%。此外,针对多类抗生素选择的处方任务,四模态集成模型取得了最高性能(0.72 AUC)。所有模型已集成至开源临床决策支持框架SepsisSuite中。
本研究提出了一种潜在类别强化学习模型,用于捕捉个体在出行决策中通过经验形成偏好并随时间演化的过程。模型通过变分贝叶斯方法进行参数估计,能够同时处理个体间的异质性及其偏好的动态适应性。基于驾驶模拟器数据的应用识别出三类具有显著差异的个体:第一类表现出情境依赖的偏好和情境特定的利用倾向;第二类遵循持续利用策略;第三类则采用探索性策略并结合情境特定偏好。
本文提出GSE ResNeXt深度学习架构,用于解决复杂水下噪声环境中的目标分类难题。该模型将可学习的二维Gabor卷积层作为自适应带通滤波器,与ResNeXt主干网络结合,并引入挤压-激励通道注意力机制。此设计增强了模型对判别性特征的提取能力,提升了训练稳定性与收敛速度。在三个复杂度递增的分类任务上,GSE ResNeXt在分类性能上均优于Xception、ResNet等基线模型。特别地,模型初始层加入Gabor卷积使训练时间减少了28%,并揭示了传感器与目标船只间的距离对模型性能的显著影响。研究强调了信号处理策略对于提升数据有限场景下模型可靠性与泛化能力的重要性。
本研究首次探讨了对大型语言模型权重进行比特级扰动(故障注入)如何影响其生成图像描述的语义,同时保持语法结构。作者提出可微故障分析框架BLADE,利用基于梯度的敏感性估计定位语义关键比特,并通过语义流畅性目标优化选择。研究表明,即使难以察觉的低层比特变化也能操控生成式视觉-语言模型的高层语义,为鲁棒性测试、对抗防御和可解释AI开辟了新途径。
本文提出SEED框架,通过谱熵动态评估变量间的时空依赖关系,自适应平衡通道独立与依赖策略。核心创新包括:依赖评估器利用谱熵提供初步依赖评估;基于谱熵的融合器进一步细化权重,分离外部影响;带符号图构造器保留负相关性,克服softmax局限;上下文空间提取器帮助变量感知时序位置。在12个真实数据集上的实验表明,SEED达到了最先进的性能。
本文针对小语言模型在分类任务中,现有归因方法难以提供有效判别性监督信号的问题,提出了类感知归因先验框架。该框架通过引导模型关注细粒度的类间差异,生成更具区分度的归因先验。进一步提出的CAP Hybrid方法,融合了新颖先验与传统归因技术,形成了更全面、平衡的监督信号。实验表明,该方法在标准、少样本及对抗场景下,均能有效提升模型的可解释性与鲁棒性。
本文提出了SoMe,一个用于全面评估基于大语言模型的社交媒体智能体的开创性基准测试平台。该平台包含8类社交媒体任务、超过900万条帖子、6500多个用户档案以及17000多个精心标注的任务查询,首次为LLM智能体处理理解媒体内容、分析用户行为和复杂决策等多样化社交媒体任务提供了真实且通用的评估环境。广泛的定量与定性分析表明,当前主流的大语言模型在处理这些现实任务时仍存在显著局限。SoMe为未来社交媒体智能体的发展提供了一个具有挑战性且意义重大的测试平台。
本文提出HATSolver,一种基于分层注意力Transformer(HAT)的神经网络方法,用于计算多元多项式方程组的Gröbner基。该方法通过引入树状结构的归纳偏置,有效建模数据中的层次关系,相比传统的平面注意力模型(如Kera等人NeurIPS 2024的工作)实现了显著的计算节省。结合课程学习策略,本方法能够处理更大规模的问题实例,并提供了详细的计算成本分析。
本研究提出了一种生成式扩散框架,用于在非结构化网格上合成稳态城市风流场。该框架结合了分层图神经网络与基于分数的扩散建模,仅需几何信息即可生成准确且多样的速度场,无需时间推进或密集测量。模型经过多个网格切片和风向角度的训练,能够泛化到未见过的几何形状,恢复尾流和再循环区等关键流动结构,并提供不确定性感知预测。这是迈向建筑环境基础模型的第一步,可帮助城市规划者在城市密集化和气候不确定性下快速评估设计决策。
本研究提出量子决策变换器(QDT),一种融合量子计算启发的架构,用于解决离线强化学习中长期信用分配和复杂状态-动作依赖的难题。其核心包含两个协同设计的组件:利用纠缠操作捕获非局部特征关联的量子启发注意力机制,以及采用多路径处理和可学习干涉进行自适应计算的量子前馈网络。在连续控制任务上的实验表明,QDT相比标准决策变换器实现了超过2000%的性能提升,并在不同数据质量下展现出优异的泛化能力。消融研究揭示了组件间强烈的协同效应,表明有效的量子启发架构设计需要整体协同设计,而非模块化组件堆叠。
保形预测(CP)是一种为机器学习模型提供统计保证的不确定性量化工具,其理论声称即使在小规模校准集上也成立。本文通过理论分析和医学图像分类任务的实证研究指出,虽然CP的统计保证在任意大小的校准集上均成立,但这些保证的实际效用高度依赖于校准集的大小。在医疗领域数据稀缺的背景下,这一发现对依赖小校准集获得可靠不确定性估计的实践提出了重要警示。
本文提出SEMO框架,将人类在不确定性下的社交决策建模为一个集成的多臂老虎机与马尔可夫决策过程优化问题。智能体通过强化学习、贝叶斯信念更新和基于代理的模拟,在动态社交图上自适应地平衡对新社交关系的探索和对现有关系的利用,以最大化其社会进化适应度。框架定义了融合个体收益与网络层面收益的适应度函数,并提出了具有对数遗憾界保证的Social-UCB算法。仿真实验表明,该算法在累积社会适应度和网络连接效率上均优于基线启发式方法。
本文形式化定义了超网络理论中的“边界”概念。边界是一种非结构性的标签,它通过投影操作 $\pi_b(H)$ 来筛选出携带特定标签 $b$ 的超单纯形,从而在不改变底层网络结构的前提下,限制其可见性。该方法实现了不变结构与范围分析之间的严格分离,支持模块化建模与重叠视角,确保了视图级推理的局部性和全局结构的完整性。
本研究对GPT-OSS系列及其他大语言模型在金融领域的十项NLP任务进行了全面评估。一个反直觉的发现是:参数更少的GPT-OSS-20B模型在精度上与更大模型相当(65.1% vs 66.5%),同时在计算效率上显著领先,其Token效率得分为198.4,处理速度达159.80 tokens/秒。评估表明,GPT-OSS模型在多项任务上超越了包括Qwen3-235B在内的更大规模竞品,揭示了模型规模并非直接等同于任务性能。研究引入的新效率指标为生产环境部署提供了关键决策依据。
本研究提出一种从表格数据统计信息中自动生成Synthea规则的方法,并以胶质母细胞瘤为例,利用癌症报告数据创建了相应的Synthea模块。该方法生成的合成数据集成功复现了已知的疾病进程,并基本保留了原始数据的统计特性。合成数据在保护隐私的同时,为医学研究提供了可用于假设构建和原型开发的数据资源,但实际应用时仍需考虑其局限性。
本文提出了一种名为MS-Index的新型算法,用于解决多变量时间序列(MTS)在欧几里得距离下的最近邻子序列搜索问题。该算法支持在查询时动态选择相关通道,例如在飞机传感器数据中仅针对特定故障(如起落架)的相关通道进行搜索。MS-Index是一种精确算法,其查询性能随查询通道数量呈亚线性增长。通过在34个数据集上的全面实验评估,证明其性能比现有最优方法快一到两个数量级,适用于原始和归一化后的子序列。