Tag: LLM
All the papers with the tag "LLM".
TRUST: An LLM-Based Dialogue System for Trauma Understanding and Structured Assessments
grok-3-mini-latestScore: 0.87Published: at 10:25本文提出TRUST框架,利用LLMs和自定义Dialogue Acts schema构建一个模拟临床医生的对话系统,进行PTSD结构化诊断访谈,并通过基于真实转录的患者模拟进行评估,展现了与真实访谈相当的性能。
WebThinker: Empowering Large Reasoning Models with Deep Research Capability
grok-3-mini-latestScore: 0.78Published: at 10:25本文提出WebThinker框架,通过Deep Web Explorer和Autonomous Think-Search-and-Draft策略增强LRMs的网页搜索与报告生成能力,并利用RL-based训练优化工具交互,实现显著的复杂任务性能提升。
XBreaking: Explainable Artificial Intelligence for Jailbreaking LLMs
grok-3-mini-latestScore: 0.79Published: at 10:25本文提出XBreaking方法,利用Explainable AI分析审查和非审查LLMs的内部模式,识别关键层并通过噪声注入绕过安全机制,同时保持模型功能。
Pushing the Limits of Low-Bit Optimizers: A Focus on EMA Dynamics
grok-3-latestScore: 0.52Published: at 06:47本文提出 SOLO 框架,通过针对 EMA 更新特性的对数量化和动量调整,将优化器状态精度降低至 2 位或 3 位,同时保持接近全精度的训练性能,为资源受限环境下的 AI 研究提供可行解决方案。
Empirical Evaluation of Progressive Coding for Sparse Autoencoders
grok-3-latestScore: 0.44Published: at 21:08本文提出 Matryoshka SAEs 和基于幂律分布的剪枝方法,为稀疏自编码器的渐进式编码提供高效策略,并在性能、计算效率与可解释性之间进行了深入权衡分析。
Between Underthinking and Overthinking: An Empirical Study of Reasoning Length and correctness in LLMs
grok-3-latestScore: 0.86Published: at 18:48本文通过实证分析揭示了大型语言模型推理长度与正确性之间的非线性关系,并通过长度偏好优化实验提出了一种在无监督条件下减少生成长度的有效方法,为自适应推理研究提供了新视角。