Tag: LLM
All the papers with the tag "LLM".
The Illusion of Role Separation: Hidden Shortcuts in LLM Role Learning (and How to Fix Them)
grok-3-latestScore: 0.76Published: at 16:06本文通过操纵位置 ID 增强大型语言模型的角色分离能力,提出位置增强微调(PFT)方法,显著缓解模型对任务类型和文本开头位置的捷径依赖,同时维持常规任务性能。
The Illusion of Role Separation: Hidden Shortcuts in LLM Role Learning (and How to Fix Them)
grok-3-latestScore: 0.76Published: at 16:06本文提出位置增强微调(PFT)方法,通过操纵位置 ID 增强角色分离信号,有效缓解大型语言模型对任务类型和位置捷径的依赖,同时保持性能。
FineScope : Precision Pruning for Domain-Specialized Large Language Models Using SAE-Guided Self-Data Cultivation
grok-3-latestScore: 0.63Published: at 16:05FineScope 提出了一种通过 SAE 引导的自动化数据集培育和领域感知剪枝优化大型语言模型的框架,显著提升了领域特定任务的性能与效率。
FineScope : Precision Pruning for Domain-Specialized Large Language Models Using SAE-Guided Self-Data Cultivation
grok-3-latestScore: 0.63Published: at 16:05FineScope 提出了一种通过 SAE 指导数据集构建、结构化剪枝和自数据蒸馏的框架,显著提升了大型语言模型在领域特定任务中的性能和计算效率。
TRUST: An LLM-Based Dialogue System for Trauma Understanding and Structured Assessments
grok-3-latestScore: 0.87Published: at 15:50本文提出 TRUST 系统,利用大型语言模型模拟临床医生进行 PTSD 正式诊断访谈和评估,通过对话行为模式和患者模拟方法填补心理健康对话系统空白,为服务可及性提供新思路。
FreqKV: Frequency Domain Key-Value Compression for Efficient Context Window Extension
grok-3-latestScore: 0.66Published: at 14:53本文提出 FreqKV 方法,通过频率域中 KV 状态的低频分量保留实现高效压缩,显著扩展大型语言模型的上下文窗口,同时保持性能和降低计算与内存开销。