Tag: Instruction Tuning

All the papers with the tag "Instruction Tuning".

Enhancing Chemical Reaction and Retrosynthesis Prediction with Large Language Model and Dual-task Learning
grok-3-latest
Score: 0.51
Published:2025年5月5日 at 13:31
#LLM, #Chemical Synthesis, #Dual Task Learning, #Molecular Representation, #Instruction Tuning
本文提出 ChemDual 框架，通过构建 4.4M 分子指令数据集、设计多尺度分词器和双任务学习策略，显著提升了基于 LLaMA 的化学反应与逆合成预测性能，并在多个数据集上超越现有方法。
SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning
grok-3-latest
Score: 0.64
Published:2025年5月5日 at 09:09
#LLM, #Multimodal Learning, #Continual Learning, #Instruction Tuning, #Regularization
本文提出 SEFE 方法，通过 ASD 范式和 RegLoRA 分别解决多模态持续指令微调中的表面遗忘和本质遗忘问题，显著提升模型性能并实现最先进的遗忘缓解效果。
SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning
grok-3-latest
Score: 0.61
Published:2025年5月5日 at 09:09
#Multimodal Learning, #Continual Learning, #Instruction Tuning, #Forgetting Mitigation, #Parameter Efficiency
本文提出 SEFE 方法，通过 ASD 范式和 RegLoRA 分别缓解多模态持续指令微调中的表面遗忘和本质遗忘，显著提升模型在持续学习中的性能。
Bielik 11B v2 Technical Report
grok-3-latest
Score: 0.66
Published:2025年5月5日 at 07:03
#LLM, #Language Adaptation, #Parameter Efficiency, #Instruction Tuning, #Data Quality
本文提出 Bielik 11B v2，一个针对波兰语优化的高效语言模型，通过深度扩展、创新训练方法和高质量数据，在波兰语任务上实现与更大模型相当的性能，同时保持参数效率和部署灵活性。

Tag: Instruction Tuning

Enhancing Chemical Reaction and Retrosynthesis Prediction with Large Language Model and Dual-task Learning

SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning

SEFE: Superficial and Essential Forgetting Eliminator for Multimodal Continual Instruction Tuning

Bielik 11B v2 Technical Report