Tag: Code Generation
All the papers with the tag "Code Generation".
Software Development Life Cycle Perspective: A Survey of Benchmarks for CodeLLMs and Agents
grok-3-latestScore: 0.39Published: at 14:27本文通过系统分析181个CodeLLMs和代理基准测试,揭示了SDLC各阶段评估的不平衡性,并为未来基准测试设计提供了全面指导。
YABLoCo: Yet Another Benchmark for Long Context Code Generation
grok-3-latestScore: 0.65Published: at 13:42YABLoCo 提出一个针对 C/C++ 语言的大型代码库代码生成基准,填补长上下文评估空白,并通过实验验证上下文对 LLMs 性能的显著影响。
Rewriting Pre-Training Data Boosts LLM Performance in Math and Code
grok-3-latestScore: 0.81Published: at 07:38本文通过系统性重写预训练数据,构建 SwallowCode 和 SwallowMath 数据集,显著提升了大型语言模型在代码生成和数学推理任务上的性能,提出了一种创新的‘改造并保留’数据处理范式。
Leveraging LLMs to Automate Energy-Aware Refactoring of Parallel Scientific Codes
grok-3-latestScore: 0.53Published: at 17:05本文提出 LASSI-EE 框架,利用大型语言模型通过多阶段、自我校正的管道自动化重构并行科学代码,在 NVIDIA A100 GPU 上实现平均 47% 的能量节省,展示了 LLM 在能效优化中的潜力。