Skip to content

Bye-bye, Bluebook? Automating Legal Procedure with Large Language Models

grok-3-latest
Score: 0.59
Published: at 16:18

Summary: 本文通过构建 Bluebook 任务数据集并测试大型语言模型的程序遵循能力,揭示了其在法律引用格式自动化中的局限性,为法律程序AI研究提供了重要基准。

Keywords: LLM, Legal Automation, Procedural Rules, Citation Formatting, Context Learning

Authors: Matthew Dahl

Institution(s): Yale Law School

Problem Background

法律实践要求严格遵守程序规则,而美国法律引用格式《Bluebook: A Uniform System of Citation》以其复杂性(超过500页规则)成为法律从业者的负担。 论文探讨大型语言模型(LLMs)是否能自动化这一程序性任务,减轻人工负担,并为更广泛的法律程序自动化提供初步证据,解决当前对 LLMs 在法律程序领域能力评估不足的问题。

Method

Experiment

Further Thoughts

论文揭示了 LLMs 在程序性任务上的局限性,启发我们重新审视法律AI中‘简单任务’的定义;长上下文学习的低效提示是否可以通过规则摘要或结构化输入优化模型理解;此外,模型依赖记忆而非规则遵循的表现,是否可以通过更多对抗性测试(如合成数据)进一步验证其泛化能力,或许这能为设计更可靠的法律AI工具提供新思路。