← 全部项目

ContractLens — 澳洲房产合同 AI 审查

与执业律师合作:把 348 页合同读成一页报告,10 阶段 pipeline、7 位 AI 分析师并行,约 $1/份

Next.jsFastAPILangGraphClaude 分层调用(Opus / Sonnet / Haiku)SupabasePyMuPDF + Tesseract OCR

问题

澳洲 VIC 房产交易合同动辄一两百页(常含扫描件),买家几乎不可能读完,律师审查贵且仍会漏细节;而法律场景对 AI 的要求极苛刻——每条结论必须可查证,且绝不能越界输出法律意见。

做法

10 阶段 pipeline:PDF 上传(PyMuPDF + Tesseract OCR)→ 规则引擎切分出 Particulars / Special Conditions / Section 32 / Title & Plan / OC 证书 / Council·Water / Lease 等段落 → 7 位专项 AI 分析师并行审查(LangGraph 编排,Claude Opus / Sonnet / Haiku 分层调用控制成本)→ 汇总一页报告。防幻觉三件套:强制原文引用 + rapidfuzz 模糊匹配校验 + 仅针对失败引用的定向重试;输出再过两道合规闸门(正则 + AI 语义审查),杜绝「AI 律师」式越界表述。

结果

4 份真实合同(104–348 页)全链路跑通

真实基准

约 30 条与律师报告重合,另有 2 处 ACN 不一致经逐条核对确认

对照律师审查

~$1(91 条发现,每条附原文引用)

单份成本

AI 在这个项目里的角色

Multi-Agent + 防幻觉工程的完整实践:并行分析师编排、引用强校验、合规闸门,并用执业律师的真实审查报告做基准校准。

为什么做它

澳洲 VIC 房产交易合同动辄一两百页,还经常是扫描件。买家读不完,律师审查贵、而且也会漏。这个项目和一位执业律师合作,目标是把「一份合同」变成「一页每条结论都可查证的报告」。

关键设计

10 阶段 pipeline。 PDF 上传(PyMuPDF + Tesseract OCR 处理扫描件)→ 规则引擎切分段落(Particulars / Special Conditions / Section 32 / Title & Plan / OC 证书 / Council·Water / Lease)→ 7 位专项 AI 分析师并行审查(LangGraph 编排)→ 汇总一页报告。模型分层调用(Opus / Sonnet / Haiku)把单份成本压到约 $1。

防幻觉是产品的生命线。 三件套:强制原文引用、rapidfuzz 模糊匹配校验引用真实存在、仅针对失败引用的定向重试;输出再过两道合规闸门(正则 + AI 语义审查),确保不输出越界的「法律意见」。

用真实律师报告校准。 4 份真实合同(104–348 页,含 5 地址混合产权)全链路跑通;与执业律师审查逐条对照:约 30 条与律师报告重合命中,另有 2 处 ACN(公司注册号)不一致经与律师逐条核对后确认、其报告未单列——不是「AI 比律师强」,而是多一双不知疲倦的眼睛做交叉补漏。

一句话总结

法律场景把「AI 输出必须可验证」推到了极限——每条结论都得能翻回原文,这正是防幻觉工程最硬的练兵场。