中芸汇科技
汎用AIモデルファインチューニングナレッジベース中国

ある法律テクノロジープラットフォームの業界モデルファインチューニングプロジェクト

ある法律テクノロジープラットフォームの業界モデルファインチューニングプロジェクト

プロジェクト背景

ある法律テクノロジープラットフォームは、企業や個人向けにオンライン法律相談サービスを提供しており、1日あたりの相談件数は3,000件を超えます。同プラットフォームではこれまで汎用大規模モデルを用いて法律問題に回答していましたが、法律分野は専門性が高く専門用語が密集しているため、汎用モデルでは法律相談の精度がわずか71%、ハルシネーション率が28%に達し、しばしば曖昧または誤ったアドバイスを提供してしまい、プラットフォームの専門性やユーザーからの信頼を著しく損ねていました。プラットフォームは、法律を真に理解する専用モデルを切実に必要としていました。

主な課題

  • 法律相談の精度が低い:汎用モデルの精度は71%にとどまり、法律サービスの専門性要件を満たせない
  • ハルシネーション率が極めて高い:28%の回答に法律条文の捏造や誤った引用が含まれ、業務上のリスクがある
  • 法律用語の理解不足:汎用モデルは、法律の固有名詞や条文の引用に対する理解が不十分
  • データ注釈コストの高さ:高品質な法律分野の注釈データは希少であり、注釈コストが高額
  • ソリューション

    法律分野におけるLoRAファインチューニング

    ChatGLM-6Bをベースに、法律分野のLoRA(Low-Rank Adaptation)ファインチューニングを実施。契約紛争、労働争議、知的財産権、会社法など主要な法律領域をカバーする高品質な法律Q&A注釈データ2,000件を慎重に構築しました。ファインチューニング後、モデルの精度は71%から95%に向上し、ハルシネーション率は28%から4%に低減しました。

    法律ナレッジの強化

    法律ナレッジベースをRAGの補完として構築し、法律や規制、司法解釈、代表的な判例などの権威ある資料を収録しました。回答時にモデルが関連する条文や判例を自動検索し根拠とすることで、すべての回答が法的根拠を参照可能にし、回答の信頼性と専門性をさらに高めます。

    品質評価と継続的な改善

    法律回答の品質評価体系を確立し、正確性、完全性、コンプライアンスの3つの観点からモデルの出力を自動評価します。評価で発見された問題に対して継続的にトレーニングデータを追加し、データフライホイールを形成してモデル能力の持続的な向上を実現します。

    効果データ

    指標ファインチューニング前ファインチューニング後改善
    法律相談の精度71%95%34%
    ハルシネーション率28%4%86%
    条文引用の正解率55%92%67%
    ユーザー満足度62%91%47%

    技術スタック

    ChatGLM-6B、LoRAファインチューニング、PEFT、法律ナレッジベース、RAG、Python、PyTorch、Hugging Face Transformers

    ファインチューニング後のモデルは本当に法律を理解しており、弁護士たちはAIのアドバイスを信頼し始めています。これは、汎用モデルから専門モデルへの重要な一歩です。