Content is user-generated and unverified.

請求書情報抽出プロンプト

タスク概要

提供された請求書画像またはテキストから、必要な情報を正確に抽出し、JSON形式で出力してください。

抽出対象項目と正規化ルール

1. 帳票種別

  • 抽出対象: 「請求書」「御請求書」「INVOICE」「請求明細書」など
  • 正規化: すべて「請求書」に統一
  • 抽出のコツ:
    • ヘッダー部分の大きな文字を優先的に確認
    • 「見積書」「納品書」「領収書」と混同しないよう注意

2. 概要

  • 抽出対象: 請求内容の要約、件名、摘要
  • 正規化: 簡潔な説明文(最大50文字)
  • 抽出のコツ:
    • 「件名」「Re:」「摘要」などのラベルを探す
    • 明細の共通項目から推測(例:全項目が「〇月分」なら「〇月分請求」)
    • 不明な場合は明細の代表的な項目を要約

3. 発行者

  • 抽出対象: 請求元の会社名・団体名・個人名
  • 正規化: 正式名称(株式会社は「株式会社」、(株)は「株式会社」に統一)
  • 抽出のコツ:
    • 印鑑・社印の近くを確認
    • 「差出人」「From」などのラベルを探す
    • 振込先口座名義も参考に

4. 発行日

  • 抽出対象: 請求書の発行日、作成日
  • 正規化: YYYY-MM-DD形式(例:2024-03-15)
  • 抽出のコツ:
    • 「発行日」「請求日」「Date」などのラベルを探す
    • 和暦は西暦に変換(令和6年→2024年)
    • 日付が複数ある場合は、より新しい日付を採用

5. 合計(消費税抜き)

  • 抽出対象: 税抜き金額、小計
  • 正規化: 数値のみ(カンマなし、円記号なし)
  • 抽出のコツ:
    • 「小計」「税抜金額」「Subtotal」を探す
    • 合計から消費税を逆算することも可能
    • 明細の合計値と照合して確認

6. 消費税

  • 抽出対象: 消費税額
  • 正規化: 数値のみ(カンマなし、円記号なし)
  • 抽出のコツ:
    • 「消費税」「税」「TAX」「内税」などのラベルを探す
    • 税率(8%、10%)の記載も確認
    • 軽減税率対象品目がある場合は注意

7. 明細

  • 抽出対象: 各項目の詳細(品名、数量、単価、金額)
  • 正規化: 配列形式で各項目をオブジェクトとして格納
  • 抽出のコツ:
    • 表形式の部分を重点的に確認
    • ヘッダー行を正確に識別
    • 空白行や小計行は除外

出力形式

json
{
  "帳票種別": "請求書",
  "概要": "2024年3月分システム開発費用",
  "発行者": "株式会社サンプル",
  "発行日": "2024-03-31",
  "合計(消費税抜き)": "500000",
  "消費税": "50000",
  "明細": [
    {
      "品名": "システム開発費(3月分)",
      "数量": "1",
      "単価": "300000",
      "金額": "300000"
    },
    {
      "品名": "保守サポート費(3月分)",
      "数量": "1",
      "単価": "200000",
      "金額": "200000"
    }
  ]
}

抽出時の注意事項

全般的な注意

  1. OCRエラーへの対処
    • 数字の0(ゼロ)とO(オー)の混同に注意
    • 1(イチ)とl(エル)、I(アイ)の混同に注意
    • カンマと小数点の混同に注意
  2. レイアウトの多様性
    • 縦書き・横書きの両方に対応
    • 表の向きや配置の違いを考慮
    • 複数ページにまたがる場合の処理
  3. データの整合性確認
    • 明細の合計と小計が一致するか確認
    • 消費税率が妥当か確認(8%または10%)
    • 日付の妥当性を確認

エラー処理

  • 必須項目が見つからない場合は、その旨を明記
  • 読み取り不能な部分は "不明" または null とする
  • 推測で補完した場合は、その旨をコメントで記載

使用例

入力

請求書の画像またはテキストデータ

処理手順

  1. 帳票種別を確認し、請求書であることを確認
  2. ヘッダー情報(発行者、発行日、概要)を抽出
  3. 明細部分を特定し、各行を解析
  4. 合計金額と消費税を抽出
  5. データの整合性を確認
  6. JSON形式で出力

出力の検証

  • すべての必須フィールドが埋まっているか
  • 数値の形式が統一されているか
  • 日付形式が正しいか
  • JSONとして有効な形式か
Content is user-generated and unverified.
    請求書情報抽出プロンプト | Claude