Excel管理表で表記ゆれの重複を見逃す原因。正規化と補助キーで名寄せ精度を上げる手順

Excel管理表で表記ゆれの重複を見逃す原因。正規化と補助キーで名寄せ精度を上げる手順 のアイキャッチ画像 入力・データ品質

導入

顧客管理や請求管理のExcel管理表で、「株式会社山田商事」「(株)山田商事」「山田商事」「山田商事㈱」が、それぞれ別の行として登録されていませんか。完全一致だけで重複判定していると、こうした表記ゆれは全部別物として残ってしまいます。

これは入力者がだらしないわけではなく、業務として「株式会社の有無」「全角半角」「略称」をどう扱うかを決めていないことが原因です。この記事では、Excel 管理表 表記ゆれを正規化し、名寄せ精度を上げる手順を紹介します。

この記事で解決すること

項目 内容
解決する課題 株式会社の有無や略称で重複を見逃す
主な原因 完全一致だけで重複判定している
解決方法 名称正規化や補助キーを使って候補を探す
対象業務 顧客管理・契約管理・請求管理
対象人数 5〜100人
難易度 ★★★☆☆
作成時間 60分
効果 名寄せ精度を上げられる
向かないケース 表記ゆれがほぼない表

この記事は、完全一致だけに頼らず、正規化した補助キーで重複を見つけ出す内容です。

なぜその管理表はうまくいかないのか

表記ゆれの重複が残る管理表には、共通する特徴があります。

  • 顧客名を「正式名称」のまま重複判定に使っている
  • 「株式会社」の有無、全角半角、英数字、スペースの違いを統一していない
  • 略称や旧名称の対応表がない
  • 重複判定が完全一致のCOUNTIFのみ
  • 「読み方が同じ」「ふりがなが同じ」をチェックする手段がない

担当者は「正式名称で書く」というルールを守っているつもりです。ただ、業務として「正式名称とは何か」を統一していないので、解釈にズレが出ます。

改善手順

ステップ1. 正規化ルールを決める

「株式会社/㈱/(株)は削除する」「英字は半角に統一」「スペースは削除」など、表記を揃えるルールを決めます。複雑にしすぎず、3〜5個のルールに絞ります。

ステップ2. 正規化キー列を作る

顧客名の隣に「正規化名称」列を作り、SUBSTITUTE・TRIM・ASC・JIS・UPPERなどの関数を組み合わせて、ルール通りに変換した値を出力します。例:=ASC(SUBSTITUTE(SUBSTITUTE(SUBSTITUTE(TRIM(A2),"株式会社",""),"㈱",""),"(株)",""))

ステップ3. ふりがな列を追加する

PHONETIC関数で読み方を取り出した列を追加します。読みは漢字違いの同名社や、漢字をひらがな混じりで書くケースを拾うのに有効です。

ステップ4. 正規化キーで重複判定する

正規化名称列でCOUNTIFを使い、重複候補列を作ります。「正規化名称が一致する行が複数ある」場合に重複候補としてフラグを立てます。

ステップ5. 名寄せ候補の確認手順を決める

正規化キーで一致する行は「同一の可能性が高い」というだけで、確定ではありません。営業担当に確認する、別の情報(所在地・電話番号)とつき合わせるなど、判断手順を決めます。

ステップ6. 旧名称・略称の対応表を作る

会社名が変わった場合や、社内で略称で呼ばれている顧客のために、対応表(マスタ)を別シートで持ちます。新規登録時に対応表を参照するルールにすると、表記ゆれが減ります。

Before / After

観点 Before After
課題 表記ゆれで重複を見逃す 正規化キーで同一視
原因 完全一致のみで判定 正規化とふりがなで判定
運用 正式名称の解釈がバラバラ ルール通りに正規化
確認 完全一致行だけ確認 正規化一致を確認
効果 名寄せ漏れが残る 名寄せ精度を上げられる

正規化キーを入れるだけで、これまで見逃していた重複の多くが浮かび上がります。

実務での注意点

  • 表記ゆれがほぼない表(コードベース管理など)には、この仕組みは不要です
  • 正規化ルールを複雑にしすぎると、関数が読みにくくなり保守が難しい
  • ふりがな(PHONETIC)はExcelが自動付与した読みなので、誤読も発生する
  • 過去の名寄せ判断(同一・別人)は履歴として残しておく
  • 正規化キーは「重複検出のための補助」として使い、正式名称は別に保つ

最初から完璧な名寄せを目指さず、株式会社の有無と全角半角の正規化だけでも、表記ゆれの大半は拾えます。

Web化・スプレッドシート化との関係

Excel改善で足りる場合

利用者が5〜100人で、件数が数千件程度なら、Excelの関数で正規化キーとふりがな列を作るだけで十分対応できます。設定後は、新規登録時に自動的に正規化された値が出るため、運用負荷は増えません。

スプレッドシート化・Web化を考える場合

件数が数万件規模、または複数システムをまたいだ名寄せが必要なケースでは、スプレッドシートやWebツール、名寄せ専用サービスとの連携を検討する余地があります。住所や電話番号も含めた多軸での名寄せが可能になります。

ツールを変える前に、正規化ルールと旧名称対応表を整えておくと、移行先でも同じ判定が再現できます。

まとめ

Excel管理表で表記ゆれの重複が見逃されるのは、完全一致だけで判定しているためです。正規化キーとふりがな・対応表を組み合わせれば、名寄せ精度を上げられ、顧客マスタの一意性を保ちやすくなります。

タイトルとURLをコピーしました