テキストデータ分析によるリスクの検知・評価・モニタリング

テキストデータ分析によるリスクの検知・評価・モニタリング
テキストデータ分析によるリスクの検知・評価・モニタリング

Body

~テキストデータは宝の山、AIで宝の山を掘りつくす。 増大するテキスト情報をNLP(自然言語処理)で分析し新たな気づきを得る~



デジタライゼーションを背景として、システム化、ペーパレス化が進展し、企業内のデータは飛躍的に増加しています。このデータをいかに活用していくのか、広く分析対象とするかがこれまで以上に重要となっています。

従来のデータ分析では、数値データを対象としていました。専用のシステムで記録・保存されている商品の売買、従業員の経費や勤務時間、財務会計などの数値データを対象とすることが多く、これらの活用は組織により濃淡があれども一定程度行われてきました。しかし、企業内には数値データの他にも、契約書、管理日報、経営報告資料、従業員アンケートなどのテキスト情報をもつデータが多数存在します。これらの中には、組織、従業員、取引先の現状・課題・将来見込みなどに関して数値データには反映されないような重要な情報が含まれていました。しかし、日々蓄積されているテキストデータの中に重要なリスク情報が埋もれているかもしれないのに、全く分析対象となっていなかったり、ごく一部のサンプルをチェックするだけであったりすることが多く、せっかくの情報資産が宝の持ち腐れとなっています。

しかし、近年ではAIやNLP(自然言語処理:Natural Language Processing)といった先端的な技術とそれを組み込んだ分析ツールによって、膨大なテキストデータに登場する無数の単語や文章を整理・分類し、文脈を考慮して類似度や関係性を計算し可視化することが可能となっています。例えば、異なる単語や文章がどれくらい似ているか(又は違っているか)を数値で表したり、売上や経費などの数値情報と同じように単語や文章を組織や従業員などの属性ごとに集計・比較したり、他の要因との関連性を分析したりできるということです。

これにより例えば以下のようなことが可能となります。

  • 利用禁止となっている特定の単語や言い回しだけでなく、それらに似た単語や言い回しも含めて、網羅的に識別できる
  • 過去に問題を起こした組織や社員に関する文書を分析して、特徴的に用いられているキーワードや文章表現を識別できる
  • リスクの高いキーワードや文章表現の頻出する組織・社員をグルーピングしたり、順位付けしたりすることができる

また、次のような効果が期待できます。

  • 効率的かつ網羅的にテキスト情報内のリスクを検知できる
  • 実施担当者による検知精度のばらつきがなくなる
  • 圧倒的な効率化を達成することできる
  • 数値データだけを見ていては気が付かない重要なリスク、新しいリスクを発見できる
  • 統制環境や企業文化といった曖昧な空気の中に潜んでいるリスクを見抜き、定量化・可視化することができる
  • 従来の定量的なデータ分析と組み合わせることで、リスク評価・リスク監視を高度化することができる

 

主なサービス

このようなテキストデータの活用を通して、プロティビティは以下を支援しています。

  • テキストデータの分析によるコンプライアンスリスク、不正リスクの識別

  • テキストデータの分析による統制環境、組織文化のリスク評価

  • 定性情報と定量情報を組み合わせたリスク評価の高度化

  • テキストデータ活用によるリスクモニタリング態勢の高度化



結果イメージ

 ① 文脈も考慮して類似単語・類似表現を抽出し、類似度を数値で可視化

NLP結果イメージ1

 

 ② 文脈テキスト中の単語の登場頻度や、単語と単語の関係性を可視化

NLP結果イメージ2

③ 組織や従業員のリスク度をランキング形式で可視化

NLP結果イメージ3