
デジタライゼーションを背景として、システム化、ペーパレス化が進展し、企業内のデータは飛躍的に増加しています。このデータをいかに活用していくのか、広く分析対象とするかがこれまで以上に重要となっています。
従来のデータ分析では、数値データを対象としていました。専用のシステムで記録・保存されている商品の売買、従業員の経費や勤務時間、財務会計などの数値データを対象とすることが多く、これらの活用は組織により濃淡があれども一定程度行われてきました。しかし、企業内には数値データの他にも、契約書、管理日報、経営報告資料、従業員アンケートなどのテキスト情報をもつデータが多数存在します。これらの中には、組織、従業員、取引先の現状・課題・将来見込みなどに関して数値データには反映されないような重要な情報が含まれていました。しかし、日々蓄積されているテキストデータの中に重要なリスク情報が埋もれているかもしれないのに、全く分析対象となっていなかったり、ごく一部のサンプルをチェックするだけであったりすることが多く、せっかくの情報資産が宝の持ち腐れとなっています。
しかし、近年ではAIやNLP(自然言語処理:Natural Language Processing)といった先端的な技術とそれを組み込んだ分析ツールによって、膨大なテキストデータに登場する無数の単語や文章を整理・分類し、文脈を考慮して類似度や関係性を計算し可視化することが可能となっています。例えば、異なる単語や文章がどれくらい似ているか(又は違っているか)を数値で表したり、売上や経費などの数値情報と同じように単語や文章を組織や従業員などの属性ごとに集計・比較したり、他の要因との関連性を分析したりできるということです。
これにより例えば以下のようなことが可能となります。
また、次のような効果が期待できます。
このようなテキストデータの活用を通して、プロティビティは以下を支援しています。