膨大な文章データを解析し、有益な情報を取り出す技術および分析手法を「テキストマイニング」と呼びます。テキストマイニングによって得られた発見を商品開発やマーケティングに活かせば、顧客満足度や業績の向上が期待できます。そこで本記事では、テキストマイニングの概要や具体的な手法、実際の活用例について解説します。
テキストマイニングとは?
「テキストマイニング」とは、社内に蓄積された膨大な文章(テキスト)データを自然言語処理で解析し、新しい有益な情報を抽出するための手法のことです。自然言語処理のプロセスでは、文章を単語や文節に分解し、それらの使用回数や相関関係、時系列などを分析します。
テキストマイニングは、「データマイニング」から派生した分析方法の一種です。データマイニングとは、大量の構造化されたデータから有益な情報を取り出し、自動的に何らかのパターンや傾向を発見しようとする分析方法を意味します。
ちなみに「構造化データ」とは、数値をはじめ、データベース上で効率的に管理できるようあらかじめ整理されたデータのことです。しかし、データは必ずしも構造化されたものばかりではなく、文章や画像など、定型的には扱えないデータも存在します。そのようなデータを「非構造データ」といい、テキストマイニングが分析対象とする文章データもこれに含まれます。
文章データの例としては、コールセンターにおけるオペレーターと顧客のやり取りを記録した文章や、アンケート結果、SNSでの投稿、口コミサイトのレビューなど、さまざまなものがあります。これらの文章データには、製品・サービスに対する消費者の率直な意見や、市場の動向が埋もれており、企業にとっては宝の山も同然です。それらを集めて分析し、企業活動に活かせれば、新たな消費者ニーズの発見や顧客満足度の向上に役立てられるでしょう。
テキストマイニングの手法
テキストマイニングの具体的な手法としては、「センチメント分析」「対応分析」「主成分分析」の3種類があります。以下で、それぞれの手法について詳しく解説します。
センチメント分析
「センチメント分析」は、テキストマイニングの中でも代表的な手法です。文章から消費者や顧客の感情を分析し、購入した商品や利用したサービスに対してどういった感想をもったのかを予測するもので、別名「感情分析」とも呼ばれます。
センチメント分析では、Web上にある文章データの中でも「SNSに書き込まれた投稿」を分析対象とし、基本的には「肯定的」「否定的」「中立的」の3段階で評価します。たとえば、「おいしい」「おもしろい」といったキーワードを含む投稿文は「肯定的」、「まずい」「つまらない」といったキーワードを含む投稿は「否定的」、どちらとも判別がつかない投稿は「中立的」に分類されます。
ただし、同じ言葉でも、文脈や使用する年代によって異なる意味で用いられるケースがあります。そのような曖昧なニュアンスの言葉を分析する場合、はじめに人間が解釈したあと新しいシステムを実装するなどして、分析の精度を上げていく必要があります。
対応分析
「対応分析」は「コレスポンデンス分析」とも呼ばれ、行と列で構成される「クロス集計表」や、加工する前の「ローデータ」の特徴を図示し、項目同士の関係性を視覚的に把握できるようにする手法のことです。
分類項目と集計項目の多いデータについて、それぞれの項目の相関関係を一目でわかるようにしたいときに使用されており、実際にはマーケティング調査の分野でよく用いられています。たとえば、アンケート結果の分析ではクロス集計表がよく用いられますが、比較したい項目が多いと、結果を把握するのが困難です。そこでデータを散布図にすることで、項目ごとの関係性が可視化され、項目ごとの比較がしやすくなります。
主成分分析
「主成分分析」は、ビッグデータなど膨大な量のデータを分析するときに使用される手法です。項目(変数)が多すぎるデータは、そのままでは理解が難しく、分析の妨げになることがあります。そこで、多くのデータ項目をより少数の指標や、複数の変数を合体させた合成変数に置き換えて、分析を容易にし、結果を解釈しやすくするのです。実際のシーンでは、顧客満足度調査やブランドイメージの調査などで活用されています。
主成分分析は、データに含まれる情報を可能な限り損なわず、全体の雰囲気を可視化する際に便利です。しかし、この手法では一部のデータを切り捨てることになるため、結果にはすべてのデータが反映されるわけではありません。切り捨てた部分に重要なデータが含まれていることもあるため、項目の取捨選択を慎重に行う必要があります。
テキストマイニングの活用法
テキストマイニングは、企業のサービス品質の向上や、商品開発の現場など、幅広い分野で導入されています。中でも多く利用されている領域が、顧客アンケートの結果分析です。
従来、企業が実施したアンケート結果を集計・分析する際は、担当者が数値を手入力し、Excelなどのソフトウェアで管理することが一般的でした。テキストマイニングを使えば、非構造データのままでも集計・分析が可能になるため、わざわざ数値を手入力して構造化データに転換する必要がなく、入力作業にかかっていた手間と時間の大幅な削減が期待できます。さらに、自由回答欄に記入された文章も効率的に分析できるようになります。
また、「チャットボット」の精度向上にもテキストマイニングが活用されています。チャットボットとは、顧客が知りたい情報を入力すると、それに対応した回答を自動的に返してくれるプログラムのことです。近年では人材不足を解消する手段として、コールセンターや企業の問い合わせ窓口などで多く導入されています。
チャットボットが自動回答する内容は、事前に人間が用意した学習用データをベースとしたもので、その中から決められたルールに従って適切な回答が返されます。したがって、データベースに存在しない質問には対応できません。そこでテキストマイニングの技術を組み合わせれば、チャットボットが回答できなかった質問を解析できます。その結果をフィードバッグすることで、チャットボットのデータベースを充実させられるでしょう。
[SMART_CONTENT]
音声認識とテキストマイニングを活用した「BellCloud® for VOC」
テキストマイニングをコールセンター業務に取り入れるのであれば、ベルシステム24が提供する「BellCloud®︎ for VOC」を検討してみてはいかがでしょうか。これは、同社のクラウド型コールセンター基盤「BellCloud®︎」に、高性能な音声認識エンジン「AmiVoice」とテキストマイニング「VextMiner」を連携させたVOC活用ソリューションです。
顧客との通話を音声認識で処理してテキスト化し、不要語を削除したあとでテキストマイニングによる分析を行います。また、事前に登録したキーワードを音声認識で検知することで、FAQ検索などの資料ポップアップが立ち上がり、オペレーターの対応をアシストすることが可能です。ぜひ、応対品質の改善や通話時間の短縮、管理者の工数削減などにお役立てください。
まとめ
テキストマイニングは、すでに多くの企業で活用が進んでいます。たとえばコールセンター業務においては、通話内容をリアルタイムでテキスト化することで、後処理業務を効率化したり、対応品質の改善に役立てたりといった使い方がされています。コールセンター運営の効率化を実現する手段として、ぜひ導入を検討してみてはいかがでしょうか。
- カテゴリ:
- 課題・ソリューション