テキストマイニングをエクセルで行う方法と関数について解説!

 2023.03.23  2023.05.19

ビッグデータの活用が進みデータ分析が重要視されている現在、テキストマイニングの活用を検討している企業も多いのではないでしょうか。本記事では、オフィスで普段から使用しているエクセルを使ってテキストマイニングを行う方法を解説します。

テキストマイニングの意味とメリット

テキストマイニングとは、膨大な量のテキストデータから情報を収集する方法のことで、データマイニングの一種です。データマイニングとは、膨大な量のデータから情報を抽出・収集する方法全般のことであり、ビッグデータを有効活用する手法として昨今注目を集めています。

テキストマイニングには、文字列を単語に分解してから有用なテキスト情報だけを抽出する「自然言語処理」と呼ばれる手法が用いられています。インターネット上の口コミやSNS、WEBページの問い合わせ、コールセンターのデータといった情報を収集・分析することで、全体像や特徴を把握することが可能です。こうして得た分析データは、顧客の要望に合った新規商品の開発や商品の改善などに活かせます。

テキストマイニングでは、膨大な量のデータを効率的に分析することが可能です。人の手で分析する場合、データ量が多いほど膨大な時間がかかります。しかし、ツールを活用してテキストマイニングを行うと、短時間で大量のデータを分析できるため、効率化が図れ、従業員の負担も軽減されます。他の業務にリソースを回せることから生産性が向上し、ツールを利用すれば分析のための外注費用をなくせるなどコストカットも期待できます。

「感動もの」のコンタクトセンター応対品質 UI刷新で実現 ベルシステム24のコンサル力で 飛躍的にCXを高める
コンタクトセンター向けAI音声認識ソリューション AmiVoice Communication Suite

テキストマイニングをエクセルで行う方法

テキストマイニングは、基本的な内容なら専用のツールではなくエクセルを使って行うことが可能です。エクセルでデータを処理する前には、データを収集して単語に分割しなければなりません。その後、エクセルで各単語を集計し、ワードクラウドを作成する方法で効率的にテキストマイニングが実施できます。

データを集めて単語ごとに分ける

専用ツールを使用せずにエクセルでテキストマイニングを行う場合には、事前に準備が必要です。エクセルでは、文章のままデータ分析を行えないため、単語ごとに分けなければなりません。文章を意味のある単語に分解することを「形態素解析」と呼びます。形態素解析は、分析したいデータを収集してから、「MeCab」や「Janome」などの形態素解析エンジンを使って単語同士の区切り部分に空白を挿入する「分かち書き」の方法で行えます。

文章を単語単位に分割したあとは、同様の意味を持つ単語の表記統一が必要です。「色」や「カラー」など、同じ意味でも単語が異なる表記ゆれを修正すると、分析時の精度が高まります。

単語を集計する

文章を単語単位に分割したら、各単語がどれだけ使用されているか集計をとります。エクセルで特定の単語の数を数える場合には、COUNTIF関数を使用すると簡単です。COUNTIF関数の詳細は後述します。

単語数が多いデータや容量の大きいデータを使用する際は、エクセル関数の結果がうまく反映されないケースもあるため注意が必要です。また、さまざまな表現が含まれているデータの場合もエクセルでの集計は難しくなります。エクセルで集計がうまくいかない場合には、連動可能な集計ソフトも使用しましょう。

ワードクラウドを作成する

単語の集計ができたあとは、ワードクラウドを作成します。ワードクラウドとは、単語の出現回数に応じて、文字の大きさや色を変えて表示する手法です。ワードクラウドを使うと、視覚的に単語の出現頻度を確認でき、把握しやすくなります。インターネット上で利用できる無料ツールを使うと、簡単にワードクラウドの作成が可能です。

エクセルでは主に3つの関数を使用する

エクセルでテキストマイニングを行う際には、主に3つの関数を使用します。「COUNTIF関数」「SUM関数」「INDEX関数」を使用すると、手作業では難しい集計処理を簡単に行えます。

COUNTIF関数

COUNTIF関数は、「=COUNTIF(範囲,検索条件)」という式で使用する関数です。調べたい単語と検索する範囲を設定すると、指定範囲のなかで条件にあったセルの個数をカウントしてくれます。アンケートなどを行った際の画一的な回答を集計する場合などによく用いられます。

例えば、検索範囲が「B列の2行目から100行目」、検索する単語が「男性」とした場合、B列の2行目から100行目のなかに「男性」が何個あるかを集計できます。集計結果を出したいセルに「=COUNTIF(B2:B100,”男性”)」と入力すると、範囲内の「男性」の数が表示されます。

「”男性”」などの単語を直接入力せずに、指定したセルを参照し、そのセルと同じ言葉を集計することも可能です。複数単語を集計する際には、複数のセルにCOUNTIF関数を入力して単語ごとの集計を出します。

「B2:B100」の範囲で他の単語も調べたい場合には、「$」を使用して範囲を固定すると便利です。「=COUNTIF($B$2:$B$100,”単語名”)」と入力してからその下のセルにコピーした場合、コピー後に検索範囲が下にずれてしまうことはありません。

SUM関数

SUM関数は、「=SUM(引数)」の式を使い、指定した範囲の合計を出す関数です。COUNTIF関数と組み合わせるケースが多く、COUNTIF関数で集計した各単語の数の合計を出す場合などに使われます。

例えば、COUNTIF関数で集計した値がそれぞれC1からC20までのセルに出力されている場合には、「=SUM(C1:C20)」と入力するとCOUNTIF関数で集計された数値の合計が表示されます。エクセルの関数は、複数を組み合わせて使うとより便利に集計することが可能です。

INDEX関数

INDEX関数は、「=INDEX(範囲,行番号,列番号,領域番号)」と入力して使用する関数です。集計や合計の数値を返す関数とは違い、指定した行と列が交差する位置にあるセルの値を返します。テキストマイニングでは、SUM関数と組み合わせて使います。

列番号と領域番号は、不要な場合には省略が可能です。領域番号は、「範囲」が(A1:D6,E1:E3)などの複数選択領域となっている場合に、何番目の範囲を使用するかを指定する番号です。

例えば、1行目がタイトル行、A列に商品名、B列に価格、C列に個数が記載されている10商品の表があるとします。そこから、INDEX関数を使ってセルの場所を指定すると、その場所の値を表示させることが可能です。

A2からC11までの範囲における、6行目とB列が交差するセルの値を表示したい場合、「=INDEX(A2:C11, 6, 2)」と入力します。該当箇所に「100円」が入力されていた場合には、セルに「100円」と表示されます。

SUM関数と組み合わせて使用する場合は、「=SUM(セル:INDEX(範囲,行番号,列番号,領域番号))」と入力します。これにより、指定したセルからINDEX関数で指定した場所までの合計を表示することが可能です。SUM関数と組み合わせてC列(C2からC11)の合計を出す場合には、「=SUM(C2:INDEX(A2:C11, 10, 3))」と入力します。

テキストマイニングをエクセルで行う際の注意点

テキストマイニングをエクセルで行う際には、データを集計するために関数を入力したり、集計ツールなどを使用したりしなければなりません。集計する前にも、データの準備などでさまざまな手間がかかります。

さらに、エクセルの分析ではシンプルなことしかできません。専用のツールに比べて分析方法が限られることから、希望するデータ分析ができないケースもあります。

テキストマイニングは、専用サービスを導入するとより効率的に行えます。「ベルシステム24」が提供する「音声認識・分析ソリューション」なら、コンタクトセンターにおける顧客とのやり取りをシステムがテキストデータに変換し、分析への活用が可能です。コンタクトセンターのさまざまな課題解決をサポートしてくれるため、生産性の向上が期待できます。

ベルシステム24が提供する音声認識・分析ソリューションの詳細を知りたい場合は、以下のリンクをご参照ください。
https://www.cloud-contactcenter.jp/solution/voice-recognition-analysis

まとめ

テキストマイニングは、膨大な量のデータを効率的に分析する方法です。エクセルでも、関数や無料ツールを活用すると、予算をかけずにある程度までのデータ分析が行えます。

ただし、エクセルでは分析する際に手間がかかり、分析できる内容にも限界があります。専用のツールを導入した場合は、事前準備などに時間や手間をかけず、効率的にデータ収集・分析を行うことが可能です。業務効率化や生産性の向上につながるデータ分析を行うために、コストや手間、時間のバランスを考慮して自社に最適な方法を選択しましょう。

コンタクトセンターにおけるテキストマイニングの重要性とは?

RECENT POST「VOC/音声認識」の最新記事


VOC/音声認識

おすすめのテキストマイニングツール10選! 選び方のポイントも解説

VOC/音声認識

テキストマイニングツールの選び方! 無料と有料の違いと価格を解説!

VOC/音声認識

テキストマイニングの手法をわかりやすく解説

VOC/音声認識

テキストマイニングとは?活用するポイントや分析手法を解説

テキストマイニングをエクセルで行う方法と関数について解説!
BellCloud+ご紹介資料
コンタクトセンターの最新トレンドまるわかりガイド ~今、おさえておきたいコンタクトセンターの最新トレンドと テクノロジーとは?~

RECENT POST 最新記事

ブログ無料購読のご案内

RANKING人気記事ランキング

AUTHOR執筆者

OFFICIAL SUPPORTER