お客様からのアンケート結果や、営業担当者の日報を集計する際、選択式の回答はグラフにしやすいですが、自由記述欄の長い文章を分析するのは大変ですよね。
エクセルで数百件の文章を一つずつ読んで、「〇〇という意見が多い気がする」と感覚で報告書を作ってしまっていませんか。
この記事では、文章の中に隠れた傾向を客観的なデータとしてあぶり出すテキストマイニングの基礎と、無料で始める方法を解説します。
テキストマイニングとは何か
テキストマイニングとは、大量の文章データを単語ごとにバラバラに分解し、どの単語が何回使われているか、どの単語とどの単語が一緒に使われやすいかを分析する手法のことです。
たとえば、新商品のアンケートで美味しいという単語と高いという単語が同時に多く出現していれば、「味の評価は良いが、価格に不満を持っている層がいる」という仮説を立てることができます。
人間がすべての文章を読み込んで記憶するのは不可能ですが、ツールを使えばデータ前処理と同じように、一瞬で客観的な事実を取り出すことができます。
エクセルでは文章の分析ができない理由
エクセルの検索機能を使えば、特定のキーワードが含まれている文章を探し出すことは可能です。
しかし、「どんなキーワードが多く使われているか」をゼロから集計する機能は備わっていません。
日本語は「走る」「走った」などの活用形や、漢字とひらがなの表記ゆれがあるため、これらを同じ意味の単語として自動でまとめるには、専用の言語処理システムが必要になります。
無料のノーコードツールでテキスト分析に挑戦
テキストマイニングができる企業向けの有料ツールは非常に高額ですが、オープンソースの無料ETLツールであるKNIMEを使えば、追加費用なしで高度な文章分析が可能です。
KNIMEにはテキスト処理専用の拡張機能が用意されており、日本語の文章を単語に区切って数えるノードを追加することができます。
プログラミングの知識がない文系の事務職でも、条件抽出のノードや集計のノードを組み合わせることで、「不満を持っているお客様がよく使うキーワードランキング」などをボタン一つで出力できるようになります。
アンケートの自由記述は、顧客の生の声が詰まった宝の山です。感覚に頼らない客観的なデータ活用への第一歩として、ぜひテキストマイニングに挑戦してみてください。
