Contents
テキストマイニングとは?
テキストマイニングとは、 コンピュータが自然言語(日常生活において使われている言葉)を処理する 「自然言語処理」と呼ばれる解析手法を用いて、文章を単語(名詞、動詞、形容詞等)に分割し、それらの出現頻度や相関関係を分析することで、大量のテキストデータから企業にとって有益な情報を抽出することを目的とした分析手法です。
テキストマイニング自体をもっと詳しく知りたい方は、こちらのテキストマイニングの記事を参照してください。テキストマイニングのメリットや活用方法・活用事例を豊富に掲載してあります。
無料版と有料版の違い
テキストマイニングを実装できるツールには様々なものがありますが、大きく分けると無料で利用できるものと有料版のものが存在します。
有料版のテキストマイニングツールと比較すると、無料版のツールは機能が少なく、利用できる分析手法も限定的で、精度が劣っているものが多いです。
例えば、テキストを分割する性能の場合、有料ツールでは辞書機能が充実しており、分析に適した形でテキストを分割できます。それに対し、無料ツールでは機械的に単語を区切るだけで、実用性が高くありません。
テキストマイニングツールがどんな性能や機能なのかを体験する程度であったり、個人でちょっとした分析をする程度であれば無料版で十分対応できるケースが多いかと思われます。
しかし、本格的なマーケティングやコールセンター業務の効率化を目的として本格的に導入するのであれば、有料版でなければ対応が難しい場合もあるでしょう。導入する際はどのような用途で使用するのか、費用対効果も含めて入念に検討する必要があります。無料版と比較したときに挙げられる有料版の大きなメリットは、導入や運営時に公式のサポートが受けられる点、テキストマイニングしたデータの活用がしやすい点です。
現在、自社で行っている市場調査やリサーチでは物足りない、または結果が得にくいとお悩みであれば有料のテキストマイニングツールの利用を検討してみてください。適切なテキストマイニングを実施するには、有料版も視野に入れて検討することをおすすめします。
無料で利用できるテキストマイニングツール5選
まずは無料版を使ってみてから、有料版に課金する必要があるかどうかを判断したいという方も多いと思います。無料版を使ってみて、十分に使えて満足出来たらそれが一番ですから。そこで、この章ではおすすめの無料テキストマイニングツールを5つ紹介します。
AIテキストマイニング by ユーザーローカル
「AIテキストマイニング by ユーザーローカル」は、株式会社ユーザーローカルが提供している無料のテキストマイニングツールです。 ソフトウェアをPCにインストールする必要がなく、Web上でテキストを貼り付け、クリックするだけで手軽に分析可能です。無料ながらも、共起ネットワークや階層的クラスタリング、出現頻度スコア、ワードクラウド、2次元マップといった可視化機能も豊富です。
10,000文字までのテキストマイニングは、ユーザー登録なしで、無料で利用できます。
また、ユーザー登録をすれば100,000文字までテキストマイニングを実行可能となります。
テキストマイニングの他にも感情認識、自動要約、2つの文書比較などが無料で利用できます。
初めてテキストマイニングツールを利用する方でも操作がしやすく、テキストマイニングで「可視化」されるというのがどういうことなのかを体感しやすいため、まずは無料で試してみることをおすすめします。
KH Coder
「KH Coder」はオープンソース型の無料テキストマイニングツールで、PCにソフトウェアをインストールして利用します。
多変量解析により、テキスト内に頻発する言葉のグループや、同じ言葉を含むテキストのグループからテキストの特徴を解析できます。ソースコードが公開されているため、カスタマイズも可能です。その他の機能面に関しても、単語から元の文章を検索する機能や単純な集計や相関図など、テキストマイニングを行う上で必須な機能は揃っています。
KH Coderを利用するための詳細なチュートリアルがスライドで解説されているほか、動画でのセミナーも定期的に開催されています。テキストマイニング初心者でも、解説を参考にしながら進めていけるため安心して使えます。
ツールを使いこなすまでの学習コストが多少発生はしますが、無料でテキストマイニングを実行したい方にはおすすめのツールです。
MeCab
「MeCab」は、京都大学情報学研究科と日本電信電話株式会社コミュニケーション科学基礎研究所の共同プロジェクトを通して開発された、オープンソース型のテキストマイニングツールです。
名詞や動詞、接続詞など、文章を構成する最小単位の言葉に分ける形態素解析に利用でき、特定の単語や固有名詞などを分類するときに便利です。
統計ソフトR
「R」はオープンソース型の統計解析ソフトです。本来は統計データの分析・解析を行う用途として開発されましたが、テキストマイニングも実装できます。ただし、「R」は コマンドライン入力で扱うため操作が難しく、R言語 (プログラミング言語) の知識や統計学の知識も求められるため、初心者にとっては、難易度の高いツールとなっています。
Excel
少々手間は掛かりますが、Excelでも無料でテキストマイニングを実行することができます。予め形態素解析によって分解された文字列データを、Excelの条件分岐で数えて集計し、グラフ等で可視化するという手順で行うことができます。
ステップとしてまとめると、次のようなフローになります。
- 文章を単語ごとに分解する「形態要素分析」を行う
- COUNTIF関数を利用し単語の登場頻度を集計する
- 単語の登場頻度を文字の大きさや色で表現する「ワードクラウド」で図示
費用をかけずには実施できますが、他の無料ツールと比べて少し手間がかかる点、テキストマイニングできる範囲や精度が劣る点などがデメリットとして挙げられます。テキストマイニングとは何なのかを手軽に学習したい場合には、選択肢として持っておくと良いでしょう。
参考:おすすめ有料テキストマイニングツール
本記事はあくまで、無料のテキストマイニングツール紹介がテーマですので、「無料のテキストマイニングツールでは物足りないな」とか、「有料のテキストマイニングツールだとどういう機能が備わっているのだろう」という方向けの比較参考という位置づけとして、有料テキストマイニングツールも紹介しておきます。
見える化エンジン
見える化エンジンは、株式会社プラスアルファ・コンサルティングが提供するクラウド型とインストール型と選べるテキストマイニングツールです。
豊富なサポートに加え、扱いやすいインターフェイスであり、分析や統計の知識がない方でも可視化しやすいが特徴です。テキストマイニングの基本的な分析やデータ解析だけでなく、「仮説検証型分析機能」や「ニーズ発見型分析機能」、「改善促進機能」、「Webアンケート機能」、「データ収集機能」など、分析前後に必要な工程もアシストしてくれる機能が充実しており、テキストマイニング初心者でも目標達成のためのPDCAサイクルを円滑に回すことができるでしょう。
Text Voice
TextVoiceは、リサーチ会社であるマイボイスコム株式会社が提供するSaaS型テキストマイニングツールです。
インストール不要でネット環境のみで手軽に利用でき、データを取り込むだけで精度の高い分析が行える点や、UIが直感的で誰でも簡単にツール操作が可能といった点で高い評価を得ています。
その他の機能としては、頻出単語や共起語の集計機能や、属性ごとの特徴的な意見が簡単に見つけられる機能が搭載されています。
Text Mining Studio
Text Mining Studioは、株式会社NTTデータ数理システムの提供するWindowsOS向けのインストール型のテキストマイニングツールです。
Text Mining Studioはテキスト処理機能や分析機能の種類が豊富であり、入力したデータを扱いやすい形で出力、整形しやすいツールなので、個人でカスタマイズして細かく分析したい場合におすすめです。
Vext
Vextは、ベクスト株式会社が提供するクラウドでもインストールでも利用可能なテキストマイニングツールです。
予兆監視、文脈抽出、少数意見の抽出、自動要約、自動学習辞書など、他のツールよりもより直感的に可視化しやすい機能が豊富で、テキストマイニングツールとしての基本的な機能がワンランク上で取り揃えられています。
その中でも特に、会話分析を得意とし、コールセンターなどの音声データも活かしたい企業に向いています。
また、導入や運用の手厚いサポート、研修コースや分析コンサルティングもあるので、テキストマイニングのビジネス活用を絶対に成功させたい場合に最適です。
TRAINA
TRAINAは、株式会社野村総合研究所が提供するAI・情報ナビゲート、テキスト分析、音声認識・対話要約など、自然言語処理による総合的なソリューションサービスです。
その中のTRAINAテキストマイニングは、クラウドでもインストールでも利用可能なアプリケーションであり、情報やタスクの共有、SNSの分析や音声認識も可能なテキストマイニングツールと言えます。
特徴マップと呼ばれる間連図や頻出キーワードの検出、クロス分析や時系列分析など基本的なテキストマイニングの機能を備えています。センチメンタル分析である「ポジネガ分析」やキーワードの頻出によるアラートメールやヘッドライン通知など他にはない機能が豊富です。
業務プロセス全体の見直しも含めて、高度にテキストマイニングを導入したい場合にもってこいです。
知能QAシステム
知能QAシステムは、株式会社プライムスタイルの提供するツールです。
業務改善、顧客満足度向上の手助けを行います。既存のマニュアルやFAQリストを読み込ませることで、必要な知識にアクセス可能となるテキストマイニングシステムです。既存のリストを活用できるので、QAリストやシナリオを新たに設計する必要がないのも魅力です。
その他にも、チャットボットや検索エンジンにAI知能を提供したり、カスタマイズすることで、外部システムとの連携も可能となります。
無料テキストマイニングツールの選び方
これからテキストマイニングを行っていくのに際して、条件の合った最適なテキストマイニングツールを選択するための多数の観点を紹介していきます。
使いやすいツールかどうか (ツールのユーザーインターフェース)
どんなに優れた機能を持つツールでも、使いこなせなければ意味がありません。テキストマイニングは何度も試行錯誤を繰り返すため、担当者が扱いやすいユーザーインターフェースであるか実際に試してチェックしましょう。
例えば、テキストマイニングでデータを蓄積しているのに、インターフェイス上で機能がわかりにくい、または保存や変更、編集がわかりにくい状態のままテキストマイニングを続けていると、不本意なストレスが溜まり続けてしまいます。ストレスのせいでテキストマイニングを途中でやめてしまうのはもったいないことです。テキストマイニングツールを選ぶときはユーザビリティの高いもの、または自分が直感的に使いやすいと思ったものを使いましょう。
欲しい情報を欲しい形で抽出する機能がツールに搭載されているかどうか
テキストマイニングツールは多種多様で、同じ文章をインプットしたとしても、ツールやそれに備わっている分析手法によってアウトプットも様々です。 出現頻度の多いキーワード、同時に出現する共起語、共起語をネットワークで繋ぐ共起ネットワークなど、テキストマイニングが抽出できる情報は多岐にわたります。
ゆえに、導入前に「どんな情報を、どのように活用したいか」という分析の目的を明確にすることが非常に重要です。そのうえで、「その目的を達成するために必要なアウトプット機能が搭載されているか」という観点で、どんな分析結果が出力されるのか、どのような種類があるのかを必ずチェックし把握しましょう。
具体的には、 データの並べ替えや整理、項目の抽出、集計や図表化など、視覚的にわかりやすい状態で結果を出力できる機能が備わっているかどうか、出力されたデータを更に加工・アレンジすることで条件に合わせて任意の分析結果を出力できるのか、といったことを中心にチェックしていけばいいでしょう。
例えば、出現頻度の多いキーワードを抽出して集計する機能や、その結果を時系列に並べてグラフ化することで、トレンドを読み取ったり、プレゼンテーション用の資料作成に活用できます。
分析の精度が高いかどうか
テキストマイニングツールのもっとも基本的な機能は分析です。精度の高い製品を選ぶためには、以下の項目を評価軸として検討することがおすすめです。
- 処理速度は早いか
どのくらいの処理速度が出るかは、実際に触って見なければ分からないことが多いです。導入前に実際に使ってみてチェックすることを勧めます。 - 辞書機能は優れているか
テキストマイニングツールで高度で緻密な分析を実現するためには、辞書は必要不可欠な機能です。前もって表記揺れやひらがな、カタカナ、誤字脱字も含めて関連付けしておくことができるかどうか、専門用語や固有名詞の扱いを分析担当者個人で定義・カスタマイズできるかどうか、類義語を集約できるかどうか、などの機能をチェックしましょう。これらの機能はどれも、分析の精度を高めるために必要な機能です。
コメントする