学会発表テキストマイニングによる研究動向分析
背景・課題
医療研究者や製薬関係者の方々にとって、学会発表は最新の研究内容をいち早く把握するための重要な情報源です。
しかし、発表される情報量が膨大であるため、多忙な日常業務の中で全体を効率的に把握し、そこから新たな知見を発見することは容易ではありませんでした。
keyboard_arrow_down
ご提案・支援内容
お客様の課題に対し、テキストマイニングの手法を用いた情報整理・分析をご提案しました。具体的には、学会発表のタイトル等に含まれる単語の頻度や関連性を分析し、情報全体の俯瞰とトピックの推定を行いました。
分析には以下の手法を組み合わせ、多角的な視点から情報にアプローチしました。
- 共起ネットワーク分析: 単語間の関連性を視覚的に把握し、結びつきの強い単語群を特定します。
- 対応分析(コレスポンデンス分析): 単語間の関係性を散布図で表現し、特徴的な単語やグループを特定します。特定の文書群における使用頻度が高い特徴的な語は、原点から離れた位置に配置される傾向があるため、特徴的な語の把握に役立ちます。
- クラスター分析: 文書を内容に基づいて分類し、全体の構造を把握します。
- トピックモデル(LDA: Latent Dirichlet Allocation): 文書が複数の潜在的なトピックから確率的に構成されると仮定し、主要なトピックとその関連語を推定します。複数年度のデータを組み合わせることで、ホットトピック(上昇傾向にあるトピック)の特定も可能です。


keyboard_arrow_down
成果・効果
- 膨大な学会発表情報の効率的な整理と全体像の把握: テキストマイニングによる可視化で、多量の発表タイトルから主要なキーワードやトピックを短時間で把握できるようになりました。
- 新たな研究トレンドやホットトピックの発見: 各分析手法を組み合わせることで、注目すべき研究分野や潜在的なトピックを効率的に特定でき、研究戦略の立案に貢献しました。
- 関心のある情報の深掘り: 特定のキーワードやトピックに関する関連語や関連文書を明確に把握できるようになり、効率的な情報探索が可能になりました。
お客様の声
これまでなんとなく把握していた研究トレンドが、データに基づく分析によって明確に可視化され、非常に納得感がありました。
効率的に全体のトレンドを掴むことができるようになり、今後の担当領域の研究の方向性を考える上で大変役立っています。