Durchführung von Topic-Modell-Analysen

Christian Papilloud,Alexander Hinneburg

user-613ea93de55422cecdace10f(2018)

引用 0|浏览23
暂无评分
摘要
Die Durchfuhrung einer Topic-Modell-Analyse setzt die Schatzung und Einstellung von Parametern voraus, die das Topic-Modell optimieren, d.h. die dazu fuhren, dass das Topic-Modell moglichst gut auf die Wortmengen der Dokumente passt. Dieses Schatzen und Optimieren der Parameter ist als das beschrieben, was in der Literatur das Lernen von Topic-Modellen genannt wird. Das Lernen von Topic-Modellen stutzt sich auf Theorien der Statistik und der linearen Algebra. Die im Gebiet des maschinellen Lernens entwickelten Bayesschen Modelle wie Latent Dirichlet Allocation (LDA) und die in der linearen Algebra entwickelte Non-Negative-Matrix-Factorization (NMF) wurden zu ahnlichen Zwecken als Topic-Modelle vorgeschlagen. Beide Topic-Modelle werden heute benutzt werden, um Textquellen zu analysieren. Schlieslich behandeln wir die Fragen der Evaluation und der Interpretation von Topic-Modellen. Wir beschreiben ebenfalls drei mogliche Umsetzungen des Analyseprozesses durch Skript-Programmierung mit R und python, und mittels der interaktiven Web-Applikation TopicExplorer.
更多
查看译文
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要