对一组tweet进行主成分分析。
最佳答案
-
Thomas_Ott RapidMiner认证分析师,RapidMiner认证专家,成员职位:1761年独角兽
如果不看全文,很难弄清楚他们到底做了什么。
我怀疑它一定是这样的:
<?xml version="1.0" encoding="UTF-8"?> <过程version = " 7.2.003”>
> <上下文
<输入/ >
<输出/ >
<宏/ >
> < /上下文
<过程扩展= " true " >
< /操作符>
< /操作符>
<列出关键= " function_descriptions " >
< / >列表
< /操作符>
< /操作符>
< /操作符>
<列出关键= " function_descriptions " >
< / >列表
< /操作符>
<列出关键= " set_additional_roles " / >
< /操作符>
< /操作符>
<列出关键= " specify_weights " / >
<过程扩展= " true " >
> < /过程
< /操作符>
> < /过程
< /操作符>
> < /过程也就是说,我对他们的模型100%的准确性持谨慎态度。
0
答案
你能提供这是在哪里做的链接吗?我最初的想法是通过使用TFIDF或其他东西将文本转换为Word vector。
你好!在这里是一篇声称可以做到的文章。如果我不能提供整篇文章,我很抱歉,但引用具体的部分…
“我们将中国的新闻报道从菲律宾的新闻报道中分离出来,然后从两组独立的词汇中提取主成分。这个过程直观上类似于主成分分析对量化变量的处理。”(Montiel et al., 2014)
谢谢你!我会试着弄明白这个。