过程帮助:相关和回归
你好!
我有以下数据(74观察),并试图确定过程和经营者进行探索性分析(相关和回归)总统的政党关系和这种消费品的生产者价格指数值之间的关系,这是每年平均。我也有相同年份的季度和月度PPI值,将使用相同的过程进行评估,希望获得更显着的静态值。
-此外,如何确定哪位总统在其任期内以及哪一年PPI +/-变化最大(假设我使用月度PPI值)?
年数(就职后) | 总统 | 聚会,派对 | PPI观测日期 | PPI_YrAvg |
1947 | 哈里·s·杜鲁门 | 民主党人 | 1/1/1947 | 22.5 |
1948 | 哈里·s·杜鲁门 | 民主党人 | 1/1/1948 | 25.5 |
1949 | 哈里·s·杜鲁门 | 民主党人 | 1/1/1949 | 27.4 |
1950 | 哈里·s·杜鲁门 | 民主党人 | 1/1/1950 | 28.4 |
1951 | 哈里·s·杜鲁门 | 民主党人 | 1/1/1951 | 33.2 |
1952 | 哈里·s·杜鲁门 | 民主党人 | 1/1/1952 | 32.1 |
1953 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1953 | 31.9 |
1954 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1954 | 31.9 |
1955 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1955 | 33.6 |
1956 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1956 | 35.7 |
1957 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1957 | 36.5 |
1958 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1958 | 36.5 |
1959 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1959 | 35.7 |
1960 | 德怀特·d·艾森豪威尔 | 共和党人 | 1/1/1960 | 35.5 |
1961 | 约翰·f·肯尼迪 | 民主党人 | 1/1/1961 | 37.5 |
1962 | 约翰·f·肯尼迪 | 民主党人 | 1/1/1962 | 37.5 |
1963 | 林登·约翰逊 | 民主党人 | 1/1/1963 | 37.6 |
1964 | 林登·约翰逊 | 民主党人 | 1/1/1964 | 37.9 |
1965 | 林登·约翰逊 | 民主党人 | 1/1/1965 | 39.5 |
1966 | 林登·约翰逊 | 民主党人 | 1/1/1966 | 39.5 |
1967 | 林登·约翰逊 | 民主党人 | 1/1/1967 | 39.4 |
1968 | 林登·约翰逊 | 民主党人 | 1/1/1968 | 40.9 |
1969 | 理查德·尼克松 | 共和党人 | 1/1/1969 | 42.2 |
1970 | 理查德·尼克松 | 共和党人 | 1/1/1970 | 46.2 |
1971 | 理查德·尼克松 | 共和党人 | 1/1/1971 | 47.4 |
1972 | 理查德·尼克松 | 共和党人 | 1/1/1972 | 48.4 |
1973 | 理查德·尼克松 | 共和党人 | 1/1/1973 | 49.2 |
1974 | 杰拉尔德·福特 | 共和党人 | 1/1/1974 | 53.2 |
1975 | 杰拉尔德·福特 | 共和党人 | 1/1/1975 | 59.7 |
1976 | 杰拉尔德·福特 | 共和党人 | 1/1/1976 | 62.3 |
1977 | 吉米•卡特 | 民主党人 | 1/1/1977 | 67.5 |
1978 | 吉米•卡特 | 民主党人 | 1/1/1978 | 72.8 |
1979 | 吉米•卡特 | 民主党人 | 1/1/1979 | 80.5 |
1980 | 吉米•卡特 | 民主党人 | 1/1/1980 | 88.7 |
1981 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1981 | 96.9 |
1982 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1982 | 100.0 |
1983 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1983 | 110.0 |
1984 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1984 | 115.9 |
1985 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 来 | 123.5 |
1986 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1986 | 126.3 |
1987 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1987 | 125.0 |
1988 | 罗纳德•里根(Ronald Reagan) | 共和党人 | 1/1/1988 | 130.2 |
1989 | 乔治。布什 | 共和党人 | 1/1/1989 | 136.4 |
1990 | 乔治。布什 | 共和党人 | 1/1/1990 | 133.4 |
1991 | 乔治。布什 | 共和党人 | 1/1/1991 | 138.9 |
1992 | 乔治。布什 | 共和党人 | 1/1/1992 | 138.3 |
1993 | 比尔。克林顿 | 民主党人 | 1/1/1993 | 139.5 |
1994 | 比尔。克林顿 | 民主党人 | 1/1/1994 | 140.3 |
1995 | 比尔。克林顿 | 民主党人 | 1/1/1995 | 144.3 |
1996 | 比尔。克林顿 | 民主党人 | 1/1/1996 | 143.1 |
1997 | 比尔。克林顿 | 民主党人 | 1/1/1997 | 142.8 |
1998 | 比尔。克林顿 | 民主党人 | 1/1/1998 | 144.1 |
1999 | 比尔。克林顿 | 民主党人 | 1/1/1999 | 144.2 |
2000 | 比尔。克林顿 | 民主党人 | 开户 | 144.9 |
2001 | 乔治·w·布什 | 共和党人 | 1/1/2001 | 143.9 |
2002 | 乔治·w·布什 | 共和党人 | 1/1/2002 | 144.3 |
2003 | 乔治·w·布什 | 共和党人 | 1/1/2003 | 145.2 |
2004 | 乔治·w·布什 | 共和党人 | 1/1/2004 | 148.9 |
2005 | 乔治·w·布什 | 共和党人 | 日期 | 162.5 |
2006 | 乔治·w·布什 | 共和党人 | 1/1/2006 | 171.5 |
2007 | 乔治·w·布什 | 共和党人 | 1/1/2007 | 198.7 |
2008 | 乔治·w·布什 | 共和党人 | 1/1/2008 | 250.3 |
2009 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2009 | 248.9 |
2010 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2010 | 261.6 |
2011 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2011 | 297.9 |
2012 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2012 | 304.5 |
2013 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2013 | 315.4 |
2014 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2014 | 323.4 |
2015 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2015 | 338.6 |
2016 | 巴拉克•奥巴马(Barack Obama) | 民主党人 | 1/1/2016 | 345.5 |
2017 | 唐纳德·特朗普 | 共和党人 | 1/1/2017 | 341.6 |
2018 | 唐纳德·特朗普 | 共和党人 | 1/1/2018 | 358.3 |
2019 | 唐纳德·特朗普 | 共和党人 | 1/1/2019 | 362.2 |
2020 | 唐纳德·特朗普 | 共和党人 | 1/1/2020 | 369.9 |
这是我在没有指导的情况下所能做到的。
请友好,我刚刚开始探索rapidminer在学校,我真的很感激任何帮助或建议,谢谢!
0
答案
我首先计算PPI的年变化。我假设它的公式是PPI_YrAvg / previous(PPI_YrAvg) - 1.您可以在Excel或RapidMiner中使用区分或延迟和生成属性来完成此操作。
下面是对Generate Attributes的介绍:https://academy.www.turtlecreekpls.com/learn/video/generate-attributes
还有两个视频是关于时间序列计算的https://academy.www.turtlecreekpls.com/catalog?query=differentiate
有了新列YearlyChange后,可以很容易地使用Aggregate按政党分组,并计算年变化的平均值、最小值和最大值。
问候,
Balazs