预测模型+结果分析

asiddiqasiddiq 成员职位:25因素二世
亲爱的,
我有(24列,5100行)数据,包含以下属性[登革热数据(地区名称,性别,国籍,记录病例的星期和年份),空气质量数据(温度,湿度,降雨量和其他)],时间为2010年至2018年。我想创建一个预测模型,包括以下步骤:
1.降维
2.聚类
3.线性回归。
4.时间序列分析。

我尝试过简单的设计,但我得到了以下结果,我不确定我的工作是否正确!

最佳答案

答案

  • hbajpaihbajpai 成员职位:102独角兽
    @asiddiq

    你分享的结果显示了线性回归模型,它显示了变量的系数以及变量的重要性。既然你有登革热的数据,你是否试图根据时间序列预测来预测有多少人会因此而患病?我无法理解你关于降维和聚类的动机。你能详细说明一下吗?
    此外,从你的问题陈述来看,季节性和天气模式方面的特征工程将是开发预测模型的重要步骤。
    最好的
    Harshit
  • asiddiqasiddiq 成员职位:25因素二世
    我想预测未来的专利和未来的位置风险区域。将降维和聚类结合使用k-nearest method来替换缺失的值。清楚了吗?
登录注册置评。