我对H2ORandomForestEstimator模型的输出感到困惑。

因此,我的任务是预测房价,这是一项回归任务。

训练:

model = H2ORandomForestEstimator(ntrees=100, max_depth=20,mtries=-1, seed=42, score_each_iteration=True) model.train(x=features, y=target, training_frame=train_frame) 

数据具有约80个功能

我预测包含1495行(也称为数据点)的测试数据

log_predict = model.predict(test_frame) 

但是log_predict的形状是(1459,656),这确实令人困惑,这是输出的屏幕截图: picture (对不起,我还不能嵌入图片...)

656是什么意思? 是否有任何方便的方法可以将其转换为(1459,1)数组?

提前致谢!

===============>>#1 票数:0

我认为您已经将您的response列转换为factor列(我不确定,因为您在那里没有所有代码),因此它在进行分类而不是回归。 预测输出的屏幕快照显示了多类输出(带有655个“类”)。

也有可能您在CSV文件中的数字周围加上了引号,而H2O则将其解释为类别而不是数字。 您将需要将响应列转换回数字,然后重新训练模型:

train_frame[target] = train_frame[target].asnumeric() 

  ask by EpicJ translate from so

本文未有回复,本站智能推荐: